pandas-dev / pandas (Magyar)
Mi ez?
A pandas egy Python csomag, amely gyors, rugalmas és kifejezett adatstruktúrákat kínál úgy tervezték, hogy a “relációs” vagy “címkézett” adatokkal való munka könnyedén és intuitív módon történjen. Célja, hogy az alapvető magas szintű építőelem legyen a Python-ban való gyakorlati, valós adatok elemzésének elvetésére. Ezenkívül szélesebb célkitűzése, hogy a leghatékonyabb és legrugalmasabb nyílt forráskódú dataanalízis / manipulációs eszköz legyen, amely bármely nyelven elérhető. Már jó úton halad e cél felé.
Főbb jellemzők
Íme néhány olyan dolog, amit a pandák jól teljesítenek:
- egyszerű hiányzó adatok (
NaN
,NA
vagyNaT
) ábrázolás lebegőpontban valamint nem lebegőpontos adatok - Méret mutabilitás: oszlopok beilleszthetők és törölhetők a DataFrame és a magasabb dimenziós objektumokból
- Automatikus és explicit adat igazítás: az objektumokat kifejezetten egy címkekészlethez lehet igazítani , vagy a felhasználó egyszerűen kijelölheti a címkéket, és hagyhatja, hogy a
Series
,DataFrame
stb. automatikusan beállítsák az adatokat a számításokhoz - Erőteljes, rugalmas funkcionalitás szerinti csoportosítás az osztott, az alkalmazás és az összekapcsolás műveletek végrehajtására az adatkészleteken, mind az adatok összesítéséhez, mind átalakításához tárgyak
- Intelli nagy címkék alapú szeletelés, fantáziaindexelés és részhalmaz nagy adatkészletek
- Adatkészletek intuitív egyesítése és összekapcsolása
- Adatkészletek rugalmas átalakítása és elfordítása
- A tengelyek hierarchikus címkézése ( lehetséges többszörös címkék használata kullancsonként)
- Robusztus IO eszközök lapos fájlokból (CSV és tagolt), Excel fájlokból, adatbázisokból történő adatok betöltésére és az adatok ultragyors HDF5 formátumú mentésére / betöltésére
- Idősor-specifikus funkcionalitás: dátumtartomány-generálás és frekvenciakonverzió, mozgó ablak-statisztikák, dátumeltolás és késés
Hol szerezhetem meg
A forráskódot jelenleg tárolják GitHub: https://github.com/pandas-dev/pandas
A legújabb kiadás bináris telepítői a PythonPackage Index (PyPI) és a Conda oldalon érhetők el.
# condaconda install pandas
# or PyPIpip install pandas
Függőségek
- NumPy – Támogatja a nagy, többdimenziós tömböket, mátrixokat és magas szintű matematikákat cal függvények ezeken a tömbökön való működéshez
- python-dateutil – Erőteljes kiterjesztéseket biztosít a standard datetime modulhoz
- pytz – Az Olson tz adatbázist behozza a Pythonba, amely lehetővé teszi a pontos és platformokon átívelő időzóna számításokat
A szükséges, ajánlott és opcionális függőségek minimális támogatott verzióinak megtekintéséhez lásd a teljes telepítési útmutatót.
Telepítés forrásból
A pandák forrásból történő telepítése a fenti normaldependenciákon kívül Cythonra is szükséged van. A Cython telepíthető a PyPI-ből:
pip install cython
A pandas
könyvtárban (ugyanaz ahol a fájlt a git repo klónozása után találtad meg, hajtsd végre:
python setup.py install
vagy fejlesztői módban történő telepítéshez:
python -m pip install -e . --no-build-isolation --no-use-pep517
Ha van make
, akkor használhatja a ugyanazon parancs futtatásához.
vagy alternatív megoldásként
python setup.py develop
Lásd a teljes utasításokat forrásból történő telepítéshez.
Licenc
BSD 3
Dokumentáció
A hivatalos dokumentáció a PyData.org webhelyen található: https://pandas.pydata.org/pandas-docs/stable
Háttér
A pandas
munkája 2008-ban kezdődött az AQR-nél (mennyiségi fedezeti alap), és azóta aktív fejlesztés alatt áll.
Segítségkérés
Felhasználási kérdések esetén a legjobb hely a StackOverflow. További, általános kérdések és a diszkosz szakaszokra a pydata levelezőlistán is sor kerülhet.
Megbeszélés és fejlesztés
A legtöbb fejlesztési megbeszélés a GitHubon zajlik ebben a repóban. Ezenkívül a pandas-dev levelezőlista speciális megbeszélésekhez vagy tervezési kérdésekhez is felhasználható, és egy Gitter csatorna áll rendelkezésre a gyors fejlesztéssel kapcsolatos kérdések megválaszolásához.
Hozzájárulás a pandákhoz
Minden hozzászólást, hibajelentést, hibajavítást, dokumentációs fejlesztéseket, fejlesztéseket és ötleteket örömmel fogadunk.
Részletes áttekintés a hozzájárulás módjáról megtalálható a közreműködő útmutatóban. Van egy áttekintés a GitHubról is.
Ha egyszerűen csak a pandák kódbázisával kíván dolgozni, lépjen a GitHub “kérdések” fülére, és kezdje el áttekinteni az érdekes kérdéseket. Számos kérdés szerepel a Dokumentumok és az első jó kérdés között, amelyekből kiindulhat.
Emellett osztályozhat olyan problémákat is, amelyek magukban foglalhatják a hibajelentések reprodukálását, vagy létfontosságú információk, például verziószámok vagy reprodukciós utasítások kérését . Ha el akarja kezdeni a problémák elbírálását, az indulás egyik egyszerű módja az, ha feliratkozik a pandákra a CodeTriage-en.
Vagy esetleg a pandák használatával van saját ötlete, vagy valamit keres a dokumentációban és “ezen javítani lehet” gondolkodás … tehet róla!
Tegyen fel kérdéseket nyugodtan a levelezőlistán vagy a Gitteren.
A közreműködőként és fenntartóként várhatóan be kell tartania a pandák magatartási kódexét. További információ a következő oldalon található: A közreműködő magatartási kódexe