pandas-dev / pandas (Magyar)

Mi ez?

A pandas egy Python csomag, amely gyors, rugalmas és kifejezett adatstruktúrákat kínál úgy tervezték, hogy a “relációs” vagy “címkézett” adatokkal való munka könnyedén és intuitív módon történjen. Célja, hogy az alapvető magas szintű építőelem legyen a Python-ban való gyakorlati, valós adatok elemzésének elvetésére. Ezenkívül szélesebb célkitűzése, hogy a leghatékonyabb és legrugalmasabb nyílt forráskódú dataanalízis / manipulációs eszköz legyen, amely bármely nyelven elérhető. Már jó úton halad e cél felé.

Főbb jellemzők

Íme néhány olyan dolog, amit a pandák jól teljesítenek:

  • egyszerű hiányzó adatok (NaN, NA vagy NaT) ábrázolás lebegőpontban valamint nem lebegőpontos adatok
  • Méret mutabilitás: oszlopok beilleszthetők és törölhetők a DataFrame és a magasabb dimenziós objektumokból
  • Automatikus és explicit adat igazítás: az objektumokat kifejezetten egy címkekészlethez lehet igazítani , vagy a felhasználó egyszerűen kijelölheti a címkéket, és hagyhatja, hogy a Series, DataFrame stb. automatikusan beállítsák az adatokat a számításokhoz
  • Erőteljes, rugalmas funkcionalitás szerinti csoportosítás az osztott, az alkalmazás és az összekapcsolás műveletek végrehajtására az adatkészleteken, mind az adatok összesítéséhez, mind átalakításához tárgyak
  • Intelli nagy címkék alapú szeletelés, fantáziaindexelés és részhalmaz nagy adatkészletek
  • Adatkészletek intuitív egyesítése és összekapcsolása
  • Adatkészletek rugalmas átalakítása és elfordítása
  • A tengelyek hierarchikus címkézése ( lehetséges többszörös címkék használata kullancsonként)
  • Robusztus IO eszközök lapos fájlokból (CSV és tagolt), Excel fájlokból, adatbázisokból történő adatok betöltésére és az adatok ultragyors HDF5 formátumú mentésére / betöltésére
  • Idősor-specifikus funkcionalitás: dátumtartomány-generálás és frekvenciakonverzió, mozgó ablak-statisztikák, dátumeltolás és késés

Hol szerezhetem meg

A forráskódot jelenleg tárolják GitHub: https://github.com/pandas-dev/pandas

A legújabb kiadás bináris telepítői a PythonPackage Index (PyPI) és a Conda oldalon érhetők el.

# condaconda install pandas

# or PyPIpip install pandas

Függőségek

  • NumPy – Támogatja a nagy, többdimenziós tömböket, mátrixokat és magas szintű matematikákat cal függvények ezeken a tömbökön való működéshez
  • python-dateutil – Erőteljes kiterjesztéseket biztosít a standard datetime modulhoz
  • pytz – Az Olson tz adatbázist behozza a Pythonba, amely lehetővé teszi a pontos és platformokon átívelő időzóna számításokat

A szükséges, ajánlott és opcionális függőségek minimális támogatott verzióinak megtekintéséhez lásd a teljes telepítési útmutatót.

Telepítés forrásból

A pandák forrásból történő telepítése a fenti normaldependenciákon kívül Cythonra is szükséged van. A Cython telepíthető a PyPI-ből:

pip install cython

A pandas könyvtárban (ugyanaz ahol a fájlt a git repo klónozása után találtad meg, hajtsd végre:

python setup.py install

vagy fejlesztői módban történő telepítéshez:

python -m pip install -e . --no-build-isolation --no-use-pep517

Ha van make, akkor használhatja a ugyanazon parancs futtatásához.

vagy alternatív megoldásként

python setup.py develop

Lásd a teljes utasításokat forrásból történő telepítéshez.

Licenc

BSD 3

Dokumentáció

A hivatalos dokumentáció a PyData.org webhelyen található: https://pandas.pydata.org/pandas-docs/stable

Háttér

A pandas munkája 2008-ban kezdődött az AQR-nél (mennyiségi fedezeti alap), és azóta aktív fejlesztés alatt áll.

Segítségkérés

Felhasználási kérdések esetén a legjobb hely a StackOverflow. További, általános kérdések és a diszkosz szakaszokra a pydata levelezőlistán is sor kerülhet.

Megbeszélés és fejlesztés

A legtöbb fejlesztési megbeszélés a GitHubon zajlik ebben a repóban. Ezenkívül a pandas-dev levelezőlista speciális megbeszélésekhez vagy tervezési kérdésekhez is felhasználható, és egy Gitter csatorna áll rendelkezésre a gyors fejlesztéssel kapcsolatos kérdések megválaszolásához.

Hozzájárulás a pandákhoz

Minden hozzászólást, hibajelentést, hibajavítást, dokumentációs fejlesztéseket, fejlesztéseket és ötleteket örömmel fogadunk.

Részletes áttekintés a hozzájárulás módjáról megtalálható a közreműködő útmutatóban. Van egy áttekintés a GitHubról is.

Ha egyszerűen csak a pandák kódbázisával kíván dolgozni, lépjen a GitHub “kérdések” fülére, és kezdje el áttekinteni az érdekes kérdéseket. Számos kérdés szerepel a Dokumentumok és az első jó kérdés között, amelyekből kiindulhat.

Emellett osztályozhat olyan problémákat is, amelyek magukban foglalhatják a hibajelentések reprodukálását, vagy létfontosságú információk, például verziószámok vagy reprodukciós utasítások kérését . Ha el akarja kezdeni a problémák elbírálását, az indulás egyik egyszerű módja az, ha feliratkozik a pandákra a CodeTriage-en.

Vagy esetleg a pandák használatával van saját ötlete, vagy valamit keres a dokumentációban és “ezen javítani lehet” gondolkodás … tehet róla!

Tegyen fel kérdéseket nyugodtan a levelezőlistán vagy a Gitteren.

A közreműködőként és fenntartóként várhatóan be kell tartania a pandák magatartási kódexét. További információ a következő oldalon található: A közreműködő magatartási kódexe

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük