pandas-dev / pandas (Suomi)

Mikä se on?

pandas on Python-paketti, joka tarjoaa nopeat, joustavat ja ilmeikkäät tietorakenteet suunniteltu tekemään ”relaatiotiedon” tai ”merkittyjen” tietojen kanssa työskentelystä helppoa ja intuitiivista. Sen tavoitteena on olla perustavanlaatuinen korkean tason rakennuspalikka käytännöllisen, reaalimaailman tietojen analysoinnissa Pythonissa. Lisäksi sillä on laajempi tavoite tulla tehokkaimmaksi ja joustavimmaksi avoimen lähdekoodin dataananalyysi- / manipulointityökaluksi, joka on käytettävissä kaikilla kielillä. Se on jo hyvällä tavalla kohti tätä tavoitetta.

Pääominaisuudet

Tässä on vain muutamia asioita, joita pandat tekevät hyvin:

  • Helppo puuttuvien tietojen (edustettuina NaN, NA tai NaT) tietojen käsittely kelluvassa pisteessä samoin kuin ei liukuluvutiedot
  • Koon muuttuvuus: sarakkeita voidaan lisätä ja poistaa DataFrame-kehyksestä ja korkeamman ulottuvuuden esineistä
  • Automaattinen ja eksplisiittinen tietojen kohdistus: objektit voidaan kohdistaa nimenomaisesti tarrasarjaan , tai käyttäjä voi yksinkertaisesti merkitä tunnisteet ja antaa Series, DataFrame jne. kohdistaa tiedot automaattisesti puolestasi laskelmissa
  • Tehokas, joustava ryhmittely toiminnallisuuden mukaan suoritettavien, sovellettavien ja yhdistävien toimintojen suorittamiseksi tietojoukoissa, sekä tietojen yhdistämiseksi että muuntamiseksi
  • Tee epätasaisten, eri tavoin indeksoitujen tietojen muuntaminen muissa Python- ja NumPy-tietorakenteissa DataFrame-kehykseen esineet
  • Intelli suurten tietojoukkojen etikettipohjainen viipalointi, fancyindexing ja osajoukko
  • Intuitiivinen tietojoukkojen yhdistäminen ja yhdistäminen
  • Tietojoukkojen joustava muotoilu ja kääntäminen
  • Akselien hierarkkinen merkintä ( mahdollista saada useita tunnisteita kutakin rastiä kohti)
  • Vankat IO-työkalut tietojen lataamiseen tasaisista tiedostoista (CSV ja erotetut), Excel-tiedostoista, tietokannoista ja tietojen tallentamisesta / lataamisesta ultranopeasta HDF5-muodosta
  • Aikasarjakohtainen toiminnallisuus: päivämääränjako ja taajuusmuunnos, siirtyvät ikkunatilastot, päivämääränsiirto ja viive

Mistä se hankitaan

Lähdekoodia isännöidään tällä hetkellä GitHub osoitteessa: https://github.com/pandas-dev/pandas

Viimeisimmän julkaistun version binaariasennukset ovat saatavilla PythonPackage Index (PyPI) -palvelusta ja Condasta.

# condaconda install pandas

# or PyPIpip install pandas

Riippuvuudet

  • NumPy – Lisää tuen suurille, moniulotteisille matriiseille, matriiseille ja korkean tason matematiikoille cal-toiminnot näillä matriiseilla
  • python-dateutil – Tarjoaa tehokkaat laajennukset vakiomuotoiseen päivämäärä-moduuliin
  • pytz – Tuo Olson tz -tietokannan Pythoniin, mikä mahdollistaa tarkat ja alustojen väliset aikavyöhykelaskelmat

Katso täydelliset asennusohjeet tarvittavien, suositeltujen ja valinnaisten riippuvuuksien vähimmäistuetuista versioista.

Asennus lähteistä

Pandojen asentaminen lähteestä tarvitset Cythonin yllä olevien normiriippuvuuksien lisäksi. Cython voidaan asentaa PyPI: stä:

pip install cython

Hakemistossa pandas (sama sellainen, josta löysit tämän tiedoston git-repon kloonauksen jälkeen), suorita:

python setup.py install

tai asennettavaksi kehitystilaan:

python -m pip install -e . --no-build-isolation --no-use-pep517

Jos sinulla on make, voit käyttää myös make develop suorittaa sama komento.

tai vaihtoehtoisesti

python setup.py develop

Katso täydelliset ohjeet lähteestä asennettavaksi.

Lisenssi

BSD 3

Dokumentaatio

Virallista dokumentaatiota isännöi PyData.org: https://pandas.pydata.org/pandas-docs/stable

Tausta

pandas -työ aloitettiin AQR: ssä (määrällinen hedge-rahasto) vuonna 2008 ja sitä on kehitetty aktiivisesti siitä lähtien.

Apua

Käyttöön liittyvissä kysymyksissä paras paikka mennä on StackOverflow. Siioneja voi tapahtua myös pydatan postituslistalla.

Keskustelu ja kehitys

Suurin osa kehityskeskusteluista käydään GitHubissa tässä repossa. Lisäksi pandas-dev-postituslistaa voidaan käyttää myös erikoistuneissa keskusteluissa tai suunnittelukysymyksissä, ja Gitter-kanava on käytettävissä nopeaan kehitykseen liittyviin kysymyksiin.

Panos pandoihin

Kaikki julkaisut, virheraportit, virhekorjaukset, dokumentaation parannukset, parannukset ja ideat ovat tervetulleita.

Yksityiskohtainen yleiskatsaus osallistumisesta löytyy julkaisuoppaasta. Siellä on myös yleiskatsaus GitHubista.

Jos haluat yksinkertaisesti aloittaa työskentelyn pandas-koodikannan kanssa, siirry GitHub ”issues” -välilehdelle ja aloita mielenkiintoisten asioiden etsiminen. Docs-luettelossa on useita asioita ja hyvä ensimmäinen asia, josta voit aloittaa.

Voit myös luokitella asioita, jotka voivat sisältää virheraporttien toistamisen tai tärkeiden tietojen, kuten versionumeroiden tai kopiointiohjeiden, pyytämisen. . Jos haluat aloittaa triagoinnin, yksi helppo tapa aloittaa on tilata pandat CodeTriage-palveluun.

Tai ehkä pandojen avulla sinulla on oma idea tai etsit jotain dokumentaatiosta. ja ajattelemalla, että ”tätä voidaan parantaa” … voit tehdä asialle jotain!

Voit vapaasti kysyä kysymyksiä postituslistalta tai Gitteristä.

Avustajina ja ylläpitäjinä Tämän projektin odotetaan noudattavan pandojen käytännesääntöjä. Lisätietoja: Contributor Code of Conduct

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *