pandas-dev / pandas (Norsk)
Hva er det?
pandas er en Python-pakke som gir raske, fleksible og uttrykksfulle datastrukturer designet for å gjøre arbeidet med «relasjonelle» eller «merkede» data både enkle og intuitive. Det tar sikte på å være den grunnleggende byggesteinen på høyt nivå for å gjøre praktisk, virkelig dataanalyse i Python. I tillegg har det et bredere mål å bli det kraftigste og mest fleksible dataanalyse / manipuleringsverktøyet med åpen kildekode tilgjengelig på alle språk. Det er allerede godt på vei mot dette målet.
Hovedfunksjoner
Her er bare noen få av tingene som pandas gjør bra:
- Enkelt håndtering av manglende data (representert som
NaN
,NA
ellerNaT
) i flytende punkt så vel som ikke-flytende punktdata - Størrelsesmutabilitet: kolonner kan settes inn og slettes fra DataFrame og høyere dimensjonsobjekter
- Automatisk og eksplisitt datajustering: objekter kan justeres eksplisitt til et sett med etiketter , eller brukeren kan bare merke etikettene og la
Series
,DataFrame
osv. automatisk justere dataene for deg i beregninger - Kraftig, fleksibel gruppe etter funksjonalitet for å utføre splitt-bruk-kombinere-operasjoner på datasett, for både å samle og transformere data objekter
- Intelli gent etikettbasert kutting, fancyindexing og delmengde av store datasett
- Intuitiv sammenslåing og sammenføyning av datasett
- Fleksibel omforming og dreining av datasett
- Hierarkisk merking av akser mulig å ha flere etiketter per kryss)
- Robuste IO-verktøy for å laste inn data fra flate filer (CSV og avgrenset), Excel-filer, databaser, og lagre / laste data fra det ultrasnelle HDF5-formatet
- Tidsserie-spesifikk funksjonalitet: datoområdegenerering og frekvenskonvertering, flytting av vinduestatistikk, datoforskyvning og lagging
Hvor får du det
Kildekoden er for tiden vert på GitHub at: https://github.com/pandas-dev/pandas
Binære installatører for den siste utgitte versjonen er tilgjengelige på PythonPackage Index (PyPI) og i Conda.
# condaconda install pandas
# or PyPIpip install pandas
Avhengigheter
- NumPy – Legger til støtte for store flerdimensjonale matriser, matriser og matematikk på høyt nivå kal funksjoner for å operere på disse matriser
- python-dateutil – Gir kraftige utvidelser til standard datetime-modul
- pytz – Bringer Olson tz-databasen inn i Python som tillater nøyaktige og kryssplattformer tidssone beregninger
Se den komplette installasjonsinstruksjonen for minst støttede versjoner av nødvendige, anbefalte og valgfrie avhengigheter.
Installasjon fra kilder
Slik installerer du pandaer fra kilden du trenger Cython i tillegg til de normale avhengighetene ovenfor. Cython kan installeres fra PyPI:
pip install cython
I katalogen pandas
(samme en der du fant denne filen etter kloning av git repo), utfør:
python setup.py install
eller for installasjon i utviklingsmodus:
python -m pip install -e . --no-build-isolation --no-use-pep517
Hvis du har make
, kan du også bruke make develop
for å kjøre den samme kommandoen.
eller alternativt
python setup.py develop
Se de fullstendige instruksjonene for installasjon fra kilde.
Lisens
BSD 3
Dokumentasjon
Den offisielle dokumentasjonen er vert på PyData.org: https://pandas.pydata.org/pandas-docs/stable
Bakgrunn
Arbeidet med pandas
startet ved AQR (et kvantitativt hedgefond) i 2008 og har vært under aktiv utvikling siden den gang.
Få hjelp
For bruksspørsmål er StackOverflow det beste stedet å gå til. Videre, generelle spørsmål og diskus sjoner kan også finne sted på adresselisten til pydata.
Diskusjon og utvikling
De fleste utviklingsdiskusjoner foregår på GitHub i denne repoen. Videre kan adresselisten til pandas-dev også brukes til spesialiserte diskusjoner eller designproblemer, og en Gitter-kanal er tilgjengelig for raske utviklingsrelaterte spørsmål.
Bidrar til pandaer
Alle bidrag, feilrapporter, feilrettinger, dokumentasjonsforbedringer, forbedringer og ideer er velkomne.
En detaljert oversikt over hvordan du kan bidra finner du i bidragsveiledningen. Det er også en oversikt over GitHub.
Hvis du bare ønsker å begynne å jobbe med panda-kodebasen, naviger til GitHub-fanen «Problemer» og begynn å se gjennom interessante problemer. Det er en rekke problemer som er oppført under Docs og et godt første nummer hvor du kan begynne.
Du kan også prøve problemer som kan omfatte reproduksjon av feilrapporter, eller be om viktig informasjon som versjonsnummer eller reproduksjonsinstruksjoner . Hvis du ønsker å begynne å prøve ut problemer, er en enkel måte å komme i gang på å abonnere på pandaer på CodeTriage.
Eller kanskje du bruker en egen panda, eller leter etter noe i dokumentasjonen. og tenker «dette kan forbedres» … du kan gjøre noe med det!
Still gjerne spørsmål på adresselisten eller på Gitter.
Som bidragsytere og vedlikeholdere av dette prosjektet forventes det at du følger adferdskodeksen for pandas. Mer informasjon finner du på: Contributor Code of Conduct