pandas-dev / pandas (Norsk)

Hva er det?

pandas er en Python-pakke som gir raske, fleksible og uttrykksfulle datastrukturer designet for å gjøre arbeidet med «relasjonelle» eller «merkede» data både enkle og intuitive. Det tar sikte på å være den grunnleggende byggesteinen på høyt nivå for å gjøre praktisk, virkelig dataanalyse i Python. I tillegg har det et bredere mål å bli det kraftigste og mest fleksible dataanalyse / manipuleringsverktøyet med åpen kildekode tilgjengelig på alle språk. Det er allerede godt på vei mot dette målet.

Hovedfunksjoner

Her er bare noen få av tingene som pandas gjør bra:

  • Enkelt håndtering av manglende data (representert som NaN, NA eller NaT) i flytende punkt så vel som ikke-flytende punktdata
  • Størrelsesmutabilitet: kolonner kan settes inn og slettes fra DataFrame og høyere dimensjonsobjekter
  • Automatisk og eksplisitt datajustering: objekter kan justeres eksplisitt til et sett med etiketter , eller brukeren kan bare merke etikettene og la Series, DataFrame osv. automatisk justere dataene for deg i beregninger
  • Kraftig, fleksibel gruppe etter funksjonalitet for å utføre splitt-bruk-kombinere-operasjoner på datasett, for både å samle og transformere data objekter
  • Intelli gent etikettbasert kutting, fancyindexing og delmengde av store datasett
  • Intuitiv sammenslåing og sammenføyning av datasett
  • Fleksibel omforming og dreining av datasett
  • Hierarkisk merking av akser mulig å ha flere etiketter per kryss)
  • Robuste IO-verktøy for å laste inn data fra flate filer (CSV og avgrenset), Excel-filer, databaser, og lagre / laste data fra det ultrasnelle HDF5-formatet
  • Tidsserie-spesifikk funksjonalitet: datoområdegenerering og frekvenskonvertering, flytting av vinduestatistikk, datoforskyvning og lagging

Hvor får du det

Kildekoden er for tiden vert på GitHub at: https://github.com/pandas-dev/pandas

Binære installatører for den siste utgitte versjonen er tilgjengelige på PythonPackage Index (PyPI) og i Conda.

# condaconda install pandas

# or PyPIpip install pandas

Avhengigheter

  • NumPy – Legger til støtte for store flerdimensjonale matriser, matriser og matematikk på høyt nivå kal funksjoner for å operere på disse matriser
  • python-dateutil – Gir kraftige utvidelser til standard datetime-modul
  • pytz – Bringer Olson tz-databasen inn i Python som tillater nøyaktige og kryssplattformer tidssone beregninger

Se den komplette installasjonsinstruksjonen for minst støttede versjoner av nødvendige, anbefalte og valgfrie avhengigheter.

Installasjon fra kilder

Slik installerer du pandaer fra kilden du trenger Cython i tillegg til de normale avhengighetene ovenfor. Cython kan installeres fra PyPI:

pip install cython

I katalogen pandas (samme en der du fant denne filen etter kloning av git repo), utfør:

python setup.py install

eller for installasjon i utviklingsmodus:

python -m pip install -e . --no-build-isolation --no-use-pep517

Hvis du har make, kan du også bruke make develop for å kjøre den samme kommandoen.

eller alternativt

python setup.py develop

Se de fullstendige instruksjonene for installasjon fra kilde.

Lisens

BSD 3

Dokumentasjon

Den offisielle dokumentasjonen er vert på PyData.org: https://pandas.pydata.org/pandas-docs/stable

Bakgrunn

Arbeidet med pandas startet ved AQR (et kvantitativt hedgefond) i 2008 og har vært under aktiv utvikling siden den gang.

Få hjelp

For bruksspørsmål er StackOverflow det beste stedet å gå til. Videre, generelle spørsmål og diskus sjoner kan også finne sted på adresselisten til pydata.

Diskusjon og utvikling

De fleste utviklingsdiskusjoner foregår på GitHub i denne repoen. Videre kan adresselisten til pandas-dev også brukes til spesialiserte diskusjoner eller designproblemer, og en Gitter-kanal er tilgjengelig for raske utviklingsrelaterte spørsmål.

Bidrar til pandaer

Alle bidrag, feilrapporter, feilrettinger, dokumentasjonsforbedringer, forbedringer og ideer er velkomne.

En detaljert oversikt over hvordan du kan bidra finner du i bidragsveiledningen. Det er også en oversikt over GitHub.

Hvis du bare ønsker å begynne å jobbe med panda-kodebasen, naviger til GitHub-fanen «Problemer» og begynn å se gjennom interessante problemer. Det er en rekke problemer som er oppført under Docs og et godt første nummer hvor du kan begynne.

Du kan også prøve problemer som kan omfatte reproduksjon av feilrapporter, eller be om viktig informasjon som versjonsnummer eller reproduksjonsinstruksjoner . Hvis du ønsker å begynne å prøve ut problemer, er en enkel måte å komme i gang på å abonnere på pandaer på CodeTriage.

Eller kanskje du bruker en egen panda, eller leter etter noe i dokumentasjonen. og tenker «dette kan forbedres» … du kan gjøre noe med det!

Still gjerne spørsmål på adresselisten eller på Gitter.

Som bidragsytere og vedlikeholdere av dette prosjektet forventes det at du følger adferdskodeksen for pandas. Mer informasjon finner du på: Contributor Code of Conduct

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *