pandas-dev / pandas (Svenska)

Vad är det?

pandas är ett Python-paket som ger snabba, flexibla och uttrycksfulla datastrukturer utformad för att göra arbetet med ”relationella” eller ”märkta” data både lätt och intuitivt. Det syftar till att vara den grundläggande byggstenen på hög nivå för att göra praktisk, verklig dataanalys i Python. Dessutom har det ett bredare mål att bli det mest kraftfulla och flexibla dataanalys / manipuleringsverktyget med öppen källkod som finns på alla språk. Det är redan på god väg mot detta mål.

Huvudfunktioner

Här är bara några av de saker som pandor gör bra:

  • Enkelt hantering av saknade data (representerad som NaN, NA eller NaT) i flytande punkt liksom icke-flytande punktdata
  • Storleksmutabilitet: kolumner kan infogas och raderas från DataFrame och högre dimensionella objekt
  • Automatisk och explicit datajustering: objekt kan justeras uttryckligen till en uppsättning etiketter , eller användaren kan helt enkelt markera etiketterna och låta Series, DataFrame etc. automatiskt justera data åt dig i beräkningar
  • Kraftfull, flexibel gruppering efter funktionalitet för att utföra split-applicera-kombinera operationer på datamängder, för både aggregering och transformering av data
  • Gör det enkelt att konvertera trasiga, annorlunda indexerade data i andra Python- och NumPy-datastrukturer till DataFrame objekt
  • Intelli gent etikettbaserad skivning, fancyindexing och delmängd av stora datamängder
  • Intuitiv sammanslagning och sammanfogning av datamängder
  • Flexibel omformning och svängning av datamängder
  • Hierarkisk märkning av axlar ( möjligt att ha flera etiketter per kryss)
  • Robusta IO-verktyg för att ladda data från platta filer (CSV och avgränsade), Excel-filer, databaser och spara / ladda data från det ultrasnabba HDF5-formatet
  • Tidsserie-specifik funktionalitet: datumintervallgenerering och frekvensomvandling, rörlig fönsterstatistik, datumförskjutning och eftersläpning

Var får man det

Källkoden är för närvarande värd för GitHub at: https://github.com/pandas-dev/pandas

Binära installatörer för den senaste versionen finns på PythonPackage Index (PyPI) och i Conda.

# condaconda install pandas

# or PyPIpip install pandas

Beroenden

  • NumPy – Lägger till stöd för stora, flerdimensionella matriser, matriser och matematik på hög nivå kal funktioner för att fungera på dessa matriser
  • python-dateutil – Ger kraftfulla tillägg till standard datetime-modulen
  • pytz – Tar in Olson tz-databasen i Python som möjliggör exakta och tidsplattformsberäkningar över plattformen

Se fullständiga installationsanvisningar för minimistödda versioner av nödvändiga, rekommenderade och valfria beroenden.

Installation från källor

Så här installerar du pandor från källan du behöver Cython utöver de normala beroenden ovan. Cython kan installeras från PyPI:

pip install cython

I pandas -katalogen (samma en där du hittade den här filen efter kloning av git repo), kör:

python setup.py install

eller för installation i utvecklingsläge:

python -m pip install -e . --no-build-isolation --no-use-pep517

Om du har make kan du också använda make develop för att köra samma kommando.

eller alternativt

python setup.py develop

Se fullständiga instruktioner för installation från källan.

Licens

BSD 3

Dokumentation

Den officiella dokumentationen finns på PyData.org: https://pandas.pydata.org/pandas-docs/stable

Bakgrund

Arbetet med pandas startade vid AQR (en kvantitativ hedgefond) 2008 och har har varit under aktiv utveckling sedan dess.

Få hjälp

För användningsfrågor är StackOverflow det bästa stället att gå till. Ytterligare allmänna frågor och diskus sioner kan också äga rum på pydatas e-postlista.

Diskussion och utveckling

De flesta utvecklingsdiskussioner äger rum på GitHub i denna repo. Vidare kan e-postlistan för pandas-dev också användas för specialiserade diskussioner eller designfrågor, och en Gitter-kanal är tillgänglig för snabba utvecklingsrelaterade frågor.

Bidrar till pandor

Alla bidrag, felrapporter, buggfixar, dokumentationsförbättringar, förbättringar och idéer är välkomna.

En detaljerad översikt över hur man kan bidra finns i den bidragande guiden. Det finns också en översikt över GitHub.

Om du bara vill börja arbeta med pandakodbasen, navigera till GitHub-fliken ”utgåvor” och börja titta igenom intressanta problem. Det finns ett antal problem som listas under Dokument och bra första utgåva där du kan börja.

Du kan också testa problem som kan innehålla reproduktion av felrapporter eller fråga om viktig information som versionsnummer eller reproduktionsinstruktioner . Om du vill börja testa problem är ett enkelt sätt att komma igång genom att prenumerera på pandor på CodeTriage.

Eller kanske genom att använda pandor har du en egen idé eller letar efter något i dokumentationen och tänka ”detta kan förbättras” … du kan göra något åt det!

Ställ gärna frågor på e-postlistan eller på Gitter.

Som bidragsgivare och underhållare till detta projekt förväntas du följa pandas ”uppförandekod. Mer information finns på: Contributor Code of Conduct

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *