pandas-dev / pandas (Svenska)
Vad är det?
pandas är ett Python-paket som ger snabba, flexibla och uttrycksfulla datastrukturer utformad för att göra arbetet med ”relationella” eller ”märkta” data både lätt och intuitivt. Det syftar till att vara den grundläggande byggstenen på hög nivå för att göra praktisk, verklig dataanalys i Python. Dessutom har det ett bredare mål att bli det mest kraftfulla och flexibla dataanalys / manipuleringsverktyget med öppen källkod som finns på alla språk. Det är redan på god väg mot detta mål.
Huvudfunktioner
Här är bara några av de saker som pandor gör bra:
- Enkelt hantering av saknade data (representerad som
NaN
,NA
ellerNaT
) i flytande punkt liksom icke-flytande punktdata - Storleksmutabilitet: kolumner kan infogas och raderas från DataFrame och högre dimensionella objekt
- Automatisk och explicit datajustering: objekt kan justeras uttryckligen till en uppsättning etiketter , eller användaren kan helt enkelt markera etiketterna och låta
Series
,DataFrame
etc. automatiskt justera data åt dig i beräkningar - Kraftfull, flexibel gruppering efter funktionalitet för att utföra split-applicera-kombinera operationer på datamängder, för både aggregering och transformering av data
- Gör det enkelt att konvertera trasiga, annorlunda indexerade data i andra Python- och NumPy-datastrukturer till DataFrame objekt
- Intelli gent etikettbaserad skivning, fancyindexing och delmängd av stora datamängder
- Intuitiv sammanslagning och sammanfogning av datamängder
- Flexibel omformning och svängning av datamängder
- Hierarkisk märkning av axlar ( möjligt att ha flera etiketter per kryss)
- Robusta IO-verktyg för att ladda data från platta filer (CSV och avgränsade), Excel-filer, databaser och spara / ladda data från det ultrasnabba HDF5-formatet
- Tidsserie-specifik funktionalitet: datumintervallgenerering och frekvensomvandling, rörlig fönsterstatistik, datumförskjutning och eftersläpning
Var får man det
Källkoden är för närvarande värd för GitHub at: https://github.com/pandas-dev/pandas
Binära installatörer för den senaste versionen finns på PythonPackage Index (PyPI) och i Conda.
# condaconda install pandas
# or PyPIpip install pandas
Beroenden
- NumPy – Lägger till stöd för stora, flerdimensionella matriser, matriser och matematik på hög nivå kal funktioner för att fungera på dessa matriser
- python-dateutil – Ger kraftfulla tillägg till standard datetime-modulen
- pytz – Tar in Olson tz-databasen i Python som möjliggör exakta och tidsplattformsberäkningar över plattformen
Se fullständiga installationsanvisningar för minimistödda versioner av nödvändiga, rekommenderade och valfria beroenden.
Installation från källor
Så här installerar du pandor från källan du behöver Cython utöver de normala beroenden ovan. Cython kan installeras från PyPI:
pip install cython
I pandas
-katalogen (samma en där du hittade den här filen efter kloning av git repo), kör:
python setup.py install
eller för installation i utvecklingsläge:
python -m pip install -e . --no-build-isolation --no-use-pep517
Om du har make
kan du också använda make develop
för att köra samma kommando.
eller alternativt
python setup.py develop
Se fullständiga instruktioner för installation från källan.
Licens
BSD 3
Dokumentation
Den officiella dokumentationen finns på PyData.org: https://pandas.pydata.org/pandas-docs/stable
Bakgrund
Arbetet med pandas
startade vid AQR (en kvantitativ hedgefond) 2008 och har har varit under aktiv utveckling sedan dess.
Få hjälp
För användningsfrågor är StackOverflow det bästa stället att gå till. Ytterligare allmänna frågor och diskus sioner kan också äga rum på pydatas e-postlista.
Diskussion och utveckling
De flesta utvecklingsdiskussioner äger rum på GitHub i denna repo. Vidare kan e-postlistan för pandas-dev också användas för specialiserade diskussioner eller designfrågor, och en Gitter-kanal är tillgänglig för snabba utvecklingsrelaterade frågor.
Bidrar till pandor
Alla bidrag, felrapporter, buggfixar, dokumentationsförbättringar, förbättringar och idéer är välkomna.
En detaljerad översikt över hur man kan bidra finns i den bidragande guiden. Det finns också en översikt över GitHub.
Om du bara vill börja arbeta med pandakodbasen, navigera till GitHub-fliken ”utgåvor” och börja titta igenom intressanta problem. Det finns ett antal problem som listas under Dokument och bra första utgåva där du kan börja.
Du kan också testa problem som kan innehålla reproduktion av felrapporter eller fråga om viktig information som versionsnummer eller reproduktionsinstruktioner . Om du vill börja testa problem är ett enkelt sätt att komma igång genom att prenumerera på pandor på CodeTriage.
Eller kanske genom att använda pandor har du en egen idé eller letar efter något i dokumentationen och tänka ”detta kan förbättras” … du kan göra något åt det!
Ställ gärna frågor på e-postlistan eller på Gitter.
Som bidragsgivare och underhållare till detta projekt förväntas du följa pandas ”uppförandekod. Mer information finns på: Contributor Code of Conduct