pandas-dev / pandas (Deutsch)
Was ist das?
pandas ist ein Python-Paket, das schnelle, flexible und ausdrucksstarke Datenstrukturen bietet Entwickelt, um das Arbeiten mit „relationalen“ oder „beschrifteten“ Daten sowohl einfach als auch intuitiv zu gestalten. Es soll der grundlegende Baustein auf hoher Ebene für die praktische Datenanalyse in der realen Welt in Python sein. Darüber hinaus hat es das umfassendere Ziel, das leistungsstärkste und flexibelste Open-Source-Tool für Datenanalyse / -manipulation zu werden, das in jeder Sprache verfügbar ist. Es ist bereits auf dem besten Weg, dieses Ziel zu erreichen.
Hauptmerkmale
Hier sind nur einige der Dinge, die Pandas gut können:
- Einfach Behandlung fehlender Daten (dargestellt als
NaN
,NA
oderNaT
) im Gleitkomma sowie Nicht-Gleitkommadaten - Größenveränderlichkeit: Spalten können in DataFrame und höherdimensionale Objekte eingefügt und daraus gelöscht werden.
- Automatische und explizite Datenausrichtung: Objekte können explizit an einer Reihe von Beschriftungen ausgerichtet werden , oder der Benutzer kann die Beschriftungen einfach neu signieren und
Series
,DataFrame
usw. die Daten in Berechnungen - Erleichtern Sie das Konvertieren von unregelmäßigen, unterschiedlich indizierten Daten in anderen Python- und NumPy-Datenstrukturen in DataFrame Objekte
- Intelli Gent Label-basiertes Slicing, Fancyindexing und Subsetting großer Datensätze
- Intuitives Zusammenführen und Zusammenfügen von Datensätzen
- Flexibles Umformen und Schwenken von Datensätzen
- Hierarchisches Beschriften von Achsen ( Multiplabels pro Tick möglich)
- Robuste E / A-Tools zum Laden von Daten aus Flatfiles (CSV und getrennt), Excel-Dateien, Datenbanken und Speichern / Laden von Daten aus dem ultraschnellen HDF5-Format
- Zeitreihenspezifische Funktionen: Generierung und Frequenzkonvertierung von Datumsbereichen, Verschieben von Fensterstatistiken, Verschieben und Verzögern von Datumsangaben
Bezugsquellen
Der Quellcode wird derzeit gehostet GitHub unter: https://github.com/pandas-dev/pandas
Binäre Installationsprogramme für die neueste veröffentlichte Version sind im PythonPackage Index (PyPI) und in Conda verfügbar.
# condaconda install pandas
# or PyPIpip install pandas
Abhängigkeiten
- NumPy – Fügt Unterstützung für große, mehrdimensionale Arrays, Matrizen und Mathematik auf hoher Ebene hinzu kalische Funktionen für diese Arrays
- python-dateutil – Bietet leistungsstarke Erweiterungen des Standardmoduls datetime
- pytz – Bringt die Olson tz-Datenbank in Python, die genaue und plattformübergreifende Zeitzonenberechnungen ermöglicht
In den vollständigen Installationsanweisungen finden Sie die minimal unterstützten Versionen der erforderlichen, empfohlenen und optionalen Abhängigkeiten.
Installation aus Quellen
So installieren Sie Pandas aus der Quelle Sie benötigen Cython zusätzlich zu den oben genannten normalen Abhängigkeiten. Cython kann über PyPI installiert werden:
pip install cython
Im Verzeichnis pandas
(gleich) Führen Sie Folgendes aus, wenn Sie diese Datei nach dem Klonen des Git-Repos gefunden haben:
python setup.py install
oder zur Installation im Entwicklungsmodus:
python -m pip install -e . --no-build-isolation --no-use-pep517
Wenn Sie make
haben, können Sie auch , um denselben Befehl auszuführen.
oder alternativ
python setup.py develop
Lesen Sie die vollständigen Anweisungen für die Installation von der Quelle.
Lizenz
BSD 3
Dokumentation
Die offizielle Dokumentation wird auf PyData.org gehostet: https://pandas.pydata.org/pandas-docs/stable
Hintergrund
Die Arbeiten an pandas
begannen 2008 bei AQR (einem quantitativen Hedgefonds) und haben begonnen ist seitdem in der aktiven Entwicklung.
Hilfe anfordern
Bei Fragen zur Verwendung ist StackOverflow der beste Ort. Weitere allgemeine Fragen und Diskusse Sitzungen können auch auf der Pydata-Mailingliste stattfinden.
Diskussion und Entwicklung
Die meisten Entwicklungsdiskussionen finden in diesem Repo auf GitHub statt. Darüber hinaus kann die Pandas-Dev-Mailingliste auch für spezielle Diskussionen oder Designprobleme verwendet werden. Für Fragen zur schnellen Entwicklung steht ein Gitter-Kanal zur Verfügung.
Beiträge zu Pandas
Alle Beiträge, Fehlerberichte, Fehlerkorrekturen, Dokumentationsverbesserungen, Verbesserungen und Ideen sind willkommen.
Eine detaillierte Übersicht über die Beiträge finden Sie im beitragenden Leitfaden. Es gibt auch eine Übersicht über GitHub.
Wenn Sie einfach nur mit der Pandas-Codebasis arbeiten möchten, navigieren Sie zur Registerkarte „Probleme“ von GitHub und suchen Sie nach interessanten Problemen. Es gibt eine Reihe von Problemen, die unter „Dokumente“ aufgeführt sind, und eine gute erste Ausgabe, mit der Sie beginnen können.
Sie können auch Probleme untersuchen, die das Reproduzieren von Fehlerberichten oder das Anfordern wichtiger Informationen wie Versionsnummern oder Anweisungen zur Reproduktion umfassen . Wenn Sie mit dem Testen von Problemen beginnen möchten, können Sie Pandas auf CodeTriage abonnieren.
Oder Sie haben durch die Verwendung von Pandas eine eigene Idee oder suchen nach etwas in der Dokumentation und denken, „das kann verbessert werden“ … Sie können etwas dagegen tun!
Sie können gerne Fragen auf der Mailingliste oder auf Gitter stellen.
Als Mitwirkende und Betreuer von Bei diesem Projekt wird von Ihnen erwartet, dass Sie den Verhaltenskodex der Pandas einhalten. Weitere Informationen finden Sie unter: Verhaltenskodex für Mitwirkende