pandas-dev / pandas (Deutsch)

Was ist das?

pandas ist ein Python-Paket, das schnelle, flexible und ausdrucksstarke Datenstrukturen bietet Entwickelt, um das Arbeiten mit „relationalen“ oder „beschrifteten“ Daten sowohl einfach als auch intuitiv zu gestalten. Es soll der grundlegende Baustein auf hoher Ebene für die praktische Datenanalyse in der realen Welt in Python sein. Darüber hinaus hat es das umfassendere Ziel, das leistungsstärkste und flexibelste Open-Source-Tool für Datenanalyse / -manipulation zu werden, das in jeder Sprache verfügbar ist. Es ist bereits auf dem besten Weg, dieses Ziel zu erreichen.

Hauptmerkmale

Hier sind nur einige der Dinge, die Pandas gut können:

  • Einfach Behandlung fehlender Daten (dargestellt als NaN, NA oder NaT) im Gleitkomma sowie Nicht-Gleitkommadaten
  • Größenveränderlichkeit: Spalten können in DataFrame und höherdimensionale Objekte eingefügt und daraus gelöscht werden.
  • Automatische und explizite Datenausrichtung: Objekte können explizit an einer Reihe von Beschriftungen ausgerichtet werden , oder der Benutzer kann die Beschriftungen einfach neu signieren und Series, DataFrame usw. die Daten in Berechnungen
  • Leistungsstarke, flexible Gruppierung nach Funktionen zum Ausführen von Plit-Apply-Combine-Operationen für Datensätze zum Aggregieren und Transformieren von Daten

  • Erleichtern Sie das Konvertieren von unregelmäßigen, unterschiedlich indizierten Daten in anderen Python- und NumPy-Datenstrukturen in DataFrame Objekte
  • Intelli Gent Label-basiertes Slicing, Fancyindexing und Subsetting großer Datensätze
  • Intuitives Zusammenführen und Zusammenfügen von Datensätzen
  • Flexibles Umformen und Schwenken von Datensätzen
  • Hierarchisches Beschriften von Achsen ( Multiplabels pro Tick möglich)
  • Robuste E / A-Tools zum Laden von Daten aus Flatfiles (CSV und getrennt), Excel-Dateien, Datenbanken und Speichern / Laden von Daten aus dem ultraschnellen HDF5-Format
  • Zeitreihenspezifische Funktionen: Generierung und Frequenzkonvertierung von Datumsbereichen, Verschieben von Fensterstatistiken, Verschieben und Verzögern von Datumsangaben

Bezugsquellen

Der Quellcode wird derzeit gehostet GitHub unter: https://github.com/pandas-dev/pandas

Binäre Installationsprogramme für die neueste veröffentlichte Version sind im PythonPackage Index (PyPI) und in Conda verfügbar.

# condaconda install pandas

# or PyPIpip install pandas

Abhängigkeiten

  • NumPy – Fügt Unterstützung für große, mehrdimensionale Arrays, Matrizen und Mathematik auf hoher Ebene hinzu kalische Funktionen für diese Arrays
  • python-dateutil – Bietet leistungsstarke Erweiterungen des Standardmoduls datetime
  • pytz – Bringt die Olson tz-Datenbank in Python, die genaue und plattformübergreifende Zeitzonenberechnungen ermöglicht

In den vollständigen Installationsanweisungen finden Sie die minimal unterstützten Versionen der erforderlichen, empfohlenen und optionalen Abhängigkeiten.

Installation aus Quellen

So installieren Sie Pandas aus der Quelle Sie benötigen Cython zusätzlich zu den oben genannten normalen Abhängigkeiten. Cython kann über PyPI installiert werden:

pip install cython

Im Verzeichnis pandas (gleich) Führen Sie Folgendes aus, wenn Sie diese Datei nach dem Klonen des Git-Repos gefunden haben:

python setup.py install

oder zur Installation im Entwicklungsmodus:

python -m pip install -e . --no-build-isolation --no-use-pep517

Wenn Sie make haben, können Sie auch , um denselben Befehl auszuführen.

oder alternativ

python setup.py develop

Lesen Sie die vollständigen Anweisungen für die Installation von der Quelle.

Lizenz

BSD 3

Dokumentation

Die offizielle Dokumentation wird auf PyData.org gehostet: https://pandas.pydata.org/pandas-docs/stable

Hintergrund

Die Arbeiten an pandas begannen 2008 bei AQR (einem quantitativen Hedgefonds) und haben begonnen ist seitdem in der aktiven Entwicklung.

Hilfe anfordern

Bei Fragen zur Verwendung ist StackOverflow der beste Ort. Weitere allgemeine Fragen und Diskusse Sitzungen können auch auf der Pydata-Mailingliste stattfinden.

Diskussion und Entwicklung

Die meisten Entwicklungsdiskussionen finden in diesem Repo auf GitHub statt. Darüber hinaus kann die Pandas-Dev-Mailingliste auch für spezielle Diskussionen oder Designprobleme verwendet werden. Für Fragen zur schnellen Entwicklung steht ein Gitter-Kanal zur Verfügung.

Beiträge zu Pandas

Alle Beiträge, Fehlerberichte, Fehlerkorrekturen, Dokumentationsverbesserungen, Verbesserungen und Ideen sind willkommen.

Eine detaillierte Übersicht über die Beiträge finden Sie im beitragenden Leitfaden. Es gibt auch eine Übersicht über GitHub.

Wenn Sie einfach nur mit der Pandas-Codebasis arbeiten möchten, navigieren Sie zur Registerkarte „Probleme“ von GitHub und suchen Sie nach interessanten Problemen. Es gibt eine Reihe von Problemen, die unter „Dokumente“ aufgeführt sind, und eine gute erste Ausgabe, mit der Sie beginnen können.

Sie können auch Probleme untersuchen, die das Reproduzieren von Fehlerberichten oder das Anfordern wichtiger Informationen wie Versionsnummern oder Anweisungen zur Reproduktion umfassen . Wenn Sie mit dem Testen von Problemen beginnen möchten, können Sie Pandas auf CodeTriage abonnieren.

Oder Sie haben durch die Verwendung von Pandas eine eigene Idee oder suchen nach etwas in der Dokumentation und denken, „das kann verbessert werden“ … Sie können etwas dagegen tun!

Sie können gerne Fragen auf der Mailingliste oder auf Gitter stellen.

Als Mitwirkende und Betreuer von Bei diesem Projekt wird von Ihnen erwartet, dass Sie den Verhaltenskodex der Pandas einhalten. Weitere Informationen finden Sie unter: Verhaltenskodex für Mitwirkende

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.