pandas-dev / pandas (Română)

Ce este?

panda este un pachet Python care oferă structuri de date rapide, flexibile și expresive conceput pentru a face lucrul cu date „relaționale” sau „etichetate” ușor și intuitiv. Acesta își propune să fie elementul fundamental la nivel înalt pentru a face analize de date practice și reale din Python. În plus, are scopul mai larg de a deveni cel mai puternic și flexibil instrument de analiză / manipulare a datelor open source disponibil în orice limbă. Este deja pe drumul către acest obiectiv.

Caracteristici principale

Iată doar câteva dintre lucrurile pe care le face bine panda:

  • Ușor tratarea datelor lipsă (reprezentate ca NaN, NA sau NaT) în virgulă mobilă precum și date fără virgulă mobilă
  • Mutabilitatea dimensiunii: coloanele pot fi inserate și șterse din DataFrame și obiecte cu dimensiuni superioare
  • Aliniere automată și explicită a datelor: obiectele pot fi aliniate în mod explicit la un set de etichete sau utilizatorul poate pur și simplu să semneze etichetele și să permită Series, DataFrame etc. să alinieze automat datele pentru dvs. în calcule
  • Grup puternic și flexibil în funcție de funcționalitate pentru a efectua operații split-apply-combine pe seturi de date, atât pentru agregarea, cât și pentru transformarea datelor
  • Faceți mai ușor să convertiți datele zdrențuite, indexate diferit, în alte structuri de date Python și NumPy în DataFrame obiecte
  • Intelli feliere bazată pe etichete, fancyindexing și subsetare a seturilor de date mari
  • Combinarea intuitivă și seturile de date de îmbinare
  • Remodelarea flexibilă și pivotarea seturilor de date
  • Etichetarea ierarhică a axelor este posibil să aveți mai multe etichete pe bifă)
  • Instrumente IO robuste pentru încărcarea datelor din fișiere plate (CSV și delimitate), fișiere Excel, baze de date și salvarea / încărcarea datelor din formatul ultra-rapid HDF5
  • Funcționalitate specifică seriei temporale: generarea intervalului de date și conversia frecvenței, statisticile ferestrei în mișcare, schimbarea datei și întârzierea

Unde se obține

Codul sursă este găzduit în prezent pe GitHub la: https://github.com/pandas-dev/pandas

Instalatorii binari pentru cea mai recentă versiune lansată sunt disponibili în PythonPackage Index (PyPI) și pe Conda.

# condaconda install pandas

# or PyPIpip install pandas

Dependențe

  • NumPy – Adaugă suport pentru matrice mari, multi-dimensionale, matrici și matematici la nivel înalt funcții cal pentru a opera pe aceste tablouri
  • python-dateutil – Oferă extensii puternice pentru modulul datetime standard
  • pytz – Aduce baza de date Olson tz în Python care permite calcule precise și transversale de fus orar pe platformă

Consultați instrucțiunile complete de instalare pentru versiunile minime acceptate ale dependențelor necesare, recomandate și opționale.

Instalare din surse

Pentru a instala panda din sursă aveți nevoie de Cython pe lângă dependențele normale de mai sus. Cython poate fi instalat din PyPI:

pip install cython

În directorul pandas (același unul în care ați găsit acest fișier după clonarea git repo), executați:

python setup.py install

sau pentru instalare în modul de dezvoltare:

python -m pip install -e . --no-build-isolation --no-use-pep517

Dacă aveți make, puteți utiliza și make develop pentru a rula aceeași comandă.

sau alternativ

python setup.py develop

Consultați instrucțiunile complete pentru instalare de la sursă.

Licență

BSD 3

Documentare

Documentația oficială este găzduită pe PyData.org: https://pandas.pydata.org/pandas-docs/stable

Context

Lucrările la pandas au început la AQR (un fond de acoperire cantitativ) în 2008 și are a fost în curs de dezvoltare activă de atunci.

Obținerea ajutorului

Pentru întrebări de utilizare, cel mai bun loc unde puteți merge este StackOverflow. În plus, întrebări generale și discuții sesiunile pot avea loc și pe lista de distribuție pydata.

Discuție și dezvoltare

Majoritatea discuțiilor de dezvoltare au loc pe GitHub în această repo. În plus, lista de discuții pandas-dev poate fi utilizată și pentru discuții specializate sau probleme de proiectare, iar un canal Gitter este disponibil pentru întrebări legate de dezvoltarea rapidă.

Contribuirea la panda

Toate contribuțiile, rapoartele de erori, remedierile de erori, îmbunătățirile documentației, îmbunătățirile și ideile sunt binevenite.

O prezentare detaliată a modului de a contribui pot fi găsite în ghidul care contribuie. Există, de asemenea, o prezentare generală pe GitHub.

Dacă pur și simplu doriți să începeți să lucrați cu baza de cod pandas, navigați la fila GitHub „probleme” și începeți să căutați probleme interesante. Există o serie de probleme enumerate în Documente și prima problemă bună în care ați putea începe.

De asemenea, puteți tria problemele care pot include reproducerea rapoartelor de erori sau solicitarea de informații vitale, cum ar fi numerele de versiune sau instrucțiunile de reproducere. . Dacă doriți să începeți trierea problemelor, o modalitate ușoară de a începe este să vă abonați la panda pe CodeTriage.

Sau poate prin utilizarea panda aveți o idee proprie sau căutați ceva în documentație și gândindu-vă că „acest lucru poate fi îmbunătățit” … puteți face ceva în acest sens!

Nu ezitați să puneți întrebări pe lista de corespondență sau pe Gitter.

În calitate de colaboratori și întreținători ai acest proiect, vă așteptați să respectați codul de conduită al pandelor. Mai multe informații pot fi găsite la: Codul de conduită al contribuitorului

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *