pandas-dev / pandas (Italiano)
Che cosè?
pandas è un pacchetto Python che fornisce strutture dati veloci, flessibili ed espressive progettato per rendere il lavoro con dati “relazionali” o “etichettati” sia facile che intuitivo. Vuole essere lelemento fondamentale di alto livello per eseguire analisi pratiche e reali dei dati in Python. Inoltre, ha lobiettivo più ampio di diventare lo strumento di analisi / manipolazione dei dati open source più potente e flessibile disponibile in qualsiasi lingua. È già sulla buona strada per raggiungere questo obiettivo.
Caratteristiche principali
Ecco solo alcune delle cose che i panda fanno bene:
- Facile gestione dei dati mancanti (rappresentati come
NaN
,NA
oNaT
) in virgola mobile così come i dati in virgola mobile - Modifica delle dimensioni: le colonne possono essere inserite ed eliminate da DataFrame e oggetti dimensionali superiori
- Allineamento dati automatico ed esplicito: gli oggetti possono essere allineati esplicitamente a un insieme di etichette oppure lutente può semplicemente ignorare le etichette e lasciare che
Series
,DataFrame
e così via allinei automaticamente i dati nei calcoli - Funzionalità gruppo per potente e flessibile per eseguire operazioni di suddivisione-applicazione-combinazione su set di dati, sia per laggregazione che per la trasformazione dei dati
- Semplifica la conversione di dati frammentati e indicizzati in modo diverso in altre strutture di dati Python e NumPy in DataFrame oggetti
- Intelli affettamento basato su etichette gent, indicizzazione fantasia e sottoinsieme di grandi set di dati
- Unione e unione intuitive di set di dati
- Rimodellamento flessibile e rotazione di set di dati
- Etichettatura gerarchica degli assi ( possibile avere etichette multiple per tick)
- Strumenti IO robusti per caricare dati da file flat (CSV e delimitati), file Excel, database e salvare / caricare dati dal formato ultraveloce HDF5
- Funzionalità specifiche per serie temporali: generazione di intervalli di date e conversione di frequenza, statistiche sulla finestra mobile, spostamento e ritardo della data
Dove trovarla
Il codice sorgente è attualmente ospitato su GitHub su: https://github.com/pandas-dev/pandas
I programmi di installazione binari per lultima versione rilasciata sono disponibili su PythonPackage Index (PyPI) e su Conda.
# condaconda install pandas
# or PyPIpip install pandas
Dipendenze
- NumPy – Aggiunge il supporto per array, matrici e matematiche di alto livello multidimensionali di grandi dimensioni funzioni cal per operare su questi array
- python-dateutil – Fornisce potenti estensioni al modulo datetime standard
- pytz – Porta il database Olson tz in Python che consente calcoli di fuso orario accurati e multipiattaforma
Consulta le istruzioni di installazione complete per le versioni minime supportate delle dipendenze obbligatorie, consigliate e facoltative.
Installazione da sorgenti
Per installare panda da sorgenti hai bisogno di Cython oltre alle normali dipendenze di cui sopra. Cython può essere installato da PyPI:
pip install cython
nella directory pandas
(la stessa quello in cui hai trovato questo file dopo aver clonato il repository git), esegui:
python setup.py install
o per linstallazione in modalità di sviluppo:
python -m pip install -e . --no-build-isolation --no-use-pep517
Se hai make
, puoi anche utilizzare make develop
per eseguire lo stesso comando.
o in alternativa
python setup.py develop
Vedi le istruzioni complete per linstallazione dai sorgenti.
Licenza
BSD 3
Documentazione
La documentazione ufficiale è ospitata su PyData.org: https://pandas.pydata.org/pandas-docs/stable
Background
Il lavoro su pandas
è iniziato presso AQR (un fondo hedge quantitativo) nel 2008 e ha è in fase di sviluppo attivo da allora.
Ottenere aiuto
Per domande sullutilizzo, il posto migliore dove andare è StackOverflow. Ulteriori domande generali e discus Le sessioni possono anche aver luogo sulla mailing list di pydata.
Discussione e sviluppo
La maggior parte delle discussioni di sviluppo si svolgono su GitHub in questo repository. Inoltre, la mailing list pandas-dev può essere utilizzata anche per discussioni specializzate o problemi di progettazione, ed è disponibile un canale Gitter per domande relative allo sviluppo rapido.
Contribuire ai panda
Tutti i contributi, segnalazioni di bug, correzioni di bug, miglioramenti alla documentazione, miglioramenti e idee sono i benvenuti.
Una panoramica dettagliata su come contribuire può essere trovato nella guida contributiva. Cè anche una panoramica su GitHub.
Se stai semplicemente cercando di iniziare a lavorare con la base di codice panda, vai alla scheda “problemi” di GitHub e inizia a esaminare i problemi interessanti. Ci sono una serie di problemi elencati in Documenti e un buon primo problema da cui potresti iniziare.
Puoi anche valutare i problemi che possono includere la riproduzione di segnalazioni di bug o la richiesta di informazioni vitali come numeri di versione o istruzioni di riproduzione . Se desideri iniziare a identificare i problemi, un modo semplice per iniziare è iscriverti ai panda su CodeTriage.
O forse usando i panda hai unidea tua o stai cercando qualcosa nella documentazione e pensare “questo può essere migliorato” … puoi fare qualcosa al riguardo!
Sentiti libero di fare domande sulla mailing list o su Gitter.
Come contributori e manutentori di questo progetto, ci si aspetta che tu rispetti il codice di condotta dei panda. Ulteriori informazioni sono disponibili allindirizzo: Codice di condotta per i collaboratori