pandas-dev / pandas (Italiano)

Che cosè?

pandas è un pacchetto Python che fornisce strutture dati veloci, flessibili ed espressive progettato per rendere il lavoro con dati “relazionali” o “etichettati” sia facile che intuitivo. Vuole essere lelemento fondamentale di alto livello per eseguire analisi pratiche e reali dei dati in Python. Inoltre, ha lobiettivo più ampio di diventare lo strumento di analisi / manipolazione dei dati open source più potente e flessibile disponibile in qualsiasi lingua. È già sulla buona strada per raggiungere questo obiettivo.

Caratteristiche principali

Ecco solo alcune delle cose che i panda fanno bene:

  • Facile gestione dei dati mancanti (rappresentati come NaN, NA o NaT) in virgola mobile così come i dati in virgola mobile
  • Modifica delle dimensioni: le colonne possono essere inserite ed eliminate da DataFrame e oggetti dimensionali superiori
  • Allineamento dati automatico ed esplicito: gli oggetti possono essere allineati esplicitamente a un insieme di etichette oppure lutente può semplicemente ignorare le etichette e lasciare che Series, DataFrame e così via allinei automaticamente i dati nei calcoli
  • Funzionalità gruppo per potente e flessibile per eseguire operazioni di suddivisione-applicazione-combinazione su set di dati, sia per laggregazione che per la trasformazione dei dati
  • Semplifica la conversione di dati frammentati e indicizzati in modo diverso in altre strutture di dati Python e NumPy in DataFrame oggetti
  • Intelli affettamento basato su etichette gent, indicizzazione fantasia e sottoinsieme di grandi set di dati
  • Unione e unione intuitive di set di dati
  • Rimodellamento flessibile e rotazione di set di dati
  • Etichettatura gerarchica degli assi ( possibile avere etichette multiple per tick)
  • Strumenti IO robusti per caricare dati da file flat (CSV e delimitati), file Excel, database e salvare / caricare dati dal formato ultraveloce HDF5
  • Funzionalità specifiche per serie temporali: generazione di intervalli di date e conversione di frequenza, statistiche sulla finestra mobile, spostamento e ritardo della data

Dove trovarla

Il codice sorgente è attualmente ospitato su GitHub su: https://github.com/pandas-dev/pandas

I programmi di installazione binari per lultima versione rilasciata sono disponibili su PythonPackage Index (PyPI) e su Conda.

# condaconda install pandas

# or PyPIpip install pandas

Dipendenze

  • NumPy – Aggiunge il supporto per array, matrici e matematiche di alto livello multidimensionali di grandi dimensioni funzioni cal per operare su questi array
  • python-dateutil – Fornisce potenti estensioni al modulo datetime standard
  • pytz – Porta il database Olson tz in Python che consente calcoli di fuso orario accurati e multipiattaforma

Consulta le istruzioni di installazione complete per le versioni minime supportate delle dipendenze obbligatorie, consigliate e facoltative.

Installazione da sorgenti

Per installare panda da sorgenti hai bisogno di Cython oltre alle normali dipendenze di cui sopra. Cython può essere installato da PyPI:

pip install cython

nella directory pandas (la stessa quello in cui hai trovato questo file dopo aver clonato il repository git), esegui:

python setup.py install

o per linstallazione in modalità di sviluppo:

python -m pip install -e . --no-build-isolation --no-use-pep517

Se hai make, puoi anche utilizzare make develop per eseguire lo stesso comando.

o in alternativa

python setup.py develop

Vedi le istruzioni complete per linstallazione dai sorgenti.

Licenza

BSD 3

Documentazione

La documentazione ufficiale è ospitata su PyData.org: https://pandas.pydata.org/pandas-docs/stable

Background

Il lavoro su pandas è iniziato presso AQR (un fondo hedge quantitativo) nel 2008 e ha è in fase di sviluppo attivo da allora.

Ottenere aiuto

Per domande sullutilizzo, il posto migliore dove andare è StackOverflow. Ulteriori domande generali e discus Le sessioni possono anche aver luogo sulla mailing list di pydata.

Discussione e sviluppo

La maggior parte delle discussioni di sviluppo si svolgono su GitHub in questo repository. Inoltre, la mailing list pandas-dev può essere utilizzata anche per discussioni specializzate o problemi di progettazione, ed è disponibile un canale Gitter per domande relative allo sviluppo rapido.

Contribuire ai panda

Tutti i contributi, segnalazioni di bug, correzioni di bug, miglioramenti alla documentazione, miglioramenti e idee sono i benvenuti.

Una panoramica dettagliata su come contribuire può essere trovato nella guida contributiva. Cè anche una panoramica su GitHub.

Se stai semplicemente cercando di iniziare a lavorare con la base di codice panda, vai alla scheda “problemi” di GitHub e inizia a esaminare i problemi interessanti. Ci sono una serie di problemi elencati in Documenti e un buon primo problema da cui potresti iniziare.

Puoi anche valutare i problemi che possono includere la riproduzione di segnalazioni di bug o la richiesta di informazioni vitali come numeri di versione o istruzioni di riproduzione . Se desideri iniziare a identificare i problemi, un modo semplice per iniziare è iscriverti ai panda su CodeTriage.

O forse usando i panda hai unidea tua o stai cercando qualcosa nella documentazione e pensare “questo può essere migliorato” … puoi fare qualcosa al riguardo!

Sentiti libero di fare domande sulla mailing list o su Gitter.

Come contributori e manutentori di questo progetto, ci si aspetta che tu rispetti il codice di condotta dei panda. Ulteriori informazioni sono disponibili allindirizzo: Codice di condotta per i collaboratori

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *