pandas-dev / pandas (Português)
O que é?
pandas é um pacote Python que fornece estruturas de dados rápidas, flexíveis e expressivas projetado para tornar o trabalho com dados “relacionais” ou “rotulados” fácil e intuitivo. Ele tem como objetivo ser o bloco de construção fundamental de alto nível para a análise prática de dados do mundo real em Python. Além disso, tem o objetivo mais amplo de se tornar a ferramenta de análise / manipulação de dados de código aberto mais poderosa e flexível disponível em qualquer idioma. Já está no caminho certo para atingir esse objetivo.
Principais recursos
Aqui estão apenas algumas das coisas que o pandas faz bem:
- Fácil tratamento de dados ausentes (representados como
NaN
,NA
ouNaT
) em ponto flutuante bem como dados de ponto não flutuante - Mutabilidade de tamanho: colunas podem ser inseridas e excluídas de DataFrame e objetos dimensionais superiores
- Alinhamento de dados automático e explícito: os objetos podem ser explicitamente alinhados a um conjunto de rótulos , ou o usuário pode simplesmente ignorar os rótulos e deixar
Series
,DataFrame
etc. alinhar automaticamente os dados para você nos cálculos - Grupo poderoso e flexível por funcionalidade para realizar operações dividir-aplicar-combinar em conjuntos de dados, para agregar e transformar dados
- Facilite a conversão de dados irregulares e indexados de forma diferente em outras estruturas de dados Python e NumPy em DataFrame objetos
- Intelli Fatiamento baseado em rótulo gentil, indexação extravagante e subconjunto de grandes conjuntos de dados
- Combinação e junção intuitiva de conjuntos de dados
- Remodelagem flexível e dinamização de conjuntos de dados
- Rotulagem hierárquica de eixos ( possível ter vários rótulos por tick)
- Ferramentas robustas de IO para carregar dados de arquivos simples (CSV e delimitados), arquivos Excel, bancos de dados e salvar / carregar dados do formato HDF5 ultrarrápido
- Funcionalidade específica de série temporal: geração de faixa de data e conversão de frequência, estatísticas de janela móvel, mudança de data e atraso
Onde obtê-lo
O código-fonte está atualmente hospedado em GitHub em: https://github.com/pandas-dev/pandas
Instaladores binários para a última versão lançada estão disponíveis no PythonPackage Index (PyPI) e no Conda.
# condaconda install pandas
# or PyPIpip install pandas
Dependências
- NumPy – Adiciona suporte para grandes arrays multidimensionais, matrizes e matemati de alto nível funções cal para operar nesses arrays
- python-dateutil – Fornece extensões poderosas para o módulo datetime padrão
- pytz – Traz o banco de dados Olson tz para Python, que permite cálculos de fuso-horário precisos e multiplataforma
Veja as instruções de instalação completas para as versões mínimas suportadas das dependências obrigatórias, recomendadas e opcionais.
Instalação das fontes
Para instalar o pandas da fonte você precisa do Cython além das dependências normais acima. Cython pode ser instalado a partir do PyPI:
pip install cython
No diretório pandas
(mesmo aquele onde você encontrou este arquivo após clonar o repositório git), execute:
python setup.py install
ou para instalar no modo de desenvolvimento:
python -m pip install -e . --no-build-isolation --no-use-pep517
Se você tiver make
, também pode usar make develop
para executar o mesmo comando.
ou alternativamente
python setup.py develop
Veja as instruções completas para instalação a partir da fonte.
Licença
BSD 3
Documentação
A documentação oficial está hospedada em PyData.org: https://pandas.pydata.org/pandas-docs/stable
Histórico
O trabalho em pandas
começou na AQR (um fundo de hedge quantitativo) em 2008 e já esteve em desenvolvimento ativo desde então.
Obtendo ajuda
Para questões de uso, o melhor lugar para ir é StackOverflow. Além disso, questões gerais e discussões sões também podem ocorrer na lista de discussão pydata.
Discussão e desenvolvimento
A maioria das discussões de desenvolvimento ocorre no GitHub neste repo. Além disso, a lista de discussão do pandas-dev também pode ser usada para discussões especializadas ou problemas de design, e um canal do Gitter está disponível para questões relacionadas ao desenvolvimento rápido.
Contribuindo com o pandas
Todas as contribuições, relatórios de bugs, correções de bugs, melhorias na documentação, aprimoramentos e ideias são bem-vindos.
Uma visão geral detalhada sobre como contribuir pode ser encontrado no guia de contribuição. Também há uma visão geral do GitHub.
Se você está apenas procurando começar a trabalhar com a base de código do pandas, navegue até a guia “problemas” do GitHub e comece a procurar por questões interessantes. Há uma série de problemas listados em Google Docs e um bom primeiro problema por onde você pode começar.
Você também pode fazer a triagem de problemas que podem incluir a reprodução de relatórios de bug ou solicitar informações vitais, como números de versão ou instruções de reprodução . Se você gostaria de começar a triagem de problemas, uma maneira fácil de começar é inscrevendo-se no pandas no CodeTriage.
Ou talvez usando os pandas você tenha uma ideia própria ou esteja procurando algo na documentação e pensando isso pode ser melhorado … você pode fazer algo sobre isso!
Sinta-se à vontade para fazer perguntas na lista de discussão ou no Gitter.
Como contribuidores e mantenedores do neste projeto, espera-se que você cumpra o código de conduta do pandas. Mais informações podem ser encontradas em: Código de conduta do colaborador