pandas-dev / pandas (Português)

O que é?

pandas é um pacote Python que fornece estruturas de dados rápidas, flexíveis e expressivas projetado para tornar o trabalho com dados “relacionais” ou “rotulados” fácil e intuitivo. Ele tem como objetivo ser o bloco de construção fundamental de alto nível para a análise prática de dados do mundo real em Python. Além disso, tem o objetivo mais amplo de se tornar a ferramenta de análise / manipulação de dados de código aberto mais poderosa e flexível disponível em qualquer idioma. Já está no caminho certo para atingir esse objetivo.

Principais recursos

Aqui estão apenas algumas das coisas que o pandas faz bem:

  • Fácil tratamento de dados ausentes (representados como NaN, NA ou NaT) em ponto flutuante bem como dados de ponto não flutuante
  • Mutabilidade de tamanho: colunas podem ser inseridas e excluídas de DataFrame e objetos dimensionais superiores
  • Alinhamento de dados automático e explícito: os objetos podem ser explicitamente alinhados a um conjunto de rótulos , ou o usuário pode simplesmente ignorar os rótulos e deixar Series, DataFrame etc. alinhar automaticamente os dados para você nos cálculos
  • Grupo poderoso e flexível por funcionalidade para realizar operações dividir-aplicar-combinar em conjuntos de dados, para agregar e transformar dados
  • Facilite a conversão de dados irregulares e indexados de forma diferente em outras estruturas de dados Python e NumPy em DataFrame objetos
  • Intelli Fatiamento baseado em rótulo gentil, indexação extravagante e subconjunto de grandes conjuntos de dados
  • Combinação e junção intuitiva de conjuntos de dados
  • Remodelagem flexível e dinamização de conjuntos de dados
  • Rotulagem hierárquica de eixos ( possível ter vários rótulos por tick)
  • Ferramentas robustas de IO para carregar dados de arquivos simples (CSV e delimitados), arquivos Excel, bancos de dados e salvar / carregar dados do formato HDF5 ultrarrápido
  • Funcionalidade específica de série temporal: geração de faixa de data e conversão de frequência, estatísticas de janela móvel, mudança de data e atraso

Onde obtê-lo

O código-fonte está atualmente hospedado em GitHub em: https://github.com/pandas-dev/pandas

Instaladores binários para a última versão lançada estão disponíveis no PythonPackage Index (PyPI) e no Conda.

# condaconda install pandas

# or PyPIpip install pandas

Dependências

  • NumPy – Adiciona suporte para grandes arrays multidimensionais, matrizes e matemati de alto nível funções cal para operar nesses arrays
  • python-dateutil – Fornece extensões poderosas para o módulo datetime padrão
  • pytz – Traz o banco de dados Olson tz para Python, que permite cálculos de fuso-horário precisos e multiplataforma

Veja as instruções de instalação completas para as versões mínimas suportadas das dependências obrigatórias, recomendadas e opcionais.

Instalação das fontes

Para instalar o pandas da fonte você precisa do Cython além das dependências normais acima. Cython pode ser instalado a partir do PyPI:

pip install cython

No diretório pandas (mesmo aquele onde você encontrou este arquivo após clonar o repositório git), execute:

python setup.py install

ou para instalar no modo de desenvolvimento:

python -m pip install -e . --no-build-isolation --no-use-pep517

Se você tiver make, também pode usar make develop para executar o mesmo comando.

ou alternativamente

python setup.py develop

Veja as instruções completas para instalação a partir da fonte.

Licença

BSD 3

Documentação

A documentação oficial está hospedada em PyData.org: https://pandas.pydata.org/pandas-docs/stable

Histórico

O trabalho em pandas começou na AQR (um fundo de hedge quantitativo) em 2008 e já esteve em desenvolvimento ativo desde então.

Obtendo ajuda

Para questões de uso, o melhor lugar para ir é StackOverflow. Além disso, questões gerais e discussões sões também podem ocorrer na lista de discussão pydata.

Discussão e desenvolvimento

A maioria das discussões de desenvolvimento ocorre no GitHub neste repo. Além disso, a lista de discussão do pandas-dev também pode ser usada para discussões especializadas ou problemas de design, e um canal do Gitter está disponível para questões relacionadas ao desenvolvimento rápido.

Contribuindo com o pandas

Todas as contribuições, relatórios de bugs, correções de bugs, melhorias na documentação, aprimoramentos e ideias são bem-vindos.

Uma visão geral detalhada sobre como contribuir pode ser encontrado no guia de contribuição. Também há uma visão geral do GitHub.

Se você está apenas procurando começar a trabalhar com a base de código do pandas, navegue até a guia “problemas” do GitHub e comece a procurar por questões interessantes. Há uma série de problemas listados em Google Docs e um bom primeiro problema por onde você pode começar.

Você também pode fazer a triagem de problemas que podem incluir a reprodução de relatórios de bug ou solicitar informações vitais, como números de versão ou instruções de reprodução . Se você gostaria de começar a triagem de problemas, uma maneira fácil de começar é inscrevendo-se no pandas no CodeTriage.

Ou talvez usando os pandas você tenha uma ideia própria ou esteja procurando algo na documentação e pensando isso pode ser melhorado … você pode fazer algo sobre isso!

Sinta-se à vontade para fazer perguntas na lista de discussão ou no Gitter.

Como contribuidores e mantenedores do neste projeto, espera-se que você cumpra o código de conduta do pandas. Mais informações podem ser encontradas em: Código de conduta do colaborador

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *