pandas-dev / pandas (Español)
¿Qué es?
pandas es un paquete de Python que proporciona estructuras de datos rápidas, flexibles y expresivas diseñado para hacer que trabajar con datos «relacionales» o «etiquetados» sea fácil e intuitivo. Su objetivo es ser el bloque de construcción fundamental de alto nivel para realizar análisis de datos prácticos del mundo real en Python. Además, tiene el objetivo más amplio de convertirse en la herramienta de análisis / manipulación de datos de código abierto más potente y flexible disponible en cualquier idioma. Ya está en camino hacia este objetivo.
Características principales
Estas son solo algunas de las cosas que los pandas hacen bien:
- Fácil manejo de datos faltantes (representados como
NaN
,NA
oNaT
) en punto flotante así como datos no de punto flotante - Mutabilidad de tamaño: las columnas se pueden insertar y eliminar de DataFrame y objetos de dimensiones superiores
- Alineación de datos automática y explícita: los objetos se pueden alinear explícitamente a un conjunto de etiquetas , o el usuario puede simplemente ignorar las etiquetas y dejar que
Series
,DataFrame
, etc.alineen automáticamente los datos para usted en los cálculos - Potente y flexible grupo por funcionalidad para realizar operaciones dividir-aplicar-combinar en conjuntos de datos, tanto para agregar como para transformar datos
- Facilite la conversión de datos irregulares e indexados de manera diferente en otras estructuras de datos Python y NumPy en DataFrame objetos
- Intelli segmentación, indexación elegante y subconjunto de grandes conjuntos de datos basados en etiquetas inteligentes
- Fusión y unión intuitivas de conjuntos de datos
- Reforma flexible y pivotación de conjuntos de datos
- Etiquetado jerárquico de ejes ( posible tener varias etiquetas por tick)
- Herramientas de E / S robustas para cargar datos de archivos planos (CSV y delimitados), archivos de Excel, bases de datos y guardar / cargar datos desde el formato ultrarrápido HDF5
- Funcionalidad específica de series de tiempo: generación de rango de fechas y conversión de frecuencia, estadísticas de ventana móvil, cambio de fecha y retraso
Dónde conseguirlo
El código fuente está actualmente alojado en GitHub en: https://github.com/pandas-dev/pandas
Los instaladores binarios para la última versión publicada están disponibles en PythonPackage Index (PyPI) y en Conda.
# condaconda install pandas
# or PyPIpip install pandas
Dependencias
- NumPy – Agrega soporte para matrices, matrices y matemáticas de alto nivel grandes y multidimensionales funciones cal para operar en estos arreglos
- python-dateutil – Proporciona poderosas extensiones al módulo de fecha y hora estándar
- pytz – Trae la base de datos Olson tz a Python, lo que permite cálculos precisos y de zonas horarias entre plataformas
Consulte las instrucciones de instalación completas para conocer las versiones mínimas admitidas de las dependencias requeridas, recomendadas y opcionales.
Instalación desde fuentes
Para instalar pandas desde fuentes necesita Cython además de las dependencias normales anteriores. Cython se puede instalar desde PyPI:
pip install cython
En el directorio pandas
(el mismo uno donde encontró este archivo después de clonar el repositorio de git), ejecute:
python setup.py install
o para instalar en modo de desarrollo:
python -m pip install -e . --no-build-isolation --no-use-pep517
Si tiene make
, también puede usar make develop
para ejecutar el mismo comando.
o alternativamente
python setup.py develop
Consulte las instrucciones completas para instalar desde la fuente.
Licencia
BSD 3
Documentación
La documentación oficial está alojada en PyData.org: https://pandas.pydata.org/pandas-docs/stable
Antecedentes
El trabajo en pandas
comenzó en AQR (un fondo de cobertura cuantitativo) en 2008 y ha estado en desarrollo activo desde entonces.
Obtención de ayuda
Para preguntas de uso, el mejor lugar para ir es StackOverflow. Además, preguntas generales y discusiones Las discusiones también pueden tener lugar en la lista de correo de pydata.
Discusión y desarrollo
La mayoría de las discusiones de desarrollo tienen lugar en GitHub en este repositorio. Además, la lista de correo de pandas-dev también se puede usar para discusiones especializadas o problemas de diseño, y hay un canal de Gitter disponible para preguntas relacionadas con el desarrollo rápido.
Contribuir a los pandas
Todas las contribuciones, informes de errores, correcciones de errores, mejoras de documentación, mejoras e ideas son bienvenidas.
Una descripción detallada sobre cómo contribuir se puede encontrar en la guía de contribuciones. También hay una descripción general de GitHub.
Si simplemente está buscando comenzar a trabajar con el código base de pandas, navegue hasta la pestaña «problemas» de GitHub y comience a buscar problemas interesantes. Hay una serie de problemas enumerados en Documentos y un buen primer número por el que puede comenzar.
También puede clasificar los problemas que pueden incluir la reproducción de informes de errores o la solicitud de información vital como números de versión o instrucciones de reproducción . Si desea comenzar a clasificar los problemas, una manera fácil de comenzar es suscribirse a pandas en CodeTriage.
O tal vez mediante el uso de pandas tenga una idea propia o esté buscando algo en la documentación y pensando esto se puede mejorar … ¡puedes hacer algo al respecto!
No dudes en hacer preguntas en la lista de correo o en Gitter.
Como contribuyentes y mantenedores de este proyecto, se espera que cumpla con el código de conducta de los pandas. Puede encontrar más información en: Código de conducta para colaboradores