pandas-dev / pandas (Français)
Quest-ce que cest?
pandas est un package Python qui fournit des structures de données rapides, flexibles et expressives conçu pour rendre le travail avec des données «relationnelles» ou «étiquetées» à la fois simple et intuitif. Il vise à être le bloc de construction fondamental de haut niveau pour effectuer une analyse de données pratique et réelle en Python. De plus, il a pour objectif plus large de devenir loutil danalyse / manipulation de données open source le plus puissant et le plus flexible disponible dans nimporte quelle langue. Il est déjà bien parti pour atteindre cet objectif.
Caractéristiques principales
Voici quelques-unes des choses que les pandas font bien:
- Facile traitement des données manquantes (représentées par
NaN
,NA
ouNaT
) en virgule flottante ainsi que des données à virgule non flottante - Mutabilité de taille: les colonnes peuvent être insérées et supprimées de DataFrame et dobjets de dimension supérieure
- Alignement de données automatique et explicite: les objets peuvent être explicitement alignés sur un ensemble détiquettes , ou lutilisateur peut simplement ignorer les étiquettes et laisser
Series
,DataFrame
, etc. aligner automatiquement les données pour vous dans les calculs - Fonctionnalité group by puissante et flexible pour effectuer des opérations de fractionnement-appliquer-combiner sur des ensembles de données, à la fois pour lagrégation et la transformation de données
- Facilitez la conversion de données irrégulières et différemment indexées dans dautres structures de données Python et NumPy en DataFrame objets
- Intelli tranchage basé sur les étiquettes, indexation fantaisie et sous-ensemble densembles de données volumineux
- Fusion et jonction intuitives densembles de données
- Remodelage et pivotement flexibles densembles de données
- Étiquetage hiérarchique des axes ( possibilité davoir plusieurs étiquettes par graduation)
- Des outils dE / S robustes pour charger des données à partir de fichiers plats (CSV et délimités), de fichiers Excel, de bases de données et de sauvegarde / chargement de données à partir du format ultra-rapide HDF5
- Fonctionnalité spécifique aux séries chronologiques: génération de plage de dates et conversion de fréquence, statistiques de fenêtre mobile, décalage et décalage de date
Où lobtenir
Le code source est actuellement hébergé sur GitHub à ladresse: https://github.com/pandas-dev/pandas
Les programmes dinstallation binaires pour la dernière version publiée sont disponibles dans PythonPackage Index (PyPI) et sur Conda.
# condaconda install pandas
# or PyPIpip install pandas
Dépendances
- NumPy – Ajoute la prise en charge des grands tableaux multidimensionnels, des matrices et des mathématiques de haut niveau fonctions cal pour opérer sur ces tableaux
- python-dateutil – Fournit de puissantes extensions au module datetime standard
- pytz – Amène la base de données Olson tz dans Python qui permet des calculs de fuseau horaire précis et multiplateformes
Consultez les instructions dinstallation complètes pour connaître les versions minimales prises en charge des dépendances obligatoires, recommandées et facultatives.
Installation à partir des sources
Pour installer les pandas à partir des sources vous avez besoin de Cython en plus des dépendances normales ci-dessus. Cython peut être installé à partir de PyPI:
pip install cython
Dans le répertoire pandas
(même celui où vous avez trouvé ce fichier après le clonage du dépôt git), exécutez:
python setup.py install
ou pour linstallation en mode développement:
python -m pip install -e . --no-build-isolation --no-use-pep517
Si vous avez make
, vous pouvez également utiliser make develop
pour exécuter la même commande.
ou bien
python setup.py develop
Voir les instructions complètes pour linstallation à partir des sources.
Licence
BSD 3
Documentation
La documentation officielle est hébergée sur PyData.org: https://pandas.pydata.org/pandas-docs/stable
Contexte
Les travaux sur pandas
ont commencé chez AQR (un fonds de couverture quantitatif) en 2008 et depuis lors.
Obtenir de l’aide
Pour les questions d’utilisation, le meilleur endroit où aller est StackOverflow. sions peuvent aussi avoir lieu sur la liste de diffusion pydata.
Discussion et développement
La plupart des discussions de développement ont lieu sur GitHub dans ce dépôt. De plus, la liste de diffusion pandas-dev peut également être utilisée pour des discussions spécialisées ou des problèmes de conception, et un canal Gitter est disponible pour les questions liées au développement rapide.
Contribuer aux pandas
Toutes les contributions, rapports de bogues, corrections de bogues, améliorations de la documentation, améliorations et idées sont les bienvenus.
Un aperçu détaillé de la façon de contribuer peuvent être trouvés dans le guide de contribution. Il y a aussi une vue densemble sur GitHub.
Si vous cherchez simplement à commencer à travailler avec la base de code pandas, accédez à longlet « problèmes » de GitHub et commencez à examiner les problèmes intéressants. Il existe un certain nombre de problèmes répertoriés sous Docs et un bon premier problème où vous pouvez commencer.
Vous pouvez également trier les problèmes qui peuvent inclure la reproduction de rapports de bogue ou la demande dinformations vitales telles que les numéros de version ou les instructions de reproduction . Si vous souhaitez commencer à trier les problèmes, un moyen simple de commencer est de vous abonner aux pandas sur CodeTriage.
Ou peut-être en utilisant des pandas vous avez une idée de votre choix ou cherchez quelque chose dans la documentation et en pensant que « cela peut être amélioré » … vous pouvez faire quelque chose!
Nhésitez pas à poser des questions sur la liste de diffusion ou sur Gitter.
En tant que contributeurs et mainteneurs de ce projet, vous devez respecter le code de conduite des pandas. Pour plus d’informations, consultez: Code de conduite des contributeurs