pandas-dev / pandas (日本語)
それは何ですか?
pandasは、高速で柔軟で表現力豊かなデータ構造を提供するPythonパッケージです。 「リレーショナル」または「ラベル付き」データを簡単かつ直感的に操作できるように設計されています。これは、Pythonで実用的な実世界のデータ分析を行うための基本的な高レベルのビルディングブロックになることを目的としています。さらに、あらゆる言語で利用できる最も強力で柔軟なオープンソースのデータ分析/操作ツールになるという幅広い目標があります。すでにこの目標に向かって順調に進んでいます。
主な機能
パンダが得意とすることのほんの一部を次に示します。
- 簡単フローティングポイントでの欠落データ(
NaN
、NA
、またはNaT
として表される)の処理非浮動ポイントデータと同様に - サイズの可変性:列はDataFrameおよび高次元オブジェクトに挿入および削除できます
- 自動および明示的なデータ配置:オブジェクトはラベルのセットに明示的に配置できます、またはユーザーは単にラベルを無視して、
Series
、DataFrame
などが計算でデータを自動的に整列させることができます - データの集約と変換の両方で、データセットに対してplit-apply-combine操作を実行する強力で柔軟なグループ化機能
- 他のPythonおよびNumPyデータ構造内の不規則で異なるインデックスのデータをDataFrameに簡単に変換できるようにしますオブジェクト
- Intelli大規模なデータセットのジェントルラベルベースのスライス、ファンシーインデックス作成、サブセット化
- データセットの直感的なマージと結合
- データセットの柔軟な再形成とピボット
- 軸の階層的ラベル付け(ティックごとに複数のラベルを持つことが可能)
- フラットファイル(CSVおよび区切り)、Excelファイル、データベースからデータをロードし、超高速HDF5形式からデータを保存/ロードするための堅牢なIOツール
- 時系列固有の機能:日付範囲の生成と周波数変換、移動ウィンドウの統計、日付のシフトと遅延
入手先
ソースコードは現在ホストされていますGitHub:https://github.com/pandas-dev/pandas
最新リリースバージョンのバイナリインストーラーは、PythonPackage Index(PyPI)およびCondaで入手できます。
# condaconda install pandas
# or PyPIpip install pandas
依存関係
- NumPy-大規模な多次元配列、行列、および高レベルの数学のサポートを追加しますこれらの配列を操作するcal関数
- python-dateutil-標準のdatetimeモジュールに強力な拡張機能を提供します
- pytz-正確でクロスプラットフォームのタイムゾーン計算を可能にするOlsontzデータベースをPythonに取り込みます
必須、推奨、およびオプションの依存関係のサポートされている最小バージョンについては、完全なインストール手順を参照してください。
ソースからのインストール
ソースからパンダをインストールするには上記の通常の依存関係に加えて、Cythonが必要です。 CythonはPyPIからインストールできます:
pip install cython
pandas
ディレクトリ(同じ) gitリポジトリのクローン作成後にこのファイルが見つかった場合)、次を実行します:
python setup.py install
または開発モードでインストールする場合:
python -m pip install -e . --no-build-isolation --no-use-pep517
make
がある場合は、同じコマンドを実行します。
または代わりに
python setup.py develop
完全な手順を参照してくださいソースからインストールする場合。
ライセンス
BSD 3
ドキュメント
公式ドキュメントはPyData.orgでホストされています:https://pandas.pydata.org/pandas-docs/stable
背景
pandas
の作業は、2008年にAQR(定量的ヘッジファンド)で開始され、それ以来、活発な開発が行われています。
ヘルプの取得
使用法に関する質問については、StackOverflowを参照してください。さらに、一般的な質問とディスカッションsionsはpydataメーリングリストでも行うことができます。
ディスカッションと開発
ほとんどの開発ディスカッションは、このリポジトリのGitHubで行われます。さらに、pandas-devメーリングリストは、専門的なディスカッションや設計の問題にも使用できます。また、開発に関連する迅速な質問にはGitterチャネルを利用できます。
パンダへの貢献
すべての貢献、バグレポート、バグ修正、ドキュメントの改善、機能強化、アイデアを歓迎します。
貢献方法の詳細な概要寄稿ガイドに記載されています。 GitHubの概要もあります。
パンダのコードベースでの作業を開始したいだけの場合は、GitHubの[問題]タブに移動して、興味深い問題の調査を開始してください。ドキュメントの下にリストされている問題がいくつかあり、最初の問題から始めることができます。
バグレポートの複製や、バージョン番号や複製手順などの重要な情報の要求など、問題を切り分けることもできます。 。問題のトリアージを開始したい場合、開始する簡単な方法の1つは、CodeTriageでパンダをサブスクライブすることです。
または、パンダを使用して、独自のアイデアを持っているか、ドキュメントで何かを探しています。そして、「これは改善できる」と考えています…あなたはそれについて何かをすることができます!
メーリングリストまたはGitterで気軽に質問してください。
寄稿者およびメンテナとしてこのプロジェクトでは、パンダの行動規範を遵守することが求められます。詳細については、寄稿者の行動規範
をご覧ください。