pandas-dev / pandas (한국어)
무엇입니까?
pandas는 빠르고 유연하며 표현력이 풍부한 데이터 구조를 제공하는 Python 패키지입니다. “관계형”또는 “레이블이있는”데이터 작업을 쉽고 직관적으로 할 수 있도록 설계되었습니다. 이는 Python에서 실제적인 실제 데이터 분석을 수행하기위한 기본 고수준 빌딩 블록이되는 것을 목표로합니다. 또한 모든 언어에서 사용할 수있는 가장 강력하고 유연한 오픈 소스 데이터 분석 / 조작 도구가되는 더 광범위한 목표를 가지고 있습니다. 이미이 목표를 향해 나아가고 있습니다.
주요 기능
다음은 Pandas가 잘하는 몇 가지 기능입니다.
- 쉬움 부동 소수점에서 누락 된 데이터 처리 (
NaN
,NA
또는NaT
로 표시) 비 부동 소수점 데이터 - 크기 가변성 : DataFrame 및 상위 차원 개체에서 열 삽입 및 삭제 가능
- 자동 및 명시 적 데이터 정렬 : 개체를 레이블 집합에 명시 적으로 정렬 할 수 있음 또는 사용자가 레이블을 무시하고
Series
,DataFrame
등이 계산시 데이터를 자동으로 정렬하도록 할 수 있습니다. - 데이터 집합에 대해 plit-apply-combine 작업을 수행하는 강력하고 유연한 기능별 그룹화, 데이터 집계 및 변환
- 다른 Python 및 NumPy 데이터 구조의 비정형, 다른 인덱스 데이터를 DataFrame으로 쉽게 변환 개체
- Intelli 레이블 기반 분할, 팬시 인덱싱 및 대규모 데이터 세트의 부분 집합 화
- 직관적 인 데이터 세트 병합 및 결합
- 데이터 세트의 유연한 재구성 및 피벗
- 축의 계층 적 레이블 지정 ( 틱당 여러 레이블을 가질 수 있음)
- 플랫 파일 (CSV 및 구분), Excel 파일, 데이터베이스에서 데이터를로드하고 초고속 HDF5 형식의 데이터 저장 /로드를위한 강력한 IO 도구
- 시계열 별 기능 : 날짜 범위 생성 및 빈도 변환, 이동 기간 통계, 날짜 이동 및 지연
얻을 수있는 위치
소스 코드는 현재 호스팅됩니다. GitHub : https://github.com/pandas-dev/pandas
최신 출시 버전 용 바이너리 설치 프로그램은 PythonPackage Index (PyPI) 및 Conda에서 사용할 수 있습니다.
# condaconda install pandas
# or PyPIpip install pandas
종속성
- NumPy- 대형 다차원 배열, 행렬 및 고수준 수학에 대한 지원 추가 이러한 배열에서 작동하는 cal 함수
- python-dateutil-표준 datetime 모듈에 대한 강력한 확장을 제공합니다.
- pytz-정확하고 교차 플랫폼 시간대 계산을 허용하는 Python으로 Olson tz 데이터베이스를 가져옵니다.
최소 지원 버전의 필수, 권장 및 선택적 종속성에 대한 전체 설치 지침을 참조하세요.
소스에서 설치
소스에서 pandas를 설치하려면 위의 일반적인 종속성 외에도 Cython이 필요합니다. Cython은 PyPI에서 설치할 수 있습니다.
pip install cython
pandas
디렉터리 (동일 git 저장소를 복제 한 후이 파일을 찾은 위치), 다음을 실행합니다.
python setup.py install
또는 개발 모드에서 설치 :
python -m pip install -e . --no-build-isolation --no-use-pep517
make
가있는 경우 를 클릭하여 동일한 명령을 실행합니다.
또는
python setup.py develop
전체 지침보기 소스에서 설치할 수 있습니다.
라이선스
BSD 3
문서
공식 문서는 PyData.org에서 호스팅됩니다 : https://pandas.pydata.org/pandas-docs/stable
배경
2008 년 AQR (양적 헤지 펀드)에서 시작된 pandas
작업 그 이후로 활발하게 개발되었습니다.
도움말 얻기
사용 관련 질문의 경우 가장 좋은 곳은 StackOverflow입니다. 더 나아가 일반적인 질문과 토론 sions는 pydata 메일 링리스트에서도 열릴 수 있습니다.
토론 및 개발
대부분의 개발 토론은이 저장소의 GitHub에서 이루어집니다. 또한 pandas-dev 메일 링리스트는 전문적인 토론이나 디자인 문제에도 사용할 수 있으며 Gitter 채널은 빠른 개발 관련 질문에 사용할 수 있습니다.
pandas에 기여
모든 기여, 버그 보고서, 버그 수정, 문서 개선, 개선 사항 및 아이디어를 환영합니다.
기여 방법에 대한 자세한 개요 기여 가이드에서 찾을 수 있습니다. GitHub에 대한 개요도 있습니다.
단순히 Pandas 코드베이스 작업을 시작하려는 경우 GitHub “문제”탭으로 이동하여 흥미로운 문제를 살펴보세요. 문서 아래에 나열된 여러 문제와 시작할 수있는 좋은 첫 번째 문제가 있습니다.
버그 보고서를 재현하거나 버전 번호 또는 재현 지침과 같은 중요한 정보를 요청하는 문제를 분류 할 수도 있습니다. . 문제 분류를 시작하려면 CodeTriage에서 pandas를 구독하는 쉬운 방법 중 하나가 있습니다.
또는 Pandas를 사용하여 자신 만의 아이디어가 있거나 문서에서 뭔가를 찾고있을 수도 있습니다. 이것이 개선 될 수 있습니다라고 생각하면 … 뭔가 할 수 있습니다!
메일 링리스트 나 Gitter에 자유롭게 질문하십시오.
기고자 및 관리자로서 이 프로젝트를 진행하려면 Pandas 행동 강령을 준수해야합니다. 자세한 내용은 다음에서 확인할 수 있습니다. Contributor Code of Conduct