학습 목표
- 파이썬의 탐색적 데이터 분석과 관련된 도구에 대해 알아봅니다.
핵심 키워드
- 수치 계산을 위한 numpy
- 데이터 분석을 위한 pandas
- pandas의 DataFrame, Series
- 데이터 시각화를 위한 matplotlib, seaborn
학습하기
학습 목표
- 파이썬의 탐색적 데이터 분석과 관련된 도구에 대해 알아봅니다.
핵심 키워드
- 수치 계산을 위한 numpy
- 데이터 분석을 위한 pandas
- pandas의 DataFrame, Series
- 데이터 시각화를 위한 matplotlib, seaborn
학습하기
학습 내용
파이썬의 탐색적 데이터 분석과 관련된 도구에 대해 알아봅니다.
수치 계산을 위한 numpy 는 파이썬의 대표적인 수치계산 도구로 다차원 행렬의 연산을 제공합니다. 내부가 C로 되어 있기 때문에 속도가 빠르며 파이썬의 쉬운 인터페이스를 사용할 수 있는 도구입니다. 대부분의 파이썬 데이터 사이언스 도구들은 NumPy로 만들어져 있습니다. Pandas, Scikit-learn, TensorFlow, PyTorch 등이 대표적인 사례 입니다.
데이터 분석을 위한 pandas는 파이썬의 대표적인 데이터 분석 도구 입니다. 행과 열로 된 2차원 행렬구조를 다루기에 적합한 도구로 데이터 분석과 시각화를 지원합니다. 엑셀과 유사한 형태의 DataFrame과 1차원 리스트 형태의 Series는 판다스를 이해하기 위한 가장 중요한 포인트 입니다.
파이썬의 대표적인 정적인 데이터 시각화 도구는 matplotlib 입니다.matplotlib은 시각화 하고자 하는 거의 대부분의 시각화를 구현할 수 있지만 사용법이 복잡합니다. matplotlib을 좀 더 사용하기 쉽게 고수준의 인터페이스를 제공하고 있는 시각화 도구는 seaborn 입니다. seaborn 을 통해 쉽게 시각화를 해볼 수 있습니다.
https://ko.wikipedia.org
https://numpy.org
https://pandas.pydata.org
https://seaborn.pydata.org