1. 다양한 라이브러리를 활용할 수 있다.
2. 다양한 분야에서 사용되는 인기있는 프로그램 언어이다.
3. 데이터 분산 처리, 머신러닝, 웹개발, 분석 등 다양한 부분에 활용할 수있다.
필수 라이브러리의 이해
데이터 수집 : BeautifulSoup, Selenium 등
데이터 저장 : CSV, 엑셀, 데이터베이스에 저장
데이터 분석, 통계 : Numpy, Pandas, Scipy 등
데이터 시각화 : Matplotlib, Seaborn 등
서비스 : Djange, Flask
NumPy (C++로 만들어져있고 Python으로 호출하여 사용한다.)
수치데이터를 다루는 엄청난 방법과 성능을 제공
강력한 다차원 배열(ndarry)
선형대수, 푸리에 변환, 랜덤 넘버 기능 등
pandas가 NumPy를 기반
pandas (panel data analysis)
다차원 구조화된 데이터
데이터 분석 라이브러리(데이터 분석, 클리닝, 모델링등)
시작은 금융 데이터 분것을 위해 설계됨
시계열 데이터 기능 통합
R 혹은 Matlab 사용자들이 접근하기 용이함
DataFrame 다루기 (0) | 2022.12.29 |
---|---|
데이터 분석을 위한 라이브러리 2(Pandas) (0) | 2022.12.20 |
데이터 분석을 위한 라이브러리 1(Numpy) (0) | 2022.12.19 |