상세 컨텐츠

본문 제목

데이터분석에 파이썬을 활용하는 이유

Python을 활용한 데이터 분석과 시각화

by 본투비곰손 2022. 12. 19. 22:16

본문

728x90

1. 다양한 라이브러리를 활용할 수 있다.

2. 다양한 분야에서 사용되는 인기있는 프로그램 언어이다.

3. 데이터 분산 처리, 머신러닝, 웹개발, 분석 등 다양한 부분에 활용할 수있다.

 

필수 라이브러리의 이해

데이터 수집 : BeautifulSoup, Selenium 등

데이터 저장 : CSV, 엑셀, 데이터베이스에 저장

데이터 분석, 통계 : Numpy, Pandas, Scipy 등

데이터 시각화 : Matplotlib, Seaborn 등

서비스 : Djange, Flask 

 

NumPy (C++로 만들어져있고 Python으로 호출하여 사용한다.)

수치데이터를 다루는 엄청난 방법과 성능을 제공

강력한 다차원 배열(ndarry)

선형대수, 푸리에 변환, 랜덤 넘버 기능 등

pandas가 NumPy를 기반

 

pandas (panel data analysis)

다차원 구조화된 데이터

데이터 분석 라이브러리(데이터 분석, 클리닝, 모델링등)

시작은 금융 데이터 분것을 위해 설계됨

시계열 데이터 기능 통합

R 혹은 Matlab 사용자들이 접근하기 용이함 

 

 

728x90

관련글 더보기