Data Crawling

2018, Aug 19    

파이썬으로 data crawling 하기

1. Selenium: 웹에서 원하는 데이터를 가져올 수 있도록 웹브라우저를 컨드롤 할 수 있게 해주는 도구

2. Pandas: 파이썬 데이터를 엑셀처럼 사용할 수 있음 (정렬, 피벗, 검색 등)

3. BeautifulSoup: html 문서를 파싱해서 원하는 데이터를 뽑아낼 수 있음

위 3가지 도구를 사용하면 거의 모든 데이터의 크롤링이 가능하다!

파이썬 데이터 주무르기(책)의 실습 참고: https://github.com/DaJeong-Lee/dataScience-python/blob/master/source/3%EC%9E%A5.%EC%8B%9C%EC%B9%B4%EA%B3%A0%EC%83%8C%EB%93%9C%EC%9C%84%EC%B9%98%EB%A7%9B%EC%A7%91%EB%B6%84%EC%84%9D.ipynb