Home ✨TIL - 사이드 프로젝트 크롤링 공부
Post
Cancel

✨TIL - 사이드 프로젝트 크롤링 공부



크롤링 공부


오늘은 백엔드끼리 사이드 프로젝트 관련해 회의를 하려했는데
어디서 크롤링을 해올걸인가, 크롤링의 범위에 관련된 이야기를 하게되었다.

그러다보니 자연스럽게 먼저 크롤링에 대한 공부부터 해와야할 것 같았고,
이번 시간에는 항해99 초반에 진행했던
파이썬을 사용해 작성했던 크롤링관련 코드를 다시 살펴보았고,
크롤링에 관한 강의를 찾아서 듣게 되었다.

직점 실습까지 해보니 어디까지 가능할까에 대한 고민도 했고,
기간에 대한 고민도 하게되었다.

일단 네이버 뉴스에 IT관련된 내용을 일주일 단위로 크롤링 하자는 계획을 세웠다.

강의를 보고 따라하니 엑셀과 구글시트에 내용을 저장할 수 있는 정도까지 따라할 수 있었다.
보통 클래스명으로 가져오게 되는데
띄어쓰기가 있거나 형식이 좀 이상한(?) 클래스 명을 가진 부분은
크롤링이 되지 않았다..
조금 더 알아보고 범위를 수정하던가, 추가할 수 있는 방법들을 더 찾아보아야 할 것 같다.



This post is licensed under CC BY 4.0 by the author.