[Node.js] Crawling을 위한 Puppeteer 알아보기
Puppeteer. 공식 문서 링크 https://pptr.dev Puppeteer란? 구글 크롬의 DevTools Protocol을 통해 Chrome 혹은 Chromium을 제어하기 위한 API를 제공한다. 참고로 Google Chrome 개발 팀에서 직접 개발했다고 한다. 구조는 아래와 같다. 간단하게 하나만 설명하면, Puppeteer는 하나의 Browser를 갖고 default BrowserContext가 생성된다. 하나의 Browser는 여러 개의 Browser Context를 갖는다. 나머지 구조도 아래에서 볼 수 있듯 계층적으로 이뤄진다. 보통 Puppeteer로 가져온 데이터를 파싱할 때 cheerio(https://github.com/cheeriojs/cheerio)를 많이 사용한다. 특..
Log.Develop/Node.js
2021. 1. 20. 11:55