bluayer

고정 헤더 영역

글 제목

메뉴 레이어

bluayer

메뉴 리스트

  • 홈
  • 태그
  • 미디어로그
  • 방명록
  • 분류 전체보기 (58)
    • Log.Math (1)
      • 선형대수학 (1)
    • Log.Develop (57)
      • DB (3)
      • PS (3)
      • Activity (8)
      • JS&TS (4)
      • SpringBoot (5)
      • Node.js (3)
      • Other (5)
      • DevOps (8)
      • Architecture&Design (4)
      • Culture (5)
      • DDIA (9)
    • 북 리뷰 (0)

검색 레이어

bluayer

검색 영역

컨텐츠 검색

DOM

  • [Node.js] Crawling을 위한 Puppeteer 알아보기

    2021.01.20 by bluayer

[Node.js] Crawling을 위한 Puppeteer 알아보기

Puppeteer. 공식 문서 링크 https://pptr.dev Puppeteer란? 구글 크롬의 DevTools Protocol을 통해 Chrome 혹은 Chromium을 제어하기 위한 API를 제공한다. 참고로 Google Chrome 개발 팀에서 직접 개발했다고 한다. 구조는 아래와 같다. 간단하게 하나만 설명하면, Puppeteer는 하나의 Browser를 갖고 default BrowserContext가 생성된다. 하나의 Browser는 여러 개의 Browser Context를 갖는다. 나머지 구조도 아래에서 볼 수 있듯 계층적으로 이뤄진다. 보통 Puppeteer로 가져온 데이터를 파싱할 때 cheerio(https://github.com/cheeriojs/cheerio)를 많이 사용한다. 특..

Log.Develop/Node.js 2021. 1. 20. 11:55

추가 정보

09-23 18:52

인기글

최신글

페이징

이전
1
다음
Github
bluayer © bluayer
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바