本篇文章更新時間:2019/02/16
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知或向一介資男的 LINE 社群反應。
如果本站內容對你有幫助,歡迎贊助支持 。
剛看到這篇「A Guide to Automating & Scraping the Web with JavaScript (Chrome + Puppeteer + Node JS)」爬蟲實作指南,寫得很詳細,值得收藏筆記一下!
透過 Puppeteer 這套件能將瀏覽器行為程式模組化,再加上瀏覽器的 API 也是 JavaScript 介接,可以說無縫接軌,從網站原始碼到使用 DOM 元素最後是連畫面節錄都沒問題,算是目前最完整的方案了吧!
試玩的過程其實還可以把 headless 模式關閉,這樣就可以看到真正的瀏覽器畫面操作(閃太快的話也可以設定延遲執行秒數)。
#技術相關 #HeadlessChrome #Puppeteer #NodeJS #Parser #Crawler #爬蟲 #筆記
![[轉貼] Headless Chrome 使用 Puppeteer NodeJS API 實作爬蟲](https://www.mxp.tw/wp-content/uploads/2017/10/22814043_1747644405305998_341408037801848392_n.png)
- Powered by Mxp.TW -FB2WP-
