本篇文章更新時間:2019/02/16
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知。
一介資男的 LINE 社群開站囉!歡迎入群聊聊~
如果本站內容對你有幫助,歡迎使用 BFX Pay 加密貨幣 或 新台幣 贊助支持。
剛看到這篇「A Guide to Automating & Scraping the Web with JavaScript (Chrome + Puppeteer + Node JS)」爬蟲實作指南,寫得很詳細,值得收藏筆記一下!
透過 Puppeteer 這套件能將瀏覽器行為程式模組化,再加上瀏覽器的 API 也是 JavaScript 介接,可以說無縫接軌,從網站原始碼到使用 DOM 元素最後是連畫面節錄都沒問題,算是目前最完整的方案了吧!
試玩的過程其實還可以把 headless
模式關閉,這樣就可以看到真正的瀏覽器畫面操作(閃太快的話也可以設定延遲執行秒數)。
#技術相關 #HeadlessChrome #Puppeteer #NodeJS #Parser #Crawler #爬蟲 #筆記
![[轉貼] Headless Chrome 使用 Puppeteer NodeJS API 實作爬蟲](https://www.mxp.tw/wp-content/uploads/2017/10/22814043_1747644405305998_341408037801848392_n.png)
- Powered by Mxp.TW -FB2WP-