本篇文章更新時間:2019/02/16
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知或向一介資男的 LINE 社群反應。
如果本站內容對你有幫助,歡迎贊助支持


剛看到這篇「A Guide to Automating & Scraping the Web with JavaScript (Chrome + Puppeteer + Node JS)」爬蟲實作指南,寫得很詳細,值得收藏筆記一下!

透過 Puppeteer 這套件能將瀏覽器行為程式模組化,再加上瀏覽器的 API 也是 JavaScript 介接,可以說無縫接軌,從網站原始碼到使用 DOM 元素最後是連畫面節錄都沒問題,算是目前最完整的方案了吧!

試玩的過程其實還可以把 headless 模式關閉,這樣就可以看到真正的瀏覽器畫面操作(閃太快的話也可以設定延遲執行秒數)。

#技術相關 #HeadlessChrome #Puppeteer #NodeJS #Parser #Crawler #爬蟲 #筆記

- Powered by Mxp.TW -FB2WP-


Share:

作者: Chun

WordPress 社群貢獻者、開源社群推廣者。專注於 WordPress 外掛開發、網站效能最佳化、伺服器管理,以及 iDempiere 開源 ERP 導入與客製開發。曾參與 WordCamp Taipei 等社群活動,GitHub Arctic Code Vault Contributor。提供資訊顧問、WordPress 開發教學、主機最佳化與企業 ERP 整合服務。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *


文章
Filter
Apply Filters
Mastodon