剛看到這篇「A Guide to Automating & Scraping the Web with JavaScript (Chrome + Puppeteer + Node JS)」爬蟲實作指南,寫得很詳細,值得收藏筆記一下!

透過 Puppeteer 這套件能將瀏覽器行為程式模組化,再加上瀏覽器的 API 也是 JavaScript 介接,可以說無縫接軌,從網站原始碼到使用 DOM 元素最後是連畫面節錄都沒問題,算是目前最完整的方案了吧!

試玩的過程其實還可以把 headless 模式關閉,這樣就可以看到真正的瀏覽器畫面操作(閃太快的話也可以設定延遲執行秒數)。

#技術相關 #HeadlessChrome #Puppeteer #NodeJS #Parser #Crawler #爬蟲 #筆記

- Powered by Mxp.TW -FB2WP-

Facebook 外掛功能


Share:

作者: Chun

資訊愛好人士。主張「人人都該為了偷懶而進步」。期許自己成為斜槓到變進度條 100% 的年輕人。[//////////____30%_________]

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *