[MySQL] 無指令方式將 latin1_swedish_ci 編碼資料匯出成 UTF-8

這需求總還是會來。不是每次都有機會透過先前文章「轉換 MySQL 匯出 Latin1 編碼的 SQL 檔為 UTF-8」使用指令來本機處理,畢竟當資料量太大的時候,會有很多貧頸。 Google 了一番 […]

[PHP] 資料匯出並下載為 CSV 檔案,而且 Excel 不亂碼!

CSV 檔案的結構很簡單,逗號或分號區隔內容,並且斷行字元為新一筆資料。 依此資料格式輸出即可做出一個 CSV 檔案。 大多數如果是客戶端自行留存的檔案,個人在實作上就不考慮留檔,所以不寫入檔案,直接 […]

[PHP] 使用正規表示法(RegEx)解析 HTML 文件時,移除特殊字元的陷阱

這幾天都在用 NodeJS 寫爬蟲去測試解析資料,然後昨天要改用 PHP 實作的時候就發生一個詭異問題: 抽出來的文件是正常,但一經過移除斷行的解析時,整個文件編碼就走山了! preg_replace […]

[PHP] 爬蟲使用 DOMDocument 解析網站時 UTF-8 亂碼

如果你用這方法去解析網站時發現亂碼,那你絕對不孤單XD 至今這問題都還沒被原生解決,不過網路上的解法很有用: $dom = new DOMDocument(); $dom->loadHTML(m […]