[MySQL] 使用 CSV 檔案匯入資料表

快速總結:這功能,幾筆之下很好用,幾百萬筆之下霹靂好用! 匯入這種需求滿常見的,尤其是給定某些資料需要做查詢時。不過,當你要匯入的檔案越大時其實選擇就不多,大概就是能直接檔案轉存就不要寫程式去分析(parsing)。 原因只有「速度」。經過分析轉譯的操作速度超級慢,更還有可能因為寫的架構沒顧慮到匯入 …

[Elasticsearch] 與它一起很神奇的好夥伴 – Logstash

Logstash 這套應用神就神在幫你直接載入檔案直接分析、處理。 白話一點就是,你不用什麼資料都要自己寫程式匯入 Elasticsearch ,如果要從一堆早就堆成山的檔案紀錄(log)再寫程式去分析匯入豈不是會昏倒?是要匯到民國幾年勒~ Logstash 的處理外掛也不少,其中這套Grok也已經 …

[Elasticsearch] 設定背景執行模式以及系統組態方法

如果服務要上線不再是測試模式的時候只需要再重啟時使用下列指令: ./bin/elasticsearch -d -p pid 而要關閉服務使用指令: kill `cat pid` 這做法雖然沒有使用系統 service 模式呼叫方便,但其實也不難,要做到重開機服務能夠繼續也不過就是補上開機後會執行的 …

[Elasticsearch] 在 Ubuntu 下安裝使用紀錄

資料(data)與資訊(Information)的差別是一個在資訊相關科系中非常常見的問題。而轉換中間的過程就是選對工具上天堂,選錯工具地上爬~ 經過地上爬了一番後,覺得 MySQL 似乎要解決高流量與多維度搜尋這件事還是很吃力,要來試試看別的作法。也就是本篇主角「Elasticsearch」! 使 …

[DNS] 設定網域時 TTL 時間要設定多長才好呢?

剛看到有人問這個問題,突然想到之前只有跟人說過,但沒寫下來紀錄。 TTL 是 DNS 紀錄中的一個值,用來定義 DNS 紀錄的後續變更生效前的秒數。在您的網域中,每個 DNS 紀錄 (例如 MX 紀錄、CNAME 紀錄等) 都具有 TTL 值,其決定了您對紀錄所做的變更需要多久才會生效。舉例來說,如 …

[案例] 快防禦,別讓 LINE 行銷攻破你網站

業務關係,幫國內某知名醫美代管網站伺服器,就在上上週接到電話 「網站在下午五點多的時候掛掉將近十分鐘,麻煩協助處理。」 「哇,真假,我查一下。」…「疑,很正常耶!是有在做什麼行銷廣告活動嗎?」 「哦,我們正在跑 LINE@ 行銷!」 「請問是多少人的帳號呢?」 「不多拉,我想大概幾萬而已吧(!? …

[Varnish] Ubuntu 16.04 一行指令編譯安裝

昨晚興趣使然自己打開 Docker 用 Ubuntu 16.04 編譯 Varnish ,標題實屬殺人法XD 其實只不過是把很多指令放在一行而已,哈哈。 apt update && apt install git vim automake autotools-dev libedit- …

[DDoS] 你知道你正在攻擊明鏡時報的網站嗎?

更新:百度站長工具 Sitemap 主動推送功能暗藏惡意攻擊程式碼 最近在開發網站的時候觀察到一個突然的大量請求從網站發生,一開始沒注意,剛剛又發生了就順手檢查,一檢查不得了,原來我電腦正在攻擊明鏡時報! 攻擊碼如下: if ((/chrome/([d]+)/gi.exec(window.navig …

[SEO] 頁面連結、內容資料與主動提交

標題這三個項目是我認為如果一個網站需要透過搜尋引擎建立有效曝光的話,最主要的三大項。 其中頁面連結是指 URI 的管理,從網址命名結構到其對應內容這段路其實不是給人看的,而是給機器分析用的。至於有效程度到哪也始終是個謎,個人覺得只要路徑找得到資料就是好路徑。 內容資料這塊就不少人列為主要探討了,不過 …

[WordPress] 十一天的投資一百多萬筆的資料,我放棄使用原生文章類型

算了算這筆網站投資,從開始到匯入結束,花了十一天。 中間歷經三次重置,原因只有很單純的思緒不夠縝密。太快的著手資料匯入導致有其他可能遺失,索性直接重置再來一次! 但,這都還是用原生文章類型(Post Type),想以「SEO First」的感覺下去想把內容給拼裝上,想都沒想就覺得這樣使用 WordP …

文章
Filter
Apply Filters
Mastodon