[工具] 中文簡繁轉換開源工具 – OpenCC 開放中文轉換

其實現在如果搜尋「簡繁轉換工具」是可以找到一堆,尤其是用對照表去處理的。但如果想要有無限制 API 介接程式化並且可以做到字詞替換就幾乎沒有。

這套工具的緣由可以從這裡觀看,特點如下:

  • 嚴格區分「一簡對多繁」和「一簡對多異」。
  • 完全兼容異體字,可以實現動態替換。
  • 嚴格審校一簡對多繁詞條,原則爲「能分則不合」。
  • 支持中國大陸、臺灣、香港異體字和地區習慣用詞轉換,如「裏」「裡」、「鼠標」「滑鼠」。
  • 詞庫和函數庫完全分離,可以自由修改、導入、擴展。
  • 支持C、C++、Python、PHP、Java、Ruby、Node.js and Android。
  • 兼容Windows、Linux、Mac平臺。

還有,使用 C++ 撰寫運行就是快!! (我自己補的XD)

OpenCC

不會 Build 的人他也還有線上工具可以使用。會延伸開發的話自由度就很大,還有可以自己增加對應本地化詞語替換呢。

想要接上 PHP 也不是難事,還有大陸網友開發的 extension 延伸模組

年初用這個組合做的專案現在才來記錄,還真是久了,哈哈。字詞替換的部分要小心一點就是程式邏輯採全文掃描,符合條件就會替換,所以非真正關鍵的替換詞反而會造成輸出結果有閱讀困難!

Facebook 外掛整合


Share: