本篇文章更新時間:2026/03/24
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知或向一介資男的 LINE 社群反應。
如果本站內容對你有幫助,歡迎贊助支持 。
打造 AI 接待員的第一步:從錯過電話到建立 24/7 服務的技術旅程
編輯前言:這篇文章來自 How I Built an AI Receptionist for a Luxury Mechanic Shop - Part 1。作者以實作的方式,示範如何為一間忙到沒空接電話的車行打造 AI 接待員。對想做 Voice Agent、RAG、或 AI 產品化的人來說,這篇內容非常值得參考。
核心觀點 (Key Takeaways)
- AI 電話助理不能只靠「大語言模型」本體,必須以 RAG 做知識約束,避免錯報價格或政策。
- Voice Agent 的挑戰不只是技術,還包含語氣、節奏與聲線,這些會直接影響使用者信任感。
- 完整的 AI 電話系統需要前後端整合:向量庫、Webhook、語音平台、測試流程、紀錄追蹤與升級計畫。
深入解析
作者的兄弟是一家豪華維修店的老闆,因為整天忙著修車,電話接不完,每週錯過上百通。每一通沒接到的電話,都可能是幾百到數千美元的流失案件。於是作者決定自己動手打造一個 AI 接待員 Axle。
以下是文章拆解出的三大階段:打造大腦、連上電話、修正語音呈現。
-
Step 1:RAG Pipeline,打造不會亂講話的 AI 大腦
作者先清楚指出:要讓 AI 接電話,最危險的就是「亂報價格」。因此他不是把所有資訊丟給 LLM,而是採用 Retrieval-Augmented Generation(RAG)。作者的流程包括:
-
從網站爬資料,整理成 21 份 markdown 文件,涵蓋價格、政策、保固等資訊。
-
使用 Voyage AI 產生 embedding 放進 MongoDB Atlas 的向量庫。
-
建立查詢流程,確保每個問題都能抓到最合適的 3 份文件。
-
用 Claude 回答,並以「只能從知識庫回答」作為嚴格規範。
作者展示了一個成果例子:「How much is an oil change?」AI 能直接回出正確價格與服務內容。
-
Step 2:讓 AI 接到真正的電話
第二階段是把 AI 大腦接上電話線。作者選擇 Vapi 當語音平台,負責買號碼、語音辨識、語音合成與工具呼叫。核心步驟包括:
-
建立 FastAPI Webhook,處理來自 Vapi 的請求並串接 RAG。
-
使用 Ngrok 讓本地伺服器能公開給 Vapi 測試。
-
在 Vapi 設定助理:問候語、兩個工具(answerQuestion 與 saveCallback)。
-
每次通話都記錄到 MongoDB,成為可用的數據資產。
這段描述對任何想做 Voice Agent 的人都很重要:語音 AI 的技術流程其實不複雜,難的是整合所有細節讓它可靠地工作。
-
Step 3:為語音調整語氣與邏輯
作者坦言:這部分是最費心的。重要調整包含:
-
選擇正確的語音(最後選了沉穩可靠的 Christopher)。
-
重寫系統 prompt,讓語音更自然:短句、口語、去除視覺格式、避免「Certainly!」這類不自然的開場。
-
設計完整的 fallback,AI 不知道就要坦白,並且蒐集回電資訊。
-
加入測試:從 RAG 到整個通話流程,每個環節都得驗證。
作者一句話總結了 voice agent 的本質:錯的不是 AI 回答內容,而是聲音聽起來不像真的店員。
筆者心得與啟發
讀完這篇文章,我最大的感受是:AI Receptionist 看似是一個「語音版 ChatGPT」,但真正的挑戰在於產品化與可靠性。作者用大量細節證明,「讓 AI 接電話」不是一個 prompt 能解決的事,它需要:
- 清楚的邊界控制(因此 RAG 至關重要)。
- 良好的 fallback 設計(不會亂講、不會把客戶逼急)。
- 可追蹤的紀錄(把每一通電話變成可分析的數據)。
- 邏輯、聲音、語氣的全方位調整(這比想像中更費時間)。
另外我也深刻認同作者的觀察:Voice Agent 的核心從來不是「會不會回答」,而是「能不能讓人信任」。機械店的客人要的是一個聽起來可靠、懂車的人,而不是一個太熱情或太科技感的客服。
如果你想打造屬於自己的 AI 電話助理,或是為客戶開發 AI 產品,這篇文章是很好的起點。它提供的是一套完整的思考模型,而不是一串程式碼而已。這讓我重新思考:AI 的價值不在於模型本身,而在於模型如何深度嵌入業務流程,實際解決問題。
