Drtoolbox 是一個專為診所設計的本地端 AI 知識庫與助理系統。本系統允許您將診所的各類文件(行銷素材、醫療文獻、產品型錄等)上傳至本地伺服器,並透過強大的本地 AI 模型進行知識檢索(RAG)與對話。
- 完全本地化:資料不外洩,所有文件與對話皆在本地端處理。
- 支援多種格式:可上傳 PDF、PPTX、DOCX、JPG、PNG、TXT, MD 等檔案,並支援音影片逐字稿。
- 自動 OCR 與向量化:上傳的文件會自動在背景進行文字萃取與知識庫索引。
- 安全存檔 (Storage Optimization):原始檔案在處理後會自動移至
data/archive/存檔,節省主空間並防止誤刪。 - 嚴格價格防護 (Pricing Security):自動過濾並屏蔽 AI 回覆中的敏感優惠價格,引導患者直接與診所諮詢,避免報價爭議。
- 智慧對話助理 (Hermes):整合 PageIndex 深度推理,根據您上傳的診所專屬資料,精準回答專業醫療問題。
本系統不僅能被動回答問題,更具備主動學習、事實核查與數據優化能力,是診所專屬的「AI 大腦成長系統」:
- 🚀 主動式模擬問答 (Proactive QA Generation):
- 自動識別服務:系統會自動掃描
/data/documents/special/中的文件,識別出如「皮秒雷射」、「微創痔瘡手術」等核心服務。 - 模擬病患提問:針對每項服務,系統會模擬病患最常問的專業問題(如:原理、效果、復原期)。
- 自動生成答案:利用 Hybrid RAG(結合 PageIndex 深度推理)產出最精準的原始答案,供醫師後續審核。
- 自動識別服務:系統會自動掃描
- 🌐 網實事實核查 (Nightly Fact-Check):
- 自動上網查證:每天夜間,Hermes Agent 會檢視當日的對話。針對醫療與術後相關問題,會自動透過網路搜尋(Web Search)獲取最新醫學證據。
- 提供修正建議:若發現 AI 原始回答不夠精準,系統會自動擬定一個「修正草案」並標註 「Hermes 建議待審」。
- 🔍 手動/自動雙觸發機制:
- 手動按鈕:醫師隨時可在面板點擊「🔍 執行今日網實核查」,立即啟動當日對話的校對與主動生成任務。
- 自動排程:每日凌晨 01:00 至 04:00 會依序執行預約提醒、趨勢分析、事實核查與 QA 生成。
- 📝 自動文章轉換與官網同步 (Article Sync):
- 醫師批准的「黃金數據 (QA)」會由 AI 自動改寫為標題單一、散文格式的專業醫學文章。
- 提供專屬自動化腳本 (
auto_post_to_toolbox.py),可一鍵將數十篇文章自動填入並儲存至您的官網後台,大幅節省複製貼上的時間。
當伺服器都啟動完畢後,請打開您的網頁瀏覽器。
這是將 AI 回覆轉化為「高品質訓練數據」的關鍵步驟:
- 進入「資料校正」分頁:您會看到三種類型的項目:
- 💜 紫色標籤 (PROACTIVE):系統主動生成的模擬 QA。
- 💙 藍色標籤 (HERMES DRAFT):經過網路事實校對後的建議修正。
- 一般項 (LOG):日常與病患的對話紀錄。
- 審核與證據參考:
- 點開藍色標籤項目時,編輯器上方會顯示 「🌐 Hermes 網路搜尋證據」,列出參考的權威網頁來源。
- 全面問答掌控 (編輯與捨棄):
- 修改提問:您可以手動修改「使用者提問」,讓問題更符合真實病患口吻。
- 修改答案:直接在編輯器中微調 AI 的回答。
- 捨棄項目:若覺得模擬提問不實用,可點擊 「🗑️ 捨棄此項目」,該資料將被永久移除且不計入訓練集。
- 自動隱藏與存檔:
- 處理即消失:點擊 「✅ 驗證並儲存」 後的項目會立即從清單中消失,只留下待辦事項。
- 永久存檔:批准的內容會存入
verified_training_data.jsonl,成為未來的「黃金數據」。
當您累積了許多審核通過的 QA 後,系統會將它們轉換為專業文章。
- 進入 「文章同步」 分頁,確認待同步的文章清單。
- 開啟終端機,執行自動上傳腳本:
uv run python scripts/auto_post_to_toolbox.py
- 腳本會開啟瀏覽器,請您手動登入 Doctor Toolbox 後台並切換至「診所知識文章」分頁。
- 回到終端機按下
Enter,Hermes 將接管瀏覽器,自動完成所有文章的新增與存檔!
系統在回答與校正時嚴格遵守以下原則:
- 嚴禁報價:絕對不能輸出任何金錢數字、價格或優惠金額。若遇到價格問題,一律引導致電診所諮詢。
- 繁體中文一致性:全程唯一使用繁體中文,語氣需專業、親切且具備權威性。
- 時間線標示:若資料包含治療期程、復原時間、術後追蹤等「時間資訊」,必須詳細標註。
- 醫療安全優先:若資料庫完全無相關線索,系統將溫柔地建議親自就醫,不胡亂猜測。
如果您上傳的檔案來自 百度雲、OneDrive 或 iCloud 等雲端同步資料夾,請注意:
- 必須先下載到本機:拖曳上傳前,請務必按右鍵選擇「始終保留在選取的裝置上」或確保檔案已經完整下載到您的硬碟中。
- 避免上傳失敗:如果檔案只是一個雲端的「捷徑」圖示,瀏覽器在上傳時會出現
net::ERR_FAILED的網路錯誤,導致系統無法讀取檔案。
/data/documents/special/:存放診所專屬的私有資料與自動產生的.txt文字檔。/data/documents/general/:存放一般公開的醫學文獻。/data/models/:存放下載的本地 AI 模型 (如 Gemma 4, Qwen 等),此目錄已被加入.gitignore。/data/datasets/:存放外部資料集或訓練用原始資料。/src/api/:後端 Flask 伺服器的程式碼。/src/static/:前端網頁的 JavaScript, CSS 與圖片資源。/config/:伺服器與 RAG 系統的設定檔。
- 出現
No GPU to monitor或Driver/library version mismatch: 這是 Linux 系統自動更新 NVIDIA 驅動造成的。遇到此情況時,AI 運算會變得非常慢(退回 CPU 運算),請直接將電腦重新開機即可解決。 - 網頁顯示上傳成功,但 AI 找不到資料? 如果是超過 100MB 的大型 PDF(如教科書),背景 OCR 可能需要數十分鐘到數小時的時間處理。請耐心等待,並可透過 Dashboard 的日誌區查看進度。 【特別指示】 116 - 1. 語言與排版:必須完全且唯一使用「繁體中文 (Traditional Chinese)」進行回答,嚴禁使用簡體中文。請使用美化的 Markdown 語法(例如:粗體、條列式清單、適當的段落空白)來排版,讓內容專業且容易閱讀。 117 - 2. 參考資料是從圖片辨識 (OCR) 轉出的文字,可能會有錯字、排版混亂,或者沒有寫出完整的「促銷組合」四個字。 118 - 3. 嚴格禁止報價!若遇到任何詢問價格、活動、專案的問題,因為資料多已過期或缺乏時效性,你【絕對不能】輸出任何金錢數字、價格、或是單堂費用。 119 - 4. 如果參考資料中包含任何「時間線」相關的資訊(例如:治療期程、復原時間、活動優惠期間、術後追蹤時間等),請務必在回答中特別標示並詳細附上。 120 - 5. 【價格與時效限制】請一律回覆:「目前無法確認該活動的時效與具體內容,為避免提供錯誤資訊,建議您致電診所向專人諮詢以獲取最準確的報價喔!」 121 - 6. 如果參考資料中真的完全找不到任何相關線索,才能回答「對不起,目前的資料庫中沒有關於此問題的資訊」。