自動為 PowerPoint 簡報生成專業演講文稿和有聲旁白
- 🤖 AI 智能生成 - 使用 Google Gemini AI 自動生成演講文稿
- 🎙️ 高品質 TTS - 整合 Microsoft Edge TTS,支援多種語音
- 📋 備忘稿同步 - 自動同步文稿到 PowerPoint 備忘稿
- 🎬 自動播放 - 自動配置音訊播放和投影片轉場
- 🌍 多語言支援 - 繁中、簡中、英文、日文、越南文
- Python 3.8+
- Node.js 16+
- Microsoft PowerPoint(用於備忘稿同步)
- Google Gemini API 金鑰(免費申請)
cd backend
pip install -r requirements.txt
# 設置環境變數
copy .env.example .env
# 編輯 .env 填入您的 GEMINI_API_KEY
# 啟動後端
python -m uvicorn app.main:app --reload --port 8080cd frontend
npm install
npm run dev點擊「選擇檔案」或拖放 .pptx 檔案到上傳區域
上傳後,點擊「開始解析」按鈕,系統會自動解析投影片內容,顯示投影片資訊和縮圖
在右側「⚙️ 文稿設定」面板中配置生成參數:
- 聽眾對象:例如:高階主管、客戶代表、內部團隊
- 簡報目的:例如:產品介紹、進度報告、技術分享
- 簡報情境:正式會議、內部分享、客戶簡報
- 語氣風格:專業自然、輕鬆友善、熱情濃烈
- 預計時長:設定演講的目標時間(分鐘)
- 輸出語言:繁體中文、簡體中文、英文等
點擊「
- 開場白:吸引聽眾注意力的開場
- 逐頁講稿:每張投影片的詳細說明
- 轉場語:投影片間的自然連接(可選)
生成後可以:
- ✅ 即時預覽生成結果
- ✏️ 手動編輯和調整內容
- 🗂️ 一鍵複製到剪貼簿
- 📥 下載為 TXT 檔案
如果需要生成帶有音訊旁白的 PPT:
- 點擊「生成有聲 PPT」按鈕
- 系統會自動:
- 🎙️ 生成 TTS 音訊
- 🔗 嵌入音訊到 PPT
- 📋 同步備忘稿
- ⏱️ 設定自動播放
- 下載完成的有聲 PPT
💡 提示:TTS 語音設定請參考下方「相關設定」章節
在設定面板中配置您的 Google Gemini API 金鑰:
配置步驟:
- 點擊設定選單中的「Google Gemini」
- 輸入您的 API 金鑰
- 選擇模型(預設:gemini-flash-latest)
- 點擊「儲存」完成配置
🔑 取得 API 金鑰:前往 Google AI Studio 建立免費 API 金鑰
系統支援多種介面語言:
支援語言:
- 🇨🇳 中文 (Chinese)
- 🇬🇧 英文 (English)
- 🇯🇵 日文 (Japanese)
- 🇻🇳 越南文 (Vietnamese)
點擊右上角的地球圖示即可切換介面語言。
調整文字轉語音的參數:
可調整項目:
- 語音語言:選擇輸出語言(中文、英文等)
- 語音模型:選擇不同的語音角色(男聲、女聲)
- 語速:調整說話速度(-50% 至 +100%)
- 音調:調整聲音高低(-50Hz 至 +50Hz)
| 類別 | 技術 |
|---|---|
| 前端 | React 18, Vite, TailwindCSS |
| 後端 | FastAPI, Python-PPTX, Edge TTS |
| AI | Google Gemini API |
| 其他 | PowerPoint COM, Pydantic |
A: 確保:
- 已安裝 Microsoft PowerPoint
- 系統為 Windows
- PowerPoint 沒有被其他程式鎖定
A: 您可以:
- 申請新的 Gemini API 金鑰
- 手動輸入文稿(不需要 API)
- 等待配額重置(通常每日重置)
A: 支援 .ppt 和 .pptx 格式
本專案採用 MIT 授權 - 詳見 LICENSE 檔案
- Google Gemini API - AI 文稿生成
- Microsoft Edge TTS - 文字轉語音
- Python-PPTX - PowerPoint 處理
⭐ 如果這個專案對您有幫助,請給個星星!






