Skip to content

Aurorabili/fastfif

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Fast FiF

使用生成语音全自动完成指定任务

🌟 特性

  • YourTTS模型只需要数秒即可模仿你的声音。

  • 打开浏览器也是自动的。全程只需你一次点击。

  • 使用虚拟麦克风输入,它将安静的在后台工作。

🍗 使用

目前仅可在Linux中部署该项目。Windows部署将在计划内支持。

驱动依赖

项目使用pulseaudio来创建虚拟麦克风,这是他只能在Linux平台部署的最大原因。

pulseaudio      # Linux声卡驱动

克隆项目到本地

git clone https://github.com/Aurorabili/fuckfif
cd fuckfif

使用pip安装项目依赖

pip install -r requirements.txt

录制样本声音

YourTTS需要一段10秒左右的录音来模仿你的音色以生成音色。你可以在安静的环境中使用手机录音机进行录音。然后重命名并放到这个路径draft/target_voice.wav。这个录音需要你朗读一段英文文本,大概在10秒钟左右,请在安静的地方进行以确保没有底噪。

这里提供一段英文文本:

The original vision of AI was re-articulated in two sousands via the term Artificial General Intelligence or AGI. This vision is to build Thinking Machines computer systems that can learn, reason, and solve problems similar to the way humans do.

启动项目

当一切准备就绪。使用python运行src/main.py

python src/main.py

🗺️ 路线图

  • 使用其他虚拟麦克风方案以支持在Windows平台部署。
  • 一键部署脚本
  • 添加Android版本FiF客户端连接器。
  • 使用原音输出或在线TTS降低算力要求以支持边缘计算平台。
  • 支持快速微调的模型以拟真声音。

😞 已知问题

  • 当合成单个单词的录音时,YourTTS模型的效果不佳,这也许是和speaker_wav参数有关。
  • 官方的网页端似乎未实现问答类型的题目,导致部分问答类型的题目无法完成。

🪜 代码结构

src
├── main.py             # 主程序
├── connector           # FiF客户端连接器
├── speaker             # 语音合成器抽象
├── tts                 # TTS模型
└── vmic                # 虚拟麦克风

🎈 提交贡献

我们欢迎任何人提交贡献。如果你有任何想法、建议、新题型以及错误报告,欢迎提交issue,我们很期待与你讨论。如果你有任何代码上的改进,欢迎提交PR。

📝 说明

本项目仅供学习交流使用,不得用于商业用途。使用本项目造成的一切后果由使用者自行承担。

🔗 引用

📜 许可证

本项目使用MIT许可证

About

使用生成语音全自动完成指定任务

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors