Skip to content

Latest commit

 

History

History
38 lines (29 loc) · 809 Bytes

README.md

File metadata and controls

38 lines (29 loc) · 809 Bytes

语音交互项目

这是一个Speech To Speech的项目。

功能特性

  • 唤醒词检测
    • iic/speech_charctc_kws_phone-xiaoyun 该模型使用其它词仅仅可用,要效果好需要训练。
  • VAD
  • 语音识别 (ASR)
    • senseVoice、 paraformer
  • 语音合成 (TTS)
  • LLM 大语言模型
    • ollama
    • deepseek

安装

  1. 创建并激活虚拟环境:

     uv venv -p 3.12
     uv pip install -r .\requirements.txt
     source .venv/bin/activate  # 在Windows上使用 .venv\Scripts\activate
  2. 配置环境变量: 复制.env.example文件为.env,并填写必要的API密钥和配置。

使用方法

运行主程序:

python main.py