现有一个用Python语言,sounddevice库编写的语音交互系统,部署在Windows 10或11环境。系统使用VB Cable将电脑中录制好的wav语音文件通过虚拟麦克风发送至一外部VoIP系统,VoIP系统与终端用户的手机建立通讯,将wav音频播放给用户,并将用户的语音回传至电脑,电脑随后由VB Cable虚拟扬声器将语音转接至输入,进行处理并开始下一轮语音交互。目前语音交互过程中音频延迟较大(2-3秒,从用户侧结束说话到用户在手机听到电脑传来的下一条语音),我们希望对此延迟进行大幅优化。将由Windows系统音频处理、虚拟音频设备导致的延迟降到最低。如必要,将部分相关Python代码用C重写以提高效率。
要求接单人:熟悉C语言,Windows音频编程,MME/ASIO/WASAPI/WDM-KS等Windows系统音频驱动与音频设置。最好有音频直播、音频延迟优化相关项目经验
VB Cable: https://vb-audio.com/Cable/ (默认使用MME驱动)
Sounddevice: https://github.com/spatialaudio/python-sounddevice/blob/master/sounddevice.py#L98 (目前通过调用play()函数播放wav音频)
希望在1-2周内尽快完成,价格视具体解决方案而议。
接包方 | 国家/地区 | |
---|---|---|
![]() |
1
Zhou881117
|
成都市 |