ModelScopeFunASR是一个基于深度学习的语音识别模型,其交互方式主要包括以下参数:
(图片来源网络,侵删)1、音频文件路径:用于指定待处理的音频文件路径。
2、采样率:用于指定音频文件的采样率,常见的有16kHz、44.1kHz等。
3、编码器类型:用于指定音频编码器的类型,常见的有PCM、WAV、MP3等。
4、解码器类型:用于指定音频解码器的类型,常见的有G729、Opus等。
5、语言类型:用于指定待识别的语音语言类型,常见的有中文、英文等。
6、识别模式:用于指定识别模式,常见的有实时识别、离线识别等。
7、返回结果格式:用于指定返回结果的格式,常见的有文本、JSON等。
8、API密钥:用于调用API接口时的身份验证信息。
以上是ModelScopeFunASR的主要交互参数,具体使用方法可以参考官方文档或者API接口文档。
最新评论
本站CDN与莫名CDN同款、亚太CDN、速度还不错,值得推荐。
感谢推荐我们公司产品、有什么活动会第一时间公布!
我在用这类站群服务器、还可以. 用很多年了。