实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。
语音识别的应用场景:
语音搜索
支持各种场景下的语音搜索,如地图导航、浏览器搜索等。可以集成到任何形式的手机应用中,最大限度地解放双手。
语音指令
通过语音命令控制智能设备,实现快捷便利的操作,如控制空调开关、电视换台等。可以集成到智能家居等设备中。
语音短消息
发送或者接收语音短消息时,利用音频转文字能力,实现音频内容快速预览。
视频实时直播字幕
现场演讲场景、实时直播场景下,将视频中的音频实时转写为字幕,还可以进一步对内容进行管理。
实时会议记录
将会议、法庭庭审中的音频实时转写为文字,辅助会议记录工作,同时适用于电视会议等远距离场景。
实时客服记录
将呼叫中心的语音实时转写为文字,可以实现实时质检等。
呼叫中心语音质检
上传呼叫中心的录音文件,通过录音文件识别得到文本,进一步通过文本检索,检查有无违规话术、敏感词等信息。
庭审数据库录入
上传庭审记录的录音文件,进行识别后,将识别文本录入数据库。
会议记录总结
对会议记录的音频文件进行识别,然后通过人工或者自动方法,对会议记录作出总结。
医院病历录入
手术时通过音频记录医生的操作,通过录音文件识别得到文本,提高病例录入效率。