在很多行业,对电话、无线电中的双方通话以及密闭空间里的会议、竞标、宣判等场景的说话,都会录音,存档做记录或证据。
在需要获取并了解录音的内容时,就需要人工去回放倾听,有些场合还需要将内容敲打成文字,记录下来。在录音文件比较多的时候,就需要花费很多的人力,而且不可避免的可能会出现差错。
在计算机科技飞速发展的当下,比较合理的解决方法是用自动语音识别(ASR)引擎对这些录音文件进行自动文字识别并保存下来。
然而目前的市场现状是可购买的独立部署的识别引擎价格昂贵且安装繁琐,需要厂家到现场去安装。而用公网上的云平台识别引擎开发的系统,按次数或者年收费,虽然价格不算高,但是不保密,数据不安全;录音文件上传到云平台上进行识别,相当于数据发给了对方。对一些比较敏感的行业来讲,这是没法接受的
在这种情况下,从保密性、成本以及使用便捷这几个方面兼顾作为出发点,力盈力泰推出了自己的内网里部署的录音文件自动语音识别(ASR,文字转语音)解决方案。
目标
给本公司或第三方的录音系统生成的录音文件,提供一个安全、便捷、可靠、低成本的自动语音识别(语音转文字)解决方案。
这有助于最终用户能够快速地掌握海量录音文件的内容,或者从中定位一些关键字词,做后续处理。
实现方法和网络架构
在内网部署一至多台力盈力泰语音识别服务器;找一台windows电脑,运行力盈力泰录音文件提交识别软件。
力盈力泰录音文件提交识别软件对接录音系统的数据库,从中获取到录音文件,自动提交给内网的力盈力泰语音识别服务器,在得到识别结果的文字内容后,写回到数据库对应的记录中。
力盈力泰录音文件自动语音识别(ASR,文字转语音)网络结构图
优势
关键参数
相关内容: