2020年5月20日星期三

Deepgram - 利用人工智能实现商业语音识别和文本转录实例 Deepgram - An Example of Speech Recognition And Text Transcription Using Artificial Intelligence in Business


语音识别是一种可以识别口语单词然后将其转换为文本的技术。声音识别,这是一种根据声音识别人的技术,是语音识别的分支。

脸书 Facebook, 亚马逊 Amazon, 微软 Microsoft, 谷歌 Google and 苹果 Apple 五大科技公司已经相继开发出来语音识别产品。

亚马逊 Echo and Alexa,Google Home and Assistant, 微软 Cortana,苹果 Siri, 这些产品已经开始主要应用于家庭,和娱乐,有的也附带了部分商业功能。


商业用途的语音识别系统已经出现


Deepgram 基于人工智能的搜索平台, 具有语音转文本的功能, 可在现场,电话,音频和视频文件中通过声音和文本同时搜索文字中的关键字并转换和记录, 将帮助企业处理会议,电话和演示记录。这个记录是相对准确的,不会达到人类记录的那种准确程度,正在逐步的提高中。但是对于公司来说,确实能够节省大量宝贵的时间和大幅度降低成本,并且收集到相当珍贵的数据。

这是企业利用语音收集和分析数据的典型。

在 Deepgram,使用端到端深度学习语音识别系统创建了一个完全不同的解决方案,从而使收集语音数据更快,更准确和可靠,真正满足了企业公司的需求。

Deepgram 的创新在于用人工智能处理文字和图形, 使他们形成混合的自定义模型,然后对这些模型进行全面培训,使他们能够采用从电话和Podcast到录制的会议和视频等格式的文件。

Deepgram 语音存储的创新方式,能帮助客户按其发音方式搜索单词,即使拼写错误,Deepgram 也可以找到它们。

Deepgram CEO 斯蒂芬森说,Deepgram 的模型会自动拾取麦克风的噪音概况,以及背景噪音,音频编码,传输协议,口音,价位(即能量),情感,对话主题,语速,产品名称和语言。此外,他声称,与行业基准相比,它们可以将语音识别精度提高30%,同时可以将转录速度提高200倍,并且可以处理数千个同时的音频流。


语音识别和转换系统 Deepgram 工作流程

1. 准备数据
以充分的准备和培训来确保更高的准确度

2. 训练模型
这个过程实现端到端自定义语音模型

3. 实现转录
使用模型实现大规模,自动化地转录


结论


Deepgram 是为商业公司提供语音转文本服务的其中一个,未来会有更多的科技创业公司涉足这个领域,这项技术将为大量的商业公司日常的会议,演讲,产品发布会,展览等活动做记录,以及收集和分析数据,并最终创造价值提供便利。



#人工智能 #语音识别 #文本转换 #商业


Deepgram 

没有评论:

发表评论

推荐给小型企业构建基本的聊天机器人 Recommendation for Small Business Building Basic Chatbots

这是对最基本的企业聊天机器人的介绍,目的是帮助小型公司了解聊天机器人。 基本型聊天机器人的好处: 极低的开发和维护成本 帮助企业了解聊天机器人并可以随时升级 改善客户体验 工作24 x 7 x 365 聊天机器人的基本功能包括: 问候访客/用户 回答一些问题 显示产品/服务 引导...