2020年5月20日星期三

Deepgram - 利用人工智能实现商业语音识别和文本转录实例 Deepgram - An Example of Speech Recognition And Text Transcription Using Artificial Intelligence in Business


语音识别是一种可以识别口语单词然后将其转换为文本的技术。声音识别,这是一种根据声音识别人的技术,是语音识别的分支。

脸书 Facebook, 亚马逊 Amazon, 微软 Microsoft, 谷歌 Google and 苹果 Apple 五大科技公司已经相继开发出来语音识别产品。

亚马逊 Echo and Alexa,Google Home and Assistant, 微软 Cortana,苹果 Siri, 这些产品已经开始主要应用于家庭,和娱乐,有的也附带了部分商业功能。


商业用途的语音识别系统已经出现


Deepgram 基于人工智能的搜索平台, 具有语音转文本的功能, 可在现场,电话,音频和视频文件中通过声音和文本同时搜索文字中的关键字并转换和记录, 将帮助企业处理会议,电话和演示记录。这个记录是相对准确的,不会达到人类记录的那种准确程度,正在逐步的提高中。但是对于公司来说,确实能够节省大量宝贵的时间和大幅度降低成本,并且收集到相当珍贵的数据。

这是企业利用语音收集和分析数据的典型。

在 Deepgram,使用端到端深度学习语音识别系统创建了一个完全不同的解决方案,从而使收集语音数据更快,更准确和可靠,真正满足了企业公司的需求。

Deepgram 的创新在于用人工智能处理文字和图形, 使他们形成混合的自定义模型,然后对这些模型进行全面培训,使他们能够采用从电话和Podcast到录制的会议和视频等格式的文件。

Deepgram 语音存储的创新方式,能帮助客户按其发音方式搜索单词,即使拼写错误,Deepgram 也可以找到它们。

Deepgram CEO 斯蒂芬森说,Deepgram 的模型会自动拾取麦克风的噪音概况,以及背景噪音,音频编码,传输协议,口音,价位(即能量),情感,对话主题,语速,产品名称和语言。此外,他声称,与行业基准相比,它们可以将语音识别精度提高30%,同时可以将转录速度提高200倍,并且可以处理数千个同时的音频流。


语音识别和转换系统 Deepgram 工作流程

1. 准备数据
以充分的准备和培训来确保更高的准确度

2. 训练模型
这个过程实现端到端自定义语音模型

3. 实现转录
使用模型实现大规模,自动化地转录


结论


Deepgram 是为商业公司提供语音转文本服务的其中一个,未来会有更多的科技创业公司涉足这个领域,这项技术将为大量的商业公司日常的会议,演讲,产品发布会,展览等活动做记录,以及收集和分析数据,并最终创造价值提供便利。



#人工智能 #语音识别 #文本转换 #商业


Deepgram 

没有评论:

发表评论

大数据技术的发展帮助企业更加了解客户 The Development of Big Data Technology Helps Companies Understand Customers Better

现在大数据的应用已经无处不在, 几乎所有的网站和应用程序都在跟踪和记录用户的行为, 用于以后对用户的行为进行分析。 大数据技术包括数据收集,整理,分析以及创建用户行为模式, 只有这样大数据才对企业有价值。 大数据应用程序的开发为更高级别的市场研究,产品开发,用户获取,营销奠定了基...