ASSEMBLYAI：人工智能即服务如何改变语音识别市场

投稿
APP
微信扫一扫获取更多

ASSEMBLYAI：人工智能即服务如何改变语音识别市场｜前哨

优博讯

2022-08-04 23:00:24

图灵汇官网

你好，这里是科技前哨，今天继续与你分享关于新兴科技企业的最新动态。

语音识别已成为我们日常生活的重要组成部分，如今提及语音识别，人们已习以为常，因为手机、智能音箱、聊天机器人等设备中都集成了这项功能。然而，语音模型的训练及数据挖掘并非易事，因此需要一家能够将语音识别作为服务的企业来满足市场需求。AssemblyAI就是这样一家创业公司，它在竞争激烈的语音市场中脱颖而出，背后有何秘诀？今天，科技前哨将为你揭秘。

1. 名牌孵化器的又一次成功

谈到AssemblyAI，不得不提的是著名的孵化器Y Combinator。这家孵化器曾孵化出包括云存储服务提供商Dropbox和短租平台Airbnb在内的380家公司，总融资额超过数十亿美元。而AssemblyAI正是Y Combinator的孵化成果之一。其创始人Dylan Fox曾在思科工作两年，专注于协作产品的机器学习，之后创立了YouGive1，一个与企业合作、通过产品销售促进慈善捐赠的组织。Fox在工作中发现，市场上缺乏既方便部署又经济实惠且准确度高的语音识别和自然语言处理服务，因此萌生了自主开发语音识别人工智能的想法。

Fox在接受采访时说：“我的目标是开发出最优秀的人工智能模型，并以一种简便的方式提供给开发者，如通过API的形式。”2017年1月，Fox成立了AssemblyAI，尽管语音识别已是相对成熟的技术领域，但他的初创公司初期只获得了17万美元的种子轮融资。

2. 一个简单的API接口即可解决

AssemblyAI初创时面临资金短缺和技术资源匮乏的问题，甚至只能依靠CPU进行缓慢的迭代训练。幸运的是，Y Combinator的资源支持使他们得以建立自己的GPU服务器。有了硬件支持后，AssemblyAI开始着手收集训练所需的语音数据。由于初创公司无法像谷歌或亚马逊那样调用大量用户数据，他们自主研发了Harvest架构，用于在网络上搜集音频数据。这个架构能够高效地寻找并标注可用于训练AI模型的数据，从而确保了高质量的训练数据。几周内，AssemblyAI已经积累了数百万条高质量的音频片段，用于训练其神经网络。

经过几年的发展，AssemblyAI现已能为80多种语言提供基于API的人工智能服务，包括自动转录、主题检测、内容审核和“自动章节”功能。“自动章节”功能可以将音频和视频文件分解成多个片段，并为每个片段提供摘要，便于管理和检索。

除了常见的语音转录功能，AssemblyAI还能进行情绪分析、实体检测和内容审核，帮助用户实时了解音频内容的关键信息。只需调用一段API代码，开发者便能轻松获得这些智能语音服务，每次调用只需支付小额费用，最低每秒仅需0.00025美元。

当大多数公司在算法优化上绞尽脑汁时，AssemblyAI从用户需求出发，将智能语音服务做得既实用又经济，从而在竞争激烈的市场中找到了立足之地。

3. 市场和资本给予肯定

AssemblyAI推出后迅速赢得了市场的认可，华尔街日报、Spotify、BBC等知名企业和机构均成为了它的客户。Fox表示，目前AssemblyAI的用户已超过1万名，自2022年初以来用户数量增长了三倍，收入也随之增长近三倍。他们每天处理数百万次API调用，并计划在未来六个月内将AI研究团队扩大三倍，同时投入数百万美元升级GPU硬件，以训练更大、更复杂的AI模型。

2020年，AssemblyAI获得了500万美元的投资；2022年3月，在资本寒冬中，该公司再次获得2800万美元的A轮融资；同年7月，AssemblyAI又获得了3000万美元的B轮融资。Fox表示：“我们几乎没有动用A轮融资的资金。”在资本寒冬中，他们拥有足够的资源来提升技术实力并拓展市场。

过去，科技前哨曾介绍过许多利用API创业的成功案例，如Stripe和MongoDB。AssemblyAI则为我们展示了另一种可能：人工智能也可以通过API的方式实现商业化。随着人工智能技术的不断成熟，相信会有更多人效仿这一模式。

以上就是今天的内容，希望能给你带来启发。如果你喜欢我们的节目，别忘了分享给你的朋友们，这对我们非常有帮助。更多精彩内容，敬请期待明天再见！

科技前哨，每天为你点亮前行的灯塔。