语音识别“拐点”已至,现在切入才是好时机?

图灵汇官网

现在正是进入语音识别领域的最佳时机,因为这个行业正处于转折点,市场需求日益增长。探境科技CEO鲁勇在接受《电子发烧友》采访时提到,现在正是切入市场的好时机。

转折点的由来

根据Gartner今年8月发布的“人工智能技术成熟度曲线”,仅有两项技术处于“生产力成熟期”:语音识别和GPU加速器,且它们正处于上升阶段。市场反馈也表明,这两个技术是当前AI项目中落地最快、最广泛的。

语音识别面临的挑战

在语音识别的实际应用中,智能家居领域是最常见的应用场景,以智能音箱为代表。然而,用户反馈显示存在两个主要问题:一是复杂声场环境和噪音影响导致语音识别准确率大幅下降;二是用户对于智能音箱的安全性产生了担忧。

第一批智能音箱在满足用户好奇心后,逐渐沦为鸡肋产品,要么闲置在家,要么因安全隐患被束之高阁。这表明,智能音箱未能成为市场爆款。

市场需求与解决方案

语音作为人机交互的重要方式之一,其最终目标是实现自然交互。但目前的技术仍需改进,尤其是在噪音处理、远场语音识别率提升以及用户安全等方面。在家庭场景下,语音识别面临两大挑战:低信噪比和非稳态噪声的影响。

探境科技的核心技术

探境科技自主研发的AI降噪算法,不仅能够处理稳态噪声,还能有效过滤非稳态突发性噪声。通过该算法,即使在信噪比极低的情况下,语音识别准确率也能大幅提升。

此外,探境科技还引入了高计算强度的神经网络(HONN),在语音识别中加入更多卷积操作,以提高识别效果。HONN相较于传统DNN模型,不仅能显著提升识别准确率,还降低了存储需求和功耗。

探境科技的双麦算法

探境科技设计了一种基于FCSP的端到端AI双麦算法,直接输入阵列信号,输出最终识别结果。这种方法简化了识别流程,提升了识别准确性。

SFA芯片架构

鲁勇指出,市场上一些玩家要么有芯片但缺乏算法,要么有算法但缺少芯片,这难以在市场上形成竞争力。探境科技则致力于提供全栈式技术能力,包括芯片设计、算法研究、软件开发和系统集成,提供一体化解决方案。

探境科技采用的SFA(存储优先)芯片架构,以存储驱动计算,具有高能效比、高资源利用率和强通用性的特点。这种架构在深度学习应用中表现出色,系统能效超过4T OPS/W。

探境科技的发展前景

凭借独特的AI降噪技术和HONN神经网络,探境科技的Voitist音旋风611已实现百万级出货。探境科技计划覆盖智能家居市场的多个领域,形成矩阵式入口。

离线智能语音交互是当前重要的细分领域,它无需联网即可实现本地语音交互,保护用户隐私安全,减少数据传输压力。此外,探境科技还涉足图像识别领域,其图像芯片在2019年第四季度成功流片,并已在某些领域产生收入。

鲁勇认为,AI芯片市场竞争如同马拉松,比拼的是耐力而非冲刺速度。探境科技能否在智能家居市场站稳脚跟,还需市场检验。

本文来源: 图灵汇 文章作者: 智能天下