法国人工智能初创公司Gladia近期成功完成1600万美元的融资,并推出了一款多语言实时音频转录和分析引擎。这款引擎能够支持超过100种语言的高级实时转录,延迟时间低于300毫秒。目前,Gladia的API已经服务于7万名用户和600家企业客户。
Gladia新推出的微调引擎能够提供100多种语言的实时转录服务。这一引擎特别增强了对各种口音的识别能力,能够迅速适应不同的语言环境,从而为用户提供更为全面和高效的语音转文字体验。
Gladia首席执行官兼联合创始人Jean-Louis Quéguiner表示,他创立Gladia的初衷源于个人经历,现有的音频转录服务无法准确识别他的法语口音。因此,Gladia致力于开发出第一个真正多语言的实时产品。
此外,Gladia引擎能够从对话中即时提取关键信息,例如来电者的情绪、对话中的关键信息和摘要。这意味着使用Gladia从通话或会议中生成文字记录和见解只需不到1秒钟的时间。
实时语音转录在语言理解和实时数据处理方面面临诸多挑战。其中一个关键问题是语言资源的数量和质量不足,大多数语音识别系统主要依赖于英语音频数据进行训练,这在一定程度上限制了它们对其他语言的识别能力。
为了克服这些挑战,Gladia致力于开发一个真正多语言的实时语音识别产品。该公司新开发的微调引擎能够提供100多种语言的高级实时转录服务。此外,该引擎能够在极短的时间内提供准确的转录结果,延迟时间低于300毫秒。
Gladia正在将其多种AI功能整合到其现有平台上,包括实时转录和分析。其单一API兼容所有现有的技术栈和协议,这使得实时转录和分析能够轻松集成到客户的AI平台中,让他们能够专注于为终端用户提供最佳服务。
自推出以来,Gladia的API已在企业应用中受到广泛关注,特别是在会议记录和笔记辅助工具方面表现突出。目前,该API已为超过7万名用户和600家企业客户提供服务,包括Attention、Circleback、Method Financial、Recall、Sana和VEED。
Gladia计划利用新资金推进研发,推出一站式音频AI工具包,并通过大语言模型和检索增强生成扩展其产品范围。Gladia在联络中心即服务 (CCaaS) 领域拥有多家设计合作伙伴,目前正在试行由Gladia的实时AI引擎提供支持的代理协助解决方案。
Gladia的这些新举措,加上新资本的助力,将进一步巩固其在竞争激烈的市场中的地位,为Otter.ai和Fireflies.ai等竞争对手带来新的挑战。
以上内容是对原文的改写,旨在保留原文的核心信息,同时提升文章的紧凑性和可读性。