10月21日,杭州云栖大会上,阿里巴巴达摩院宣布软硬件连系语音产物“听悟”。相比只能逐字转写的上一代语音产物,“听悟”是面向未来集会的AI助理,集成了达摩院最新语音及自然语言处置手艺,不仅“听”得准,且“悟”性高,可秒速天生智能集会纪要及待办。

 

集会场景对语音转文字产物有强需求。但因手艺限制,传统语音产物存在“听禁绝、分不清、看不懂”等问题,往往在噪音下识别准确率较低,无法区分差异语言人,转写内容冗长难以阅读和沉淀。针对痛点,达摩院语音实验室打造了“听悟”,通过让AI深度介入,让线上及线下集会更智能、高效、协同。

“听悟”内置达摩院独创声纹融合方位算法,能对多达10位语言人举行角色星散;融入达摩院新一代端到端语音识别模子,中文识别准确率可达98%,支持14种方言及中英文“自由说”;可嵌入线上音视频集会,实时出字幕及纪要。

除了听力好,这位AI助理悟性也高。 “听悟”能模拟人工致理,举行智能纠错和分段,自动过滤语气词,让天生文本更流通。同时,“听悟”善于抓重点,可秒速天生要害词、焦点结论、重点内容和待办,用户能同屏编辑、标注摘要、一键分享、平安保留。“听悟”还能对常用词、用户行为及历史文档举行自学习,越用越伶俐。

SpaceX星际飞船原型SN20完成两次静态点火测试

此外,“听悟”设置了智能麦克风,融入达摩院指向性差分麦克风阵列手艺,可实现7米内远距离360度高清收音,相比传统麦克风收音距离、抗噪能力大为提升。

 

达摩院语音实验室认真人鄢志杰示意,“语音手艺的生长是不停解锁场景的历史,集会作为当下组织协同的焦点场景,是语音AI将变化的下一个主要场景。”

鄢志杰先容,“听悟”适用于企业集会、金融调研、媒体访谈、教育培训等泛集会场景,现在面向企业客户,已为多家头部金融企业提供服务,且应用于钉钉新上线的“钉闪记”功效中。未来,“听悟”还将探索与集会厂商互助。

IDC讲述显示,阿里AI近年在语音语义领域显示强劲,市场年增进率达96.6%,增速第一,总营收中国前二,已深入政务、金融、电商、执法等行业,应用于集会、客服、IoT、搜索、文天职析等场景。


余承东:HarmonyOS设备数量超1.5亿