搜狗 AI 合成主播,它将会改变些什么?

搜狗 AI 合成主播,它将会改变些什么?

摘要:伴随着各项关键技术取得突破,人工智能风潮早已席卷各行各业。推动技术落地实践的愿景固然很美好,涉及如果提供更加人性化的应用体验,一定程度上成为了落地探索中必须考量的因素。

伴随着各项关键技术取得突破,人工智能风潮早已席卷各行各业。推动技术落地实践的愿景固然很美好,涉及如果提供更加人性化的应用体验,一定程度上成为了落地探索中必须考量的因素。

在看过了全球首位AI合成主播的惊艳表现之后,我们会不禁对前沿技术与感官体验达到融合共洽的前景充满信心。这位AI合成主播的初次亮相是在2018年的世界互联网大会上,是由搜狗与新华社共同发布的。



从名称就可以看出,这款产品深度集成了搜狗的多项人工智能技术,包括语音合成、唇语合成、表情合成、情感迁移、以及深度学习等,这些关键技术也构成了搜狗分身技术的核心框架。

更为重要的是,在这位合成主播的背后,还承载着多模态交互技术,即让声音与图像实现协调匹配,并实时进行视频输出,在视觉与听觉等多重维度上提供无缝顺滑的体验。

得益于前沿技术的有力加持,这位合成主播的表现也是可圈可点:前期只需少量的数据训练,即可呈现与真人相差无几的播报状态,同时支持个性化定制;不仅可以将新闻稿快速的转变为播报视频,而且还能妥善处理声调起伏、语言风格、情感韵律等;能够提供全天候不间断的播报服务。具备了这些优势,合成主播无疑将极大的提升广电行业的传播效率,切实让人工智能技术得到普惠式的应用。

之所以合成主播在刚一亮相就能够收获广泛好评,其中一个很重要的原因是搜狗始终秉持的「自然交互+知识计算」的理念。

从这款产品的功能定位不难看出,对于人工智能技术的应用探索,搜狗还是致力于让机器成为辅助表达与信息获取的分身以及助理,这同时也是搜狗给技术落地提出的战略目标。

回顾过去,我们可以看到这种技术演进的路线正在逐渐清晰:在搜狗搜索中,可以做到输入中文一键连接全球网页;发布拳头产品翻译宝Pro,助力中英文的无缝转换;在输入法上,推出AI制音坊,为自然交互的愿景代言。以上种种举措,都无不传递出搜狗正在全方位的释放人工智能技术的实力,在让沟通与表达变得更加简单和高效的理念指引下,切实为广大用户提供更加贴近生活并贴近人性的产品。

根据公开数据,2018年搜狗输入法日均语音功能调用量已经达到了5.34亿次,这一方面凸显了搜狗输入法的头部地位,另一方面彰显了人工智能技术在搜狗的各条产品线存在着广阔的应用场景与发展潜力。

由文字输入为基点,不断在语音、搜索、翻译等相关领域取得进展与突破的搜狗,基因当中蕴含着做信息桥梁的使命与初衷,这些基于使命与初衷进行的探索与尝试也为搜狗决胜人工智能时代积累了丰富的应用场景。

不可否认,兼具应用场景与技术实力将为搜狗发力人工智能提供原动力,我们有理由相信在未来搜狗将带给我们比AI合成主播更大的惊艳。

本文作者:宋玥玮