日前,第十届全球移动互联网大会(GMIC)在北京顺利召开。本届GMIC聚焦“人工智能”,将主题定为:“AI”生万物,寓意科学技术要有人文的温度。早前,百度国际旗下的输入法Facemoji将“人文的温度”带入AI技术,在海外又更新并上线了一项最新的人工智能成果——英语语音输入功能。
Facemoji英语语音实时识别词准率达90%以上
百度国际输入法Facemoji在2016年于美国发布,凭借其前沿的AI技术及有趣的个性化特色,成为美国最受年轻人欢迎的输入法。据统计,该输入法已累积超过千万下载量,现在Google Play平台 (GP)用户评分高达4.7分(满分5分)。
据了解,Facemoji输入法更新的人工智能英语语音输入功能操作简易快捷。用户只需轻触键盘上的话筒按钮,即可进行英文语音输入。随着用户讲话,语音内容将实时、准确地呈现在手机屏幕上,还能根据断句自动添加标点符号。
此前,百度国际化团队做过一个实验,与美国《艾伦秀》的脱口秀主持人现场进行了一场AI的比拼。当时,主持人Ellen DeGeneres脱口的内容被Facemoji的输入法一字不差实时录入到了手机。而经过百度国际化产品团队的更新迭代,目前Facemoji的英语语音功能又取得了突破,据悉,现其词准率已达到90%以上。
百度自研平台开发实践上万小时数据的声学建模
据百度技术人员介绍,Facemoji更新的英语语音输入功能完全基于百度自研的深度学习平台进行开发,使用上万小时的语音数据进行模型训练,识别结果快速准确。在声学模型训练过程中,Facemoji借助了百度高性能的汉语模型进行迁移学习,利用百度准确率极高的中文语音识别系统来改善英语识别的准确率。
此次上线的英语识别系统选择三音子作为声学建模单元,采用深层长短时记忆循环神经网络结合连接时序分类的技术构建模型,从而有效利用语音序列前后的相关性提高识别的准确率。
据介绍,为了提高识别系统的鲁棒性(Robustness),百度国际化团队还使用了加噪和速度扰动等数据增强技术对训练数据进行扩充,保证系统在实用场景中的高准确率。另外,该识别系统的词典模块也会定期扩充,覆盖用户输入的新词或专有名词。
(Facemoji英语语音实时识别界面)
Facemoji开发中国特色表情纳入全球emoji标准
Facemoji自革新推出后,极速占领彰显个性的年轻人市场,除了解放双手直接用语音输入外,个性化和特色设置也是它快速攻占美国年轻市场的主要原因。用户不仅可以选用自定义的个性化图片制作自己专属的键盘皮肤,还可以添加特殊的按钮点击动效,获得广大用户好评。
在使用信息交流中,文字不再是唯一的交流语言,表情符号Emoji更丰富了人们的沟通互动。Facemoji支持超过1,200种表情、贴纸、GIF等,其智能预测功能可基于用户的使用习惯和喜好,针对不同区域不同种族的用户,提供颇具本土特色的Emoji表情预测,帮助用户更好的表达自我。
有趣的是,为了结合中国传统特色春节,Facemoji团队亦专门设计了三款趣致而不失传统的中国元素Emoji:“月饼”、“鞭炮”、“红包”。这三款Emoji更获得Unicode的认可并纳入了Unicode 11中。也就是说,我国传统文化元素将在全球大量不同的app和平台(包括IOS)中获得广泛应用。
百度语音识别技术逐渐脱颖而出 日语识别精度超越谷歌
百度国际表示,Facemoji未来的发展目标是为全球用户提供更有趣的用户体验、更有效率的产品服务,通过语音输入功能,彻底解放双手。现时,Facemoji输入法支持上百门语言,获得全球超过千万下载量,用户覆盖欧美、拉美、东南亚等地区,远超过同类型产品。
此外,小编还留意到,百度国际的语音识别技术也拓展到日本市场,其旗下出海的Simeji输入法获得了日本市场的广泛应用,已成为日本最大的第三方输入法,日语语音识别精度已超过谷歌。百度国际认为,语音识别技术是人工智能领域的重要组成部分,百度国际会秉持将”人文的温度”带入人工智能技术,打造真正关怀、了解用户的产品。