近日,新版讯飞输入法正式上线,日汉翻译、韩汉翻译、泰越西翻译、法德翻译、俄语翻译、中文翻译共18种翻译,使讯飞输入法成为中外互译最多的输入法产品。

不得不说,语音输入越来越普及了。据艾传媒《2019-2020中国第三方手机输入法市场监测报告》显示,29%的受访者表示,2019年使用语音输入的频率大幅上升,是增长最快的输入法。


面对输入法的变化,讯飞输入法、百度输入法和搜狗输入法一直围绕ai技术不断增加语音输入服务,从而不断实现准确性的突破。比如讯飞输入法的语音识别准确率已经达到98%。

在日益智能化的输入法背后,每个家庭的ai技术至关重要。面对每天数亿次甚至数十亿次的使用,今天的输入法产品已经嵌入了意想不到的丰富多彩的黑色技术。

输入法负担重


越来越多智能输入法的代价就是要承担越来越重的使命。追溯市场上几种主流输入法产品的发展历史,可以发现这些产品并不年轻,至少有十年甚至更长的产品迭代时间。基于这个计算,输入法产品的发展是与移动互联网同步的,可以说是一路跟随移动互联网。

最早的输入法,无论是设备自带的输入法还是第三方输入法,一般功能都比较简单,比如只支持9键和26键键盘输入,手写输入等非智能机器时代继承下来的输入法,主要是为了满足最常见的用户需求。


但是,移动社会化、移动趋势的清晰化、智能手机的普及,彻底改变了输入法产品的发展路径。个人用户在多样化的场景中不断产生更多的输入需求,开始特别关注输入体验的进度,希望得到更快更好的结果,比如是否能根据拼音的首字母快速预测出自己想要键入的单词。特别是在移动社交场景中,个人用户使用输入法的频率越来越高,用户对输入法体验的感知非常明显。输入法好不好,效率不高,用户很了解。

[科技界] 人工智能时代来袭,输入法如何决胜下一个10年

这使得输入法的负担越来越重。输入法原本定位为一个轻量级的服务工具,不得不开始思考如何满足不同场景下不同用户的个性化需求。因此,为大规模用户提供高质量的输入法服务成为输入法产品开发的核心目标。

更通用的输入法


场景和需求的变化不断推动输入法产品的演变,从而使输入法变得越来越通用、越来越精细、越来越个性化。以三大输入法产品为例,十年前和十年后完全不同。

一方面,功能的不断增加使得产品适应了很多输入场景。三种输入法除了传统的手写和键盘输入外,还增加了ocr扫描、智能预测/纠错等功能。其中ocr扫描是指用户可以通过扫描将图片或手写文稿转换成文字,而智能预测功能可以根据输入的拼音提前预测用户想要键入的文字,智能纠错可以根据词库和上下文快速纠正用户的错误。

[科技界] 人工智能时代来袭,输入法如何决胜下一个10年

【/s2/】输入法具有多种功能,可以服务于用户的整个输入过程,并在输入前、输入中、输入后提供相应的服务。


另一方面,产品能力的终极突破给用户带来了全面的体验。以从语音开始的讯飞输入法为例。目前讯飞输入法已经实现了每分钟400字的输入速度,语音识别准确率达到98%,这意味着整个输入的错误率非常小,给用户带来了快速流畅的综合输入体验。

可以说这些功能达到的极限颠覆了以前低效低质量的输入体验,从感官上弥补了输入法用户体验的不足。

黑技术成就输入法


无论是功能上的全能还是体验上的全能,输入法产品都能做到质变,甚至能适应一些极端、极端的输入场景。除了产品本身的创新,持续的技术迭代是核心原因。之所以用户只用一半的时间就能完成整个输入过程,是因为输入法背后的黑屏技术。

【/s2/】讯飞输入法可以说是最好的科技成果代言人输入法。【/s2/】一方面有科大讯飞做后盾,拥有20多年的智能语音技术,积累了20万小时的训练数据;另一方面,科大讯飞在国际比赛中有太多的最高荣誉。例如,在2018年由国际计算语言学协会(acl)主办的第12届国际语义评价比赛(semeval2018)中,科大讯飞凭借常识赢得了机器。阅读理解世界第一;在2018年国际权威英语语音识别大赛“编钟-6”中,科大讯飞获得两项第一;2019年,在icdar2019举行的情景文本视觉问答挑战赛st-vqa中,科大讯飞获得三项冠军;2020年初,在200亿-jester数据集的德国手势识别评测中,科大讯飞以97.26%的准确率夺冠,并创下新的世界纪录& hellip& hellip讯飞输入法背后的黑技术可以从四个方面来看。

[科技界] 人工智能时代来袭,输入法如何决胜下一个10年

首先,语音输入


语音输入快速准确。讯飞输入法之所以能达到每分钟400字,识别准确率达98%,在于其自主研发的多通道全端到端语音识别框架,增强了记忆性。简单来说,该技术可以完全深入学习前端语音处理过程,利用深度卷积神经网络和后端识别模型进行混合训练,从而大大提高语音识别的效率。

至于能否使用23种方言进行准确的语音输入,一方面取决于共享多种方言训练出来的多语言多语言建模技术,另一方面取决于globalphone电话机。该技术从声学相似度统一了每种方言的音素定义,从而可以进一步细化方言地图模型,有效提高方言识别效果。多语言翻译功能对该技术提出了更大的挑战。以汉英翻译为例,讯飞输入法提出了一种基于反样本训练方法的高鲁棒性语音翻译技术,并结合模型中的具体技术有效提高最终翻译结果。

[科技界] 人工智能时代来袭,输入法如何决胜下一个10年

二.拼音输入


在拼音输入上,讯飞输入法创新性地引入了编解码框架,构建了新一代拼音识别引擎,大大简化了传统的拼音识别模型。同时,在注意机制、长短期记忆网络门控机制、变压器等模块的共同作用下,有效提高了长句输入的识别效果,可以提前预测用户想要输入什么,有效实现智能纠错。

此外,由于该模型采用顺序建模,建模不再依赖词典,更容易实现汉英混合建模,因此讯飞输入法在汉英混合输入中取得了优异的混合输入性能。值得注意的是,智能预测和智能纠错背后都有数百万个可以实时更新的词汇。

三.手写输入


笔迹一样,但体验完全不一样。这是因为讯飞输入法的手写识别可以支持2万多个汉字、52个英文字符、10个阿拉伯数字和100多个特殊符号。这个超级识别能力的背后是讯飞输入法的hwr手写识别技术。该技术采用cnn卷积神经网络技术,可支持实时手写轨迹,边写边写,单个字符识别仅需15ms,响应迅速,无延迟。

四.扫描输入


扫描输入的技术支持是计算机视觉。面对复杂的手写字符和中英文混合字符,ocr字符检测技术可以检测任意方向和形状的字符,而ocr字符识别技术可以有效缓解环境问题带来的识别效果低的问题。

【/s2/】综上所述,基于ai和大数据的结合技术,今天的输入法已经不再是死板生硬,即使面对复杂的输入场景需求,也能满足不同语言、不同语境、不同语调的不同用户的需求。以前输入法只能辅助,现在科技支持的输入法更像是一站式输入管家。


输入法智能泛化


黑技术成就了输入法及其地位。根据相关报道提供的数据,以三大输入法为代表的第三方输入法已经覆盖了90%以上的中国网民。

如果放大到整个输入法行业,可以说无论是移动设备还是个人电脑,每个人都是输入法的受益者,日常交流离不开输入法的帮助。可以说输入法已经成为互联网交流的基础设施。幸运的是,讯飞输入法等头部产品的技术演变,使这个基础设施不断发生质的变化,变得越来越智能化。

【/s2/】应该说像讯飞输入法这种永远执着于技术的输入法产品,是输入法作为工具产品价值跨越式提升的关键,因为他们用技术无限提升了输入法产品价值的上限。换句话说,讯飞输入法的科技解决方案在一定程度上提高了整个互联网世界的交流与合作效率。


技术没有上限,输入法产品也没有上限。对于国内9.04亿互联网用户来说,黑科技不断加持下的输入法工具将继续为每一位用户提供独特的体验,真正实现全方位的智能化和包容性。

文/刘匡微信官方号,ID:刘匡110 [/S2/]

标题:[科技界] 人工智能时代来袭,输入法如何决胜下一个10年

地址:http://www.heliu2.cn/xw/7995.html