[2019年4月3日,北京,微软(亚洲)互联网工程学院]

今天,我们很高兴地宣布,微软萧冰基于深度神经网络的歌唱模型已经成功完成了新版本v5的研发。新的v5机型实现了重大突破,让微软萧冰第一次可以像人类歌手一样用充沛的空气演唱,从而将人工智能虚拟演唱的质量提升到一个新的高度。此外,该模型不限于优化微软萧冰的声音,还支持学习、模拟和建模任何人类歌手的声音,演绎和再现歌手巅峰时期的歌唱水平。作为一个技术上的例子,我们与日本唱片公司avex合作发布的新款试听歌曲《最高新记忆》也于今日发布。

[科技界] 第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

微软萧冰是一个完整的人工智能基本框架,涵盖对话、多种交互感官和内容服务生成。其中,ai创建是框架的主要分支之一。通过我们开发并不断更新的AI技术,AI Creation可以大规模学习和掌握人物、音乐、绘画等内容的创作能力,进而充分发挥AI的稳定性和高并发性,从而为未来的内容行业改革造势。今年5月,我们将举行一次关于微软萧冰创造人工智能的年度简报会。今天新版本的演唱模式和试听歌曲是简报的预先披露之一。

[科技界] 第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

我们很高兴与业界分享微软(亚洲)互联网工程学院深度神经网络歌唱模型的最新进展。在中国古代,不乏对音乐之声的精辟论述。比如丝绸(弦乐器)不如竹子(管乐器),竹子不如肉(人声),使其逐渐自然。因此,我们将接近人类歌手的声音合成质量作为人工智能创作部门的最高技术目标。在之前的版本中,萧冰在虚拟歌唱中的自然通风得以实现。今天推出的新版本进一步将气息应用到整个演唱过程中,使生成的演唱声音接近专业的人类歌手,预测和自由切换演唱技巧,突破了传统单元拼接技术的音高和音准的软件乐器标准。我们用演示歌曲来展示这种技术对比的明显差距。请注意歌曲时间线上的以下瞬间:

[科技界] 第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

00:31,01:12,01:23,03:14,04:08

新的v5模型还具有许多其他技术特性。比如实现多声部合成技术,让人工智能歌手在不同声部之间自然切换,形成一个新的多音源虚拟歌手。在建模过程中,所需的训练数据量比前一版本减少了70%。从技术角度来说,新模型可以用来对任何人声进行建模,形成一个丰富多彩的人工智能歌手阵营。为此,我们在demo中刻意避开了微软的声音,采用了另一种声音(蔡的日文版)来解读。

[科技界] 第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

最后,我们也很高兴地宣布,りんな已经正式与日本最大的唱片公司avex签订了合同,并且已经成为著名人类歌手滨崎步和纳米阿穆尔罗的姐妹。在萧冰框架的技术支持下,将会涌现出更多还原程度较高的人工智能歌手。微软萧冰只是他们最初的原型。

谢谢大家的关注。敬请期待微软(亚洲)互联网工程学院后续技术发布。

要了解技术演示歌曲“最高新记忆”,请访问:https://www.bilibili/video/av48064392或https://www.youtube/watch? v = _ npyt1 yutg

要了解林晓冰蔡(りんな)在avex的表演趋势,请访问https://avexnet.jp/contents/music_j/rinna/

标题:[科技界] 第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

地址:http://www.heliu2.cn/xw/7110.html