人工智能看图谱曲：下个莫扎特会是一台机器吗？

最近《中国新歌声》开播，然而整个节目几乎没有什么亮点，使得观看过程无聊大于愉悦。作为一个曾经追过《中国好声音》的人，不得不说，即使抛开版权之争导致的问题，这届《中国新歌声》似乎很难抓住观众的耳朵和眼球了。

尤其参选的选手选唱曲目简直毫无新意，总是拿着四位导师的作品和一些老歌翻来覆去的唱，观众的耳朵早就听出了茧子。而作为一个科技控，我想，如果在这个时候，有一位选手上来跟大家说，演唱的歌曲作者不是人，而是人工智能的话，一定会让所有人眼前一亮，甚至让这个节目瞬间火爆。

这可不仅仅是一个设想。作为人工智能的技术开拓者，百度的人工智能技术正在逐渐实现这个设想：在联手尤伦斯当代艺术中心举办的“AI科技与艺术之夜”的活动中，百度利用人工智能技术，完成了机器读图和音乐再创作，将美国艺术大师罗伯特劳森伯格的传奇式巨作《四分之一英里画作》的其中两联分别谱成了20余秒的钢琴曲，实现了视觉呈现向听觉表达的转化。

人工智能是如何做到看图谱曲的

事实上，在目前来说，全球范围内能够实现人工智能自动谱曲的仅有百度和谷歌，而本次百度尝试将图像所体现的情感“移情”转变为带有声音信息的技术则更为复杂。在给我们带来极大的想象空间的同时，也说明了百度在人工智能技术方面的领先优势。在百度的努力下，也许，下一个莫扎特将会是一台拥有人工智能的机器。

据悉，百度用上千台PC服务器和近1000台GPU服务器构建了世界上规模最大的深度神经网络，支持万亿参数、千亿样本、千亿特征训练；在算法上百度应用了深度神经网络等分布式算法，支持的功能包括语音识别、图像识别、自然语言处理等等。此次的人工智能看图谱曲，正是通过其全球最大规模的深度神经网络和深度学习算法由机器自主学习实现的。

百度神经网络在“看到”图像后，首先会对图像进行分析解读，为图像打上若干具象化的标签，然后通过搜索挖掘相关的音乐信息，对音乐拆分重组，再合成与图片内容相匹配的音乐旋律，最终拼接成完整的曲子。仅仅从过程来说，看图谱曲和这比常规意义上的我们理解的谱曲更加困难，正如同命题作文和自由作文的区别。

人工智能看图谱曲：下个莫扎特会是一台机器吗？