文|音乐先声(ID:nakedmusic),作者|柳成枝,编辑|范志辉
近期,美国数字研究机构Space进行了一项有趣的试验:基于人工智能(ArtificialIntelligence,简称AI)技术,模仿知名说唱歌手TravisScott的人声和音乐风格,做出了一个说唱机器人TravisBott。
这个试验的目的是为了看AI到底能够持续创造出什么。
事实上,TravisBott真的创作了一首歌《JackParkCannyDopeMan》,且歌词和旋律均由自己完成。同时,Space还使用基于AI的人体图像合成技术Deepfake,为这首歌拍摄了MV。
说实话,与以往的AI歌曲不同,这首AI歌曲在对真人继续学习后,近乎到底了真人的听感。国外网友在MV下面留言道。betterthanrealtrvis(比真人还好)Prettyamazing,thisisonlythebeginning(太棒了,这仅仅是个开始),甚至开始担心AI会奴役人类,但自己还是会买票去看。
原理上,Space采用附加神经网络技术(AdditionalNeuralNetwork)创造出旋律和打击乐伴奏,再将TravisScott的歌词输入文本生成器模型(TextGeneratorModel),两周后,AITravisBott开始创建了歌词的韵脚(rhymes)。
从效果来看,TravisBott模仿TravisScott几乎达到了以假乱真的地步,完全融汇了TravisScott作品以及人物魅力的最主要的外显特征,以至于被调侃可以加入Spotify的说唱热门歌单《RapCaviar》。
与此同时,该项目也进一步验证了人工神经网络技术(ArtificialNeuralNetworks)的进步,有助于探索未来AI在音乐中的应用价值。
不可否认的是,AI已经渐渐地嵌入到我们的日常生活中。在互联网+以及工业制造4.0的新时代背景下,具备通信、网络与人机交互功能的AI作曲覆盖到教育科普、艺术表演和娱乐服务等领域已是大势所趋。而面对AI音乐的优异表现,也让我们思考:音乐人在与AI音乐的共生中,是否会遭遇到AlphaGo式的碾压?
如何克隆TravisScott?
事实上,AI作曲(AlgorithmicComposition,也称算法作曲)并不稀奇,复制TravisScott也并非难事。
早在年,索尼旗下的计算机科学实验室(ComputerScienceLaboratories,简称SonyCSL)研究人员哈杰里斯和帕切特就曾开发了一个名为DeepBach(深度巴赫)的神经网络。他们利用巴赫创作的部作品目来训练DeepBach,创作出了首赞美诗。
而第一个正式获得世界地位的AI虚拟作曲家则是由年诞生的初创公司AivaTechnologies推出的AIVA(ArtificialIntelligenceVirtualArtist)。它的创作方向主要是古典音乐、影视配乐,发展到现在也逐渐有了其他类型的作品,例如摇滚乐、流行乐等。作为虚拟音乐人,它通过了法国和卢森堡作者权利协会(SACEM)的合法注册,并拥有自己的署名版权。在AI领域而言,复制一位或多位音乐人的音乐风格的工作也许早已在进行中。
目前来看,无论是DeepBach、AIVA抑或是TravisBott,AI作曲背后都是一种基于人工神经网络的深度学习(DeepLearning)技术。在这种深度学习中,程序员必须搭建一个多层神经网络,并在多层的结构中分别加以编程,从而可以处理各种输入和输出点之间的信息。
来源于:·菠萝科学奖,人工智能主题解读
譬如说,DeepBach被输入的是巴赫的部作品,AIVA被输入的信息是以巴赫、贝多芬、莫扎特等为代表的古典作曲家作品的大数据库,而TravisBott被输入的则是TravisScott的作品、人声以及音效。
在数据输入后,人工神经网络会找到众多被输入作品之间存在的规律,继而形成对音乐风格的理解。但这个音乐风格并不是最终的产物,其主要目的是用来预测,AI程序会带着它对音乐风格的预测继续运行,而在前方将会遇到下一个验证数据集。这个数据集会告诉它预测的正确与否,正确与错误的回馈都将被AI记住,在不断的高速学习中,AI的预测能力就会越来越强,最终掌握程序员大数据中归总后的曲风,进而能编写出自己的曲子。
而AI创作者TravisBott的突破,则在于其不止是输入了TravisScott的作品,更输入了人声及音效,文本与声音的输入与输出在深度学习上又更上了一个台阶。
来源于《IamAI》系列短纪录片
这种深度学习,看似只是基于人类大脑的神经结构简单模式,但在某种程度上已经可以像人类一般思考了。这也使得AI能够在数据中理解并塑造高度抽象化的模型,例如旋律中的模型,或者人脸的特征。
但从人工智能音乐的发展沿革而言,人工神经网络只是AI作曲的主要技术之一,与其他算法相比,有其优点也有其劣势。就优势而言,具有自学能力、联想存储功能、高速寻找优化解的能力是人工神经网络较其他算法最卓越的地方。
来源于:·菠萝科学奖,人工智能主题解读
但其劣势也较为明显:1.著名的黑匣子问题,意味着你不知道神经网络将会如何产出结果,更不知道为什么会产生这种结果;2.与认知不同,作曲是更高层次的智能活动;3.耗时耗力;4.数据饕餮,相较于传统的机器学习算法,需要更多的数据;5.算力成本较为昂贵。
在实践中,即便是最先进的深度学习算法,要实现真正深度神经网络的成功训练,仍需要数周才能完全训练完毕。而目前AI作曲在主要技术上尚不存在最优解,大多采用混合型算法(HybridAlgorithm)。
如何避免AI作曲的版权风险?
与此同时,AI作曲的整体不足也较为显化。正如前文所言,AI作曲本质上就是大数据和云计算,AI音乐产生的过程就是机器根据程序员输入的要素或者是模式,在庞大的资料库中总结提取与之相匹配的特征,而后根据这些特征提取各种资料元素进行新的组合或者是延展。
这里面必然存在一个问题是:这个巨大的数据库如何区分哪些数据是有版权保护的?哪些是公共数据?数据库的搭建者如何保障具有版权数据的权益?使用数据库的主体如何做到不侵权?
很显然,目前的AI作曲在某种程度上仍旧无法完成或者说无法自主完成这一任务,版权的规避大多来自于程序员的有意为之。
年,AivaTechnologies对AIVA选择专注古典音乐的解释也正好回应了程序员对于AI作曲版权的刻意设计:用来训练Aiva的古典音乐数据库不涉及版权问题,因为版权都过期了。
对于开头的TravisBott而言,其对于TravisScott的学习中,作品库、人物形象的采样必然也要先取得TravisScott的授权,但其学习后生产出的作品又如何避免对TravisScott形成抄袭呢?
这一情况,也是造成目前市场上AI作曲质量参差不齐的原因之一,某种程度上来说,抄袭或许很难避免。查重工具(PlagiarismChecker)以及查重的尺度在这里就显得尤为重要了,但就目前的实践来看,人类音乐人歌曲抄袭判断标准都还在寻求统一化中,何论AI作曲?
而即便AI作曲经历千辛万苦后终于生产出一个纯原创、不涉及任何侵权的作品,他(她)又将面临到版权认证的问题。
根据我国《著作权法》对于著作权的定义,著作权是著作权法赋予民事主体对作品及相关客体所享有的权利。其中,民事主体指公民、法人或非法人组织。AI在主体身份上就无法获得认可,权利的获得与放弃都变得尤为复杂。如果产生侵权纠纷,将难以解决。
比如,微软小冰独立创作的诗集《阳光失了玻璃窗》,作品一经发布后就出现了很多的盗版以及很多不规范引用。这种通常意义上的侵权,却因为缺失法律规定的缺失,版权的归属也就谁都说不清,侵权也就听之任之了。
但值得一提的是,相较于国内的空白,国外对于AI作品的放宽与认可已然成为一种常态,英国、南非、新西兰属于第一批明确认可AI版权的国家。而美国、日本、澳大利亚虽然在成文法上并未有明确规定,但在司法实践中都进行了不同程度的尝试。这也是为什么美国在成文法上未对AI作品进行认可,但在司法实践中却有胜诉的案例。
但中国因为是成文法国家,判例法并不是法的正式渊源,无法与普通法系(或英美法系)形成法官造法的司法实践,所以从制度上明确AI作品才是最根本的。
不可否认的是,受制于多国在AI领域以及法律操作上的水平差异,要获得大范围的认可或许仍有待时日。当然,在其中取巧也较为简单,在AI生成的作品加入人类艺术家的名字就可以突破这一桎梏。
年9月7日,AIVA的纯音乐专辑《艾娲(Vol.3fromartificial
转载请注明:http://www.0431gb208.com/sjszyzl/1035.html