玉、凿与匠人

玉、凿与匠人

长久以来,围绕虚拟歌姬的争论似乎总是在两端之间拉扯:她到底是工具,还是偶像?

“工具论”者强调她的声库本质:她是软件,是数据,是创作流程中被操作的对象。

“偶像论”者强调她超越声库的那部分:她有名字,有形象,有人格,有千千万万人赋予她的情感。两方各执一词,争论往复。

但我一直觉得这个问题的提法本身就有些不对。

如果虚拟歌姬是”工具”,那么 Vocaloid 是什么?Ace Studio 是什么?SynthV 是什么?这些才是你在创作时打开、操作、关闭的软件——如果它们不叫工具,什么才叫工具?

工具一词在讨论中被用得太宽泛了,宽泛到把本应区分的东西混在了一起。

昨天,ilem 在一些想法中重申了他的立场:洛天依是声库,也只是声库。他的逻辑很清晰——只有当她确定地是一件工具的时候,创作者对作品的完整所有权才能成立,”调教”这道工序才能被承认为一项有意义的劳动。这个论述自洽且有力,他说出了许多创作者心里有但从未成文的东西。

然而我想指出的不是他说错了什么,而是他和所有参与这场争论的人一样,也许被一个过于粗糙的二分法框住了。”是工具还是偶像”这个问题,预设了只有这两个选项。但如果我们跳出这个框架,把创作过程拆得更细一些,也许会看到一种不同的图景。

我想提出一个三分法:料、具、人

一、料:歌姬是玉

先说”料”。

“工具”这个词暗含着一种完全的可替换性:锤子坏了换一把锤子,功能不变。但你把一首歌的人声从一位歌姬换成另一位,整件作品的质感就变了。这不是好与坏的差别,而是气质的差别。这说明歌姬参与了作品本身的物质构成,她不只是实现意图的手段。

与其说她是工具,不如说她是被雕琢的玉石。

每一款玉都有自己的质地:和田玉温润内敛,翡翠通透张扬,黑曜石冷峻深沉。不同的歌姬也是如此,每个音源的音色里天然带着某种情绪的倾向,她不是中性的白纸,而是有纹理、有硬度、有光泽的质料。你用同一首曲子交给不同的歌姬,出来的不只是音色的差异,而是整首歌的情绪走向、气质氛围都会随之改变。这不是”换了一把锤子”能解释的,这是换了一块玉。

但玉不会自己变成作品。

一块玉放在那里,它有自己的纹理和色泽,却没有主体性,没有意志,不会自己决定要成为什么形状。它只是在那里,带着自己的特质,等待被读懂。

玉雕中有一个俏色的说法:雕刻师顺着玉石天然的颜色分布来构思题材,让瑕疵变成巧思,让纹理成为表达的一部分。好的虚拟歌姬创作也是如此,创作者不是在强迫她表达任何东西,而是在读懂她的质地之后,顺着她的纹理走,找到最适合她的表达方式,然后把自己的情感注入其中。这种关系不是”使用”,而更接近于一种对话,尽管对话的另一端并没有意识。

而这种质地也不完全是天生的。

一位歌姬刚发布时,她带着的东西各不相同。有些拥有完整的形象、配色乃至人设故事——这些视觉与叙事的元素,在第一首作品诞生之前就已经为这块玉镀上了一层底色。有些只有一个名字和一副嗓音,气质几乎全靠后续的作品去慢慢定义。还有一些连形象也没有——比如那些只作为声音存在的字母人——反而因为少了视觉预设,留出了更纯粹的想象空间,纹理完全从声音本身生长出来,有着别样的韵味。

但无论起点如何,歌姬出厂时的纹理都只是一个开始。真正让它丰富起来的,是随后一首又一首作品的积累。创作者们从不同的角度去雕刻她,让听众知道了这块玉可以这么雕、也可以那么雕。那些经典作品沉淀下来的基调,逐渐汇聚成了人们对这位歌姬的情感认知:她”适合”什么样的歌,她”擅长”什么样的表达。这种认知反过来又影响着后来的创作者,他们带着这些前理解去打开软件,去与这块玉对话。

玉的质感,某种意义上,是被历代匠人一起养出来的。

那么所谓的”偶像”属性呢?在这个框架里,它其实是可以被解释的:当一块玉被足够多的匠人雕刻过、被足够多的人欣赏过,人们开始对这块玉产生情感:不是对某一件作品,而是对玉本身。这种情感是真实的,也是可以理解的。但它不改变一个基本事实:玉本身是没有灵魂的。人们爱的,是历代匠人留在这块玉上的痕迹的总和。

二、具:软件是凿子

再说”具”。

如果歌姬是玉,那么 Vocaloid、Ace Studio、Synth V、UTAU——这些具体的软件才是真正意义上的工具。

它们是凿子、是砂轮、是抛光机。它们决定的是你用什么方式、以什么精度去雕琢这块玉。手凿费力但可以精准到每一刀的力度与角度,电凿省力但需要控制,数控设备可以快速成型但手感会减弱。

工具是可替换的——这正是”工具”一词应有的含义。换一把凿子不会改变玉的质地,只会改变你雕刻的方式和效率。你用 Vocaloid 还是 Ace Studio 来调同一位歌姬,出来的声音会有差异,但那是工艺的差异,不是质料的差异。歌姬还是那位歌姬,玉还是那块玉。

工具的进化本身是自然的。从 Vocaloid 到 Ace Studio,自动性越来越强,操作门槛越来越低,更多人得以参与到创作中来——这就像从手凿进化到电凿。创作者省下的体力可以投入到更高层次的思考中,作品的可能性空间也随之扩展。这是好事。

但这里有一条需要被辨认的边界线。

工具应当跟随使用者的意图行事。

当电凿仍然需要你握着、引导着、决定每一刀落在哪里的时候,它就是工具,不管它多省力、多高效。手凿和电凿的区别是效率的区别,不是主体性的区别。握着电凿的人仍然是那个在做判断的人:这一刀深还是浅,这条线走还是不走,这个细节留还是不留。

但如果有一天,凿子开始自己判断这块玉应该雕成什么,开始替你决定走刀的方向和深度,它就不再是工具了。

这正是当下部分 AI 创作工具令人不安的地方。像 Suno 这样的歌声生成模型,它也自称工具,但它做的事情远不止执行意图:你给它一个prompt,它自动生成一段完整的音乐,伴奏混音啥都有了。你不需要判断任何细节,甚至不需要知道有哪些细节可以判断。你要做的,只是听一遍,然后决定”行”或”不行”。这时候你的角色已经从匠人变成了审核者,从创造者变成了甲方。

而最微妙的是,这种转变是舒适的。AI 给出的结果往往”听起来没问题”,甚至”听起来很好”。你很难指出它具体哪里不对,因为它的每一个局部处理都是在统计意义上,最优化的选择。但正是这种面面俱到的合理,抹去了某种本该存在的东西,那种只有当一个具体的人在做具体的判断时,才会出现的偏向、执拗和个人印记,以及长尾的无法被捕获的可能性。

主体性不是被夺走的,是被舒适地、不知不觉地让渡的。

更进一步地,工具的进化还带来了一些更复杂的效应。新一代的 AI 调校确实提高了创作的下限,以前需要大量经验才能做到”不难听”的事情,现在软件可以自动帮你处理。这意味着更多人可以参与创作,全体创作者投入到虚拟歌姬创作中的总精力可能反而是增加的。

但同时,每个创作者在每首作品上做出的主动判断,有可能减少了。减少了多少需要自己决定的环节,就减少了多少个人特色得以显影的机会。总量可能在增长,但每一份的浓度可能在被稀释。

当然,这并不意味着旧的工具就应该被抛弃,也不意味着新的工具就必然是坏的。一个创作者完全可以自己去选择在哪些环节交给 AI 处理、在哪些环节自己把控,只要他心里清楚地知道自己在做什么,知道哪里是他的判断、哪里是机器的判断。

关键不在于工具先进与否,而在于:你是在用它,还是它在引导你?

三、人:灵魂的注入者

最后说”人”。

真正让一件作品苏醒的,从来不是玉本身,也不是凿子本身,而是那个握着凿子、读着玉纹、把自己的情感和审美一刀一刀刻进去的人。

这是整个三分框架中最重要、也最容易被忽视的一个部分。

打开声库软件的时候,调教师面对的是操作界面。从这个界面出发,去思考一首歌应该怎么唱,去调整每一个参数、每一段气息的处理方式,这是一段切实的、可被感知的创作劳动。它和编曲、作词、混音一样,需要审美,需要判断,需要经验的积累,也需要时间的投入。

这道工序通常被叫作”调教”。这个名字本身就很有意味,它暗示着一种驯化、一种引导,也暗示着被引导的对象本身并不具备自主性。这和前面的框架是一致的:玉不会自己变成作品,是匠人把它变成作品。

正因为玉本身没有灵魂,创作者才可以无负担地倾注自己的灵魂。这一点ilem在他的文章中说得很透彻:”只有对无灵魂的事物,我才可以倾注我的灵魂。对木偶提线才是表演,对活人提线则是霸凌和犯罪。”面对的是无生命无意识的质料,”注入”这个行为才成立,创作者对作品才拥有完整的、不需分割的所有权。

但这里面藏着一种深刻的脆弱性。

当人们的认知中,歌姬不是玉而是歌手的时候,当人们说”洛天依唱了一首好歌”而不是”某个创作者使用天依做了个好作品”的时候,创作者的劳动就变得不可见了。人们看见的是台前那个光鲜的角色,看不见幕后那个调了几十个小时参数的人。

ilem 在文中描述了这种拉扯:”我付出的一半灵魂被押在她的舞台上拿不回来。”这不是矫情,这是一个真实的困境:你把心血注入了一个没有生命的容器,但所有人都以为那个容器本身就是活的。你的灵魂没有离去,但在旁人眼中,它已经变成了”别人”的一部分。

这是一种来自认知层面的威胁:歌姬作为”玉”,被当成了”人”。

而来自工具层面的威胁则是另一种形态。当 AI 工具接管了”这首歌该怎么唱”的判断时,创作者的劳动不是变得不可见,而是变得不必要。不是你的功劳被别人领走了,而是这份功劳从根本上不再需要你来建立。

两种威胁的形态不同,但受害的是同一个角色:那个本应站在作品核心的、真实存在的创作者。

所以三分法的意义,说到底不只是在理论上把概念拆清楚,而是在为创作者争取一种应得的可见性。把歌姬从”工具”的框架中拆出来、还原为”质料”,不是为了抬高她的地位,恰恰相反,是为了指出:她是材料,不是作者。真正的作者一直是人。把软件还原为”工具”、把 AI 的角色限定在”辅助”,同样不是拒绝进步,而是坚持一个底线:做判断的应当是人,不是凿子。

结语

所以,”虚拟歌姬是工具还是偶像”,这个问题也许从一开始就问错了。

她不是工具。工具是软件,是那些你打开、操作、关闭的程序。她也不是偶像,至少,不是那种拥有自主意识和独立人格的存在。

她是玉。

有着自己的纹理和倾向,有着被历代创作者共同养出来的气质,在那里安静地等待,等一个懂她的人,拿起趁手的凿子,把灵魂一刀一刀地刻进去。

料、具、人。三者缺一不可,但不应混为一谈。拆开来看,许多纠结也许就不再是纠结了。

Disclaimer: 由Claude进行总结润色