本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
你最喜欢的音乐类型是什么?
李尔·韦恩?AC/DC?除了乡村音乐以外的任何音乐?
我们喜欢认为我们的音乐偏好在某种程度上是深刻独特的,并且有意义地代表了我们作为个体的身份。但如果我告诉你,归根结底,我们彼此之间并没有那么大的不同呢?事实上,大多数看似“细微”的音乐品味差异可以用仅仅五个因素来概括。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
因子到底是什么?什么是因子分析?
因子可以被认为是一个潜在的概念,它解释了给定数据集中的变异性。
要理解因子分析背后的基本理论思想,请看这张来自《芝麻街》的布偶照片。从概念上讲,因子分析就像在问:“我们如何才能用尽可能少的形容词来解释这些布偶彼此之间最大的不同之处?” 理想情况下,您需要使用足够的描述符来做到详尽,但又不会过分,或许可以专注于 2-5 个最关键、最能定义差异的特征。单独描述每个布偶并没有什么帮助,说“嗯,它们中的一些是毛茸茸的”也没有什么帮助。但是,如果您假设最重要的特征是毛茸茸的程度、颜色和服装,那么您就很好地简要(但彻底地)概括了布偶彼此之间差异的主要方式——而这些特征也可以被认为是因子。
在所有数字、图形和统计数据背后,这就是因子分析的概念基础。
从布偶到音乐
为了理解音乐品味的科学性,彼得·伦特弗罗、刘易斯·戈德堡和丹尼尔·列维廷对音乐偏好进行了因子分析。与《芝麻街》的例子非常相似,研究人员正在寻找因子来解释数据中的差异——只是现在我们研究的是人们对 15 秒音乐样本的评分,而不是布偶。最终的“因子”集应该彻底(但简洁地)解释人们评分中总体“喜欢”和“不喜欢”的模式(例如,摇滚乐迷也倾向于喜欢朋克和重金属的模式)。
为了进行这项分析,研究人员首先挑选了 52 首歌曲,这些歌曲听起来类似于来自几个主要流派的著名歌曲,但从未流行起来(以避免纯粹过度曝光带来的任何偏差)。
然后,他们要求所有参与者在 1 到 9 的量表上评价他们对每首歌曲 15 秒片段的喜爱程度。
下面打印的是歌曲的完整列表,右边的数字是因子载荷。最上面的罗马数字(I、II、III、IV 和 V)表示研究人员计划找到的五个因子——相当于概括布偶差异的五个特征的音乐等价物。
重要的是要注意,他们最终确定了五个因子是有原因的——他们首先尝试了许多不同的可能性,而五个是最好地平衡了详尽性和简洁性的数字。我稍后会更详细地讨论这一点。
与此同时,您需要了解两件事才能理解这些数字的含义:它们的范围从 -1.0 到 1.0,并且一个高数字(最好超过 0.40)意味着这首歌“加载到”(或属于)该因子。因子分析有点像拼图;并不是说统计程序会为您吐出形容词。您必须查看哪些内容“加载到”每个“因子”上,然后自己找出描述符应该是什么;没有“正确答案”仅仅等待被发现。
例如,在第一列中,显示高数字的样本主要由古典音乐、爵士乐和器乐组成;现在您必须找到一个最能代表这些音乐作品的词。研究人员称之为“精致”,但您可能会想出其他想法。第二列怎么样?乡村摇滚、新乡村、主流乡村、蓝草、摇滚……在这种情况下,研究人员选择了“朴实”,但您可能会找到同样合理的替代方案(或许是“乡村”或“摇滚”)。研究人员将第三、第四和第五列分别定义为“强烈”、“柔和”和“现代”。
现在我们已经看到了统计数据,那么图形上是什么样子的呢?
研究人员运行了四次分析,每次都计划使用不同数量的因子(2、3、4 或 5)。这是一个所有四种解决方案的图形表示,五因子解决方案在最底部,两因子解决方案在第二行。实际上,我们从查看每种可能的解决方案中获得了一些有用的信息,这就是为什么回顾所有选项而不是仅仅关注研究人员最终的五因子解决方案真的很有趣的原因。例如,双因子解决方案在下面以红色突出显示
当研究人员寻找 2 个因子时,他们最终得到了精致音乐 vs. 其他一切。这实际上告诉我们一些相当重要的事情:当您专门尝试找到音乐偏好中最重要的“这个或那个”区别时,您最终会在一边得到精致,主要由古典音乐、爵士乐和器乐组成,另一边是其他一切,包括从乡村到重金属的各种音乐。
让我们回顾一下这篇文章的标题。难道有时候看起来每个人对“最喜欢的音乐”问题的默认回答都是除了乡村音乐以外的任何音乐吗?这可能是更常见的回答之一,但这可能不是真的。这个答案可能表明偏好某种组合的说唱、流行和/或摇滚音乐,但这些受访者特别喜欢凯尔特音乐、瑞典死亡金属或波尔卡舞曲的可能性极低。事实上,双因子解决方案真正告诉我们的是:当谈到音乐品味中的“这个”与“那个”的区别时,它不是“乡村”与“其他一切”的区别——而是“精致”与“其他一切”的区别。如果有人真的想对最喜欢的音乐问题给出全有或全无的回答,那么他最好说他喜欢除了高雅音乐以外的任何音乐。或者,反过来说,除了低俗音乐以外的任何音乐。
此外,请注意,“精致”框在每一行中都保持一致;这告诉我们的是,来自原始类别的歌曲往往不会移动并成为不同类别的一部分,即使出现更多潜在的选择也是如此。这让我们对那个音乐类别有了更深入的了解——它不仅在概念上与双因子解决方案中的其他一切都不同,而且即使当更多类别开放并且有机会将该“框”中的一些歌曲与其他样本重新分组时,它们也不会动摇。 “古典音乐、爵士乐和器乐”的分类似乎真的自成一派,并且与其他类型的音乐几乎没有共同之处。
一旦您允许第三个因子,来自“其他一切”类别的一些歌曲就会分离出来,进入另一个名为“强烈”的框。这意味着摇滚、重金属和朋克歌曲正在从其余歌曲中分离出来,将其余歌曲留在模糊的包罗万象的类别中(现在被研究人员称为“朴实”)。一旦添加了第四个因子,那个包罗万象的框就会进一步分解,并为“柔和”类别腾出空间。
(作为提示,您实际上可以通过箭头上打印的数字来判断哪些类别正在“分解”并将它们的一些歌曲丢失给新因子。数字越接近 1.00,该框从一行到另一行保持不变的程度就越高。数字越低,该框的变化就越大。)
研究人员最终确定的因子分组是一组他们巧妙地称为 MUSIC 的因子:柔和 (Mellow)、朴实 (Unpretentious)、精致 (Sophisticated)、强烈 (Intense) 和现代 (Contemporary)。这意味着什么?很简单:这些是用于对音乐进行分类和解释我们音乐品味差异的五个最重要的描述符。如果我们喜欢“柔和”框中的一首音乐,我们可能也喜欢“柔和”框中的其他音乐。
音乐流派真的那么重要吗?
那么这对我们理解音乐意味着什么?
有趣的是,这是为数不多的不按流派细分结果的音乐偏好研究之一。基于这种 MUSIC 模型对音乐进行分类与说“如果你喜欢摇滚音乐,你就会喜欢其他摇滚音乐”是不同的。 MUSIC 形容词看起来可能像流派,但实际上,数十种流派可以融入 MUSIC 类别中的一个。这项研究真正表明,歌曲的具体“流派”可能没有那么重要;真的,我们的品味可能更多地受到这些潜在的音乐特征的引导,这些特征跨越了各种行业强加的标签。如果您喜欢巴里·怀特和杰克·约翰逊,根据流派对这些歌曲进行分类会让您看起来很古怪,但如果您意识到它们都是柔和的,那就不会显得那么奇怪了。
潘多拉的过度复杂的盒子
您很可能熟悉网站 Pandora,音乐基因组计划的一部分。如果不是,这是一个著名的项目,旨在“排序”各种歌曲;如果您输入一首喜爱的歌曲或艺术家,它会将此偏好插入其算法,以查找您应该喜欢的其他歌曲。
本质上,Pandora 算法根据 400 个音乐特征对每首歌曲进行分类,范围从主唱性别到电吉他失真程度。一旦您对给定的歌曲“点赞”,该软件会自动查看该歌曲在所有 400 个特征上的得分,然后将其与数据库中的每首其他歌曲进行比较;在最多数量的特征上得分“最接近”的歌曲将在接下来播放。
这非常令人印象深刻,并且很多人使用(并喜欢)Pandora,但这项研究可以告诉我们一件事:这可能不是那么必要的。当仅仅五个因素就可以很好地概括我们的音乐品味模式时,我们还需要 400 个特征做什么呢?
甚至有一些轶事证据支持这样一种观点,即尽管在其创建背后付出了所有努力,但 Pandora 可能比排序器甚至意识到的更依赖于这种五因子模型。我听过无数关于 Pandora 在给定电台中选择看似随机歌曲的故事;我最喜欢的个人轶事之一是,有一次我在工作时在后台播放了李尔·韦恩 Pandora 电台,最终意识到它播放的最后三首歌曲是曼迪·摩尔、杰西卡·辛普森和布兰妮·斯皮尔斯。当时这没有任何意义,但有趣的是:根据 MUSIC 模型,这可能是完全有道理的。毕竟,这四位艺术家都属于最后一个“现代”框。李尔·韦恩和布兰妮表面上看起来似乎没有什么共同之处,但在概念上,他们比蕾哈娜(现代)和 AC/DC(强烈)等艺术家更相似。
公平地说,我真的不能抱怨。我确实喜欢 Weezy 和 Brit。
参考文献:Rentfrow PJ, Goldberg LR, & Levitin DJ (2011)。音乐偏好的结构:五因子模型。《人格与社会心理学杂志》,100 (6), 1139-57 PMID: 21299309