就像指南针、灯泡和其他曾经具有革命性的工具一样,搜索引擎已经融入了当代生活中几乎不引人注目的背景中。使用谷歌搜索可能就像系鞋带一样无需过多思考:每天多次做的事情,只需付出最少的脑力——除非您发现有些磨损。
在过去一年中,谷歌发布了AI 概览,这是一个使用人工智能生成的摘要来回答搜索查询的平台。这些摘要中有足够多的内容非常奇怪,以至于该公司在一篇博客文章中对此进行了回应(同时也指出用户满意度很高)。对某些产品(例如空气净化器)的搜索引发了大量搜索引擎优化垃圾信息。哥伦比亚特区地方法院法官阿米特·P·梅塔 (Amit P. Mehta) 裁定,该公司使用非法手段来垄断搜索引擎市场。梅塔确定该公司的处罚后,谷歌计划对该裁决提出上诉,处罚可能包括处以经济处罚或拆分这家科技巨头的部分业务。最重要的是,谷歌还因其数字广告业务面临反垄断诉讼。
瑞典博拉斯大学的信息科学家尤塔·海德 (Jutta Haider) 说:“谷歌正在变得更糟,或者至少我们看到它的用处越来越小。”她与瑞典隆德大学的同事奥洛夫·桑丁 (Olof Sundin) 合著了 2019 年出版的《隐形搜索和在线搜索引擎》一书。“各种各样的变通方法不断涌现”,供想要调整搜索的用户使用。这些方法可能包括在查询中添加限定符“site:sitename”以将结果限制在特定网站,或者格式化谷歌设置以删除 AI 响应,转而支持传统的超链接。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
尽管 2024 年 3 月的一项研究观察到主要引擎正在努力将垃圾信息排除在产品评论搜索之外,但谷歌在该分析中的表现仍然优于其竞争对手,谷歌发言人在一封通过电子邮件发送给《大众科学》的声明中表示。该发言人补充说,谷歌此后调整了其结果,以强调来自具有第一手经验的专家的评论,并且“第三方一直认为谷歌的质量高于其他搜索引擎。”
如果您想使用其他搜索引擎之一,您的选择在某种程度上受到限制:美国近 90% 的搜索都通过谷歌进行。考虑一下其他搜索引擎,根据网络流量分析公司 StatCounter 的衡量,这些搜索引擎的美国市场份额超过 1%。有三个。微软的必应用于约 7% 的搜索。必应的索引(本质上是它知道的每个网站的清单)是另一个引擎 DuckDuckGo(用于约 2% 的搜索)的主要信息来源。DuckDuckGo 结果的贡献者还包括 其网络爬虫——一种扫描互联网以帮助提取相关信息的机器人——以及来自小众搜索引擎的数据。自 2009 年以来,雅虎搜索(也占约 2% 的搜索量)也同样依赖于必应的索引。它也有自己的爬虫,名为 Slurp。
还有一些不太受欢迎的选择,例如 Brave Search,它像 DuckDuckGo 一样,强调隐私并限制用户数据跟踪。一些搜索引擎主要针对非英语世界:谷歌的俄语竞争对手是 Yandex;中文竞争对手是百度。一些较新的搜索引擎采用生成式人工智能来提供答案。其中包括 Perplexity,它被《福布斯》和其他新闻媒体指控抄袭。海德警告说,总的来说,人工智能搜索引擎可能会提供误导性答案,因为它们缺乏精通媒体的人类所拥有的媒体素养——导致结果助长气候变化否认等。
一些搜索公司提供访问数据的其他方式,例如总部位于柏林的 Ecosia,该公司将其利润捐赠给植树组织。据 Ecosia 的首席植树官 Pieter Van Midwoud 称,大约每 50 次搜索就足以支付种植一棵树的费用。(他指出,所需的搜索次数取决于用户所在的世界各地,以及他们点击的广告数量。)
Ecosia 提供来自 必应、谷歌和其他外部来源的结果,但 Ecosia 的全球传播主管 Jade Devey 表示,它“对所提供的结果没有太多控制权”。但是,它确实会在某些链接上附加自定义标签。Devey 说,绿叶图标表示“具有合法气候承诺”的公司,而“大型污染者”则标有类似于工业烟囱的符号。
让我用必应搜索一下
这些其他引擎的效果如何?如果您试图确认一个众所周知的事实或查找一家公司的网站,它们几乎肯定会给您您想要的答案。德国汉堡应用科学大学教授 Dirk Lewandowski 说:“对于大多数查询,您使用哪个搜索引擎真的无关紧要。”他研究搜索引擎和使用搜索引擎的人的行为。
在一项发表于 2022 年《信息科学与技术协会会议记录》的研究中,Lewandowski 和他的同事比较了谷歌搜索结果与 DuckDuckGo、必应和 MetaGer(一种德国“元搜索”引擎,可聚合来自其他引擎的数据)的结果。科学家们使用名为 结果评估工具 (RAT) 的软件,分析了 2021 年末至 2022 年初德国和美国 3,500 多个谷歌趋势查询的前 10 个结果。人们搜索新闻、梅西感恩节大游行等活动以及体育和名人(“桑德拉·布洛克”当时很流行,作者在论文中指出)。
该研究发现,某些非常受欢迎的网站(例如维基百科、Instagram 和 IMDb)反复出现在美国搜索结果的最前面。总体而言,谷歌的前 10 个结果与美国其他搜索引擎的结果重叠约 24% 至 25%。非谷歌搜索引擎结果彼此之间更相似。必应和 DuckDuckGo 的答案有 64% 是相同的,Lewandowski 将此归因于共享的必应索引。
海德说:“对于许多搜索来说,谷歌和必应甚至 DuckDuckGo 之间的差异已经没有那么大了。”但她补充说,谷歌拥有其他搜索引擎不具备的强大功能——谷歌地图和 YouTube——这些功能已干净地集成到其结果中。
Lewandowski 警告说,这项研究受到其对热门搜索的依赖性的限制。“我们可以理所当然地期望,对于罕见查询,重叠率远低于热门查询,”他说。如果问题对于维基百科来说太晦涩难懂,不同的搜索引擎可能会在互联网的不同角落寻找答案。在这种情况下,他建议使用多个搜索引擎来挖掘更多信息。
在评估搜索引擎时,海德说她通常会查询一对主要城市,例如“巴黎 马德里”或“魁北克 多伦多”——结果通常会将航班促销放在首位。“高碳排放行为[例如航班]通常排名较高,”她说。然后她会搜索夏季服装或儿童服装之类的东西。她说,许多引擎都有“强烈的消费主义偏见”,并且会突出链接到服装店或商业网站,她补充说,她的目的是揭露引擎的隐形假设:“城市之间的关系不仅仅是航空公司,”海德说。“衣服有历史和文化,它们可以交换或修补。”
搜索多样性
未来是否会提供更全面的互联网搜索引擎菜单?即使没有谷歌的市场垄断笼罩在该领域之上,建立一个新的引擎也并非易事。在搜索引擎的各个部分中,包括网络爬虫、排名算法和搜索界面本身等,索引可能是最难创建的。谷歌搜索主管 Pandu Nayak 去年作证称,谷歌的索引在 2020 年“可能”约为 4000 亿个文档。
Lewandowski 解释说,如此规模的索引“极其昂贵”,需要构建和维护。它必须不断更新并以允许全球用户访问的方式分发。“没有人有钱做到这一点,”他说——当然,谷歌和微软除外。作为规避这种情况的一种方法,Lewandowski 以及其他信息和计算机科学家都提倡建立一个公共资助的网络索引。他说,这可以成为“数千个不同搜索引擎”的基础。“这是出路。”
海德说,开放索引在技术上是可行的,但构建这样一个与政府控制或利润动机隔离的东西的政治性仍然是一个悬而未决的问题。与此同时,她补充说,对特定搜索引擎的偏好可能会有所作为。“当网络搜索引擎被使用时,它们会得到改进,”海德说。“开发人员会收到有关人们搜索的内容、搜索的进行方式、点击的内容等等的反馈。这然后有助于改进系统。”即使是已经融入背景中的事物也可能会发生变化,搜索引擎尤其如此。