本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。
虽然可以在网络上搜索图像,但仍然无法搜索图像本身。谷歌希望通过一个研究项目来改变这一点,该项目可以将某些著名地标的数字照片与这些地标的文本描述(包括它们的名称和位置)进行匹配,而无需传统的搜索引擎。
谷歌创建了其实验性的地标识别引擎,方法是开发一个目标地标列表(例如埃菲尔铁塔和雅典卫城),并找到这些位置的带有GPS标签的数字照片。然后,研究人员“教导”识别引擎通过聚类同一地标的不同图像(例如,在不同光照和不同角度下拍摄的图像)来识别特定地标。
以下是它在实践中可能的工作方式:您正在浏览网络,偶然发现您不认识的地标图像。您复制图像位置,然后将该URL粘贴到谷歌的地标识别引擎中。如果该图像与谷歌数据库中的地标图像之一匹配,则识别引擎将返回一个结果页面,其中包含该图像以及其名称、位置,甚至可能还有描述。
谷歌计算机视觉研究主管杰伊·亚格尼克说,当系统被给予图像并要求描述它时,准确率达到80%。谷歌今天在迈阿密举行的IEEE计算机学会计算机视觉与模式识别会议上展示这项研究,该研究是在新加坡国立大学研究人员的帮助下进行的。
图片 © 谷歌