正确判断出用户的搜索意图之后,谷歌的排名算法就要为该搜索意图检索配对的信息了。在基本层面上,谷歌算法以关键词的匹配为核心出发点进行信息检索。检索信息这里涉及精准匹配和宽泛匹配两种内容配对行为,算法会分析相关关键词在某个页面上出现的频率和位置。(注意:出现在标题中和出现在普通段落中参与计算的相关性权重是有区别的。)
要引起重视的是,与用户搜索相符的关键词在一个页面中出现的次数并不是越多越好。因为这里涉及关键词堆砌的问题,相关关键词在同一个页面中出现,虽然与用户使用的搜索关键词不能完全匹配,甚至不包含用户使用的任何关键词,也毫不影响其对焦点关键词排名的推动作用。
比如,用户还是使用关键词“我和我的祖国”进行搜索,这时有一个新的页面,它的内容中包含了很多其他的相关关键词,如“张藜作词”“秦咏诚作曲”“李谷一原唱”“爱国主义歌曲”“一刻也不能分割”等。谷歌算法知道这个页面是关于《我和我的祖国》这首歌曲的,而不是关于电影的。
除了相关关键词的辅助判断外,谷歌还使用经过汇总和匿名化处理的互动数据来评估结果算法与查询内容的相关。谷歌将这些数据转换为修正信号,协助谷歌的算法系统评估相关性。
此外,谷歌的排名算法还会根据其他线索来衡量潜在的搜索结果在多大程度上满足用户的搜索需求(这一点比上面说的修正信号更加重要 )。因为页面上的内容并不是只有文字,还可能有图片、视频、音频等。这些内容的存在也是谷歌算法需要重点考虑的因素,如图片的Alt属性,它就是为谷歌判断图片的主要表达内容而存在的。
最后,用户浏览器使用的语言也非常重要,谷歌算法会检索数据库中页面内容的文字语言与用户当前浏览器所使用的语言是否一致,以便优先为用户提供其首选语言的网页内容。