1. 首页
  2. 入门成长营

搜索引擎偏见:来自索引的分析

在最近一篇关于SEW的文章中,克里斯托弗调查了对英国政党自动提出的查询的操纵,但究竟什么是搜索引擎的偏见呢?

搜索引擎偏差是结果的不公平倾斜,它位于搜索系统的中介机制中(见下图),偏差可分为三个部分:

信息检索系统

1)非中性搜索引擎技术
多年前,研究专注于搜索软件。不久,人们意识到用户界面对任何算法都同等重要,因为这是我们对系统和我们成功使用它的看法。

现在,这就是它变得更加有趣的地方,结果的呈现会影响自由思想,从而促进互动。因此,由于设计和用户界面,所有搜索引擎都是偏向的。

我们有两种结果检查偏见:质量和信任。

质量偏差意味着搜索者会下意识地考虑周围的结果,如果它们不相关,我们的行为可能会改变,我们可能会决定重新输入我们的查询或检查我们原本不会想到的网站。

这正是引擎为付费搜索系统提供质量得分的原因,如果付费结果无关紧要,这可能会导致有机结果检查混乱。

在大多数情况下,搜索算法通常非常有效地向我们提供相关结果,因此我们信任引擎,这称为信任偏差。

从丛林书中相信我

通过cookie进行个性化和创建3D立方体 用于提高相关性。

虽然个性化有许多优点,但个性化限制了结果,并且是搜索引擎偏见的一种形式。

2)结果操纵
2002年谷歌在中国被暂时封锁时,政治和社会偏见突显出来,从那时起,随着美国的“数字千年版权法案”,索引和结果一直被过滤,以便更好地遵守法律。

让我们现在采取相反的方式,搜索引擎覆盖是否偏向于国家线?

简而言之,是的。引擎没有对特定网站或区域的比例覆盖。但为什么会这样呢?那么,国家人口差异和互联网渗透会导致无意的偏见。

博主构成了PageRank,这是一种双重数学和以人为中心的算法。如果一个国家有更多的博主,他们更有可能链接到该国家/地区的其他博客。考虑到个性化,考虑到地理位置,这进一步强化了国家特定的博客链接网络。

这就是为什么.com ccTLD的排名高于其他ccTLD,以及为什么许多营销人员和商业人士都希望.com域名超过其他ccTLD。这是成功 – 成功的一个典型例子,由于它是网络的早期采用者,美国占据上风。

链接构建内容生成中的三个基本因素 如何进行品牌检索审核 如何为您的图像编写SEO友好的替代文字 如何完美平衡联盟营销和SEO
3)公正
搜索引擎可能认为自己是客观的,但与任何其他媒体公司一样,编辑判断也会被纳入自动化操作中。发动机比其他发动机更信任某些来源。

在谷歌,维基百科被视为值得信赖的来源。这可能是因为维基百科包含最新,最新且可靠的信息,这些信息通过经过充分研究,引用,因此可靠的内容来回答问题。因此,它通常具有最佳结果。

什么是公正

如果最高结果不满足搜索者,则搜索不成功。由于每次不成功的搜索都会降低搜索引擎的感知能力,因此搜索引擎偏向往往是值得信赖的来源。

这就是为什么维基百科不会很快消失的原因,它也解释了为什么谷歌的快速答案框在结果的顶部 – 更快地回答查询并提高引擎的性能感知。

所以,你有它,我们的结果是由于搜索引擎的偏见而扭曲。

单独的偏差对结果影响最大,因为它们包含用户界面和对结果检查的影响; 个性化; 最后排名算法(这是人类编辑的部分数学部分)。

免责声明:本文仅代表作者个人观点,与穷思笔记网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

发表评论

登录后才能评论

联系我们

18217712232 

在线咨询:点击这里给我发消息

邮件:572693986@qq.com

QR code