搜索引擎算法的工作原理
#搜索引擎 #算法
搜索算法是其他算法的大量集合,每个算法都有自己的目的和任务。这就是它的工作原理。
经常发现自己专注于执行特定功能的特定策略?如何编写引人注目的副本以在搜索中排名?哪些结构化数据可以轻松获胜?
这些重要问题经常在搜索引擎期刊的非常有用的文章中介绍。但重要的是不仅要了解哪些策略可能有助于您排名。你需要了解它是如何工作的。
了解战略运作的结构对于理解该战略为何有效以及它如何以及试图完成什么至关重要。
本章将探讨搜索算法如何工作的基础知识。
什么是算法?把它当做一个食谱
如果你问谷歌什么是算法,你会发现引擎本身(以及几乎所有其他人)将它定义为“在计算或其他解决问题的操作中要遵循的过程或规则集,尤其是计算机。”
如果你从这个定义中得到任何东西,那么在我们这里的上下文中理解它不是什么是至关重要的。
算法不是公式。
为了了解差异,为什么它很重要,以及它们各自的作用,让我们考虑一下今晚可能会在餐盘上放的那顿饭。
我们会选择我最喜欢的:
- 烤牛肉
- 布丁
- 绿豆
- 土豆泥
- 肉汁
(加拿大人吃的不仅仅是肉酱和枫糖浆,虽然两者都很棒,但可能不在一起。)
烤牛肉需要经过调味和完美烹饪。
调味料与烘烤相结合就是一个公式的例子——生产一种产品需要多少每种东西。
使用的第二个公式是考虑到烤肉的重量,烤肉的烹饪时间和温度。列表中的每个项目都会发生同样的情况。
在一个非常基本的层面上,我们将有 10 个公式(5 个项目 x 2 - 一个用于测量,另一个用于基于体积的烹饪时间和持续时间),以创建一个算法集,目标是创建最喜欢的一顿饭。
我们甚至没有包括生产原料所需的各种公式和算法,例如饲养牛或种植土豆。
不过,让我们再添加一个公式——一个考虑我盘子里想要的不同食物数量的公式。
所以,我们现在有一个算法来完成这个非常重要的任务。极好的!
现在我们只需要个性化该算法,以便我的家人也能享受他们的用餐。
我们需要考虑到每个人都是不同的,并且会想要不同数量的每种成分,并且可能想要不同的调味料。
因此,我们为每个人添加一个公式。好吧。
一种算法的算法
搜索算法和餐桌到底有什么共同点?
比你想象的要多得多。
让我们看一下网站的一些核心特征以进行比较。(“很少”的意思是离一切都很近。甚至不接近。)
- 网址
- 内容
- 内部链接
- 外部链接
- 图片
- 速度
正如我们在晚餐算法中看到的那样,这些区域中的每一个都使用不同的公式进一步划分,事实上,使用不同的子算法。
如果我们不将其视为一种算法,而将其视为一种算法,那可能会更好。
同样重要的是要记住,虽然有许多算法和无数公式在起作用,但仍然存在算法。
它的工作是确定这些其他因素如何加权以产生我们在 SERP 上看到的最终结果。
因此,承认有某种类型的算法在顶部是完全合理的——可以这么说,一种算法可以统治所有这些算法——但始终认识到还有无数其他算法,通常它们是我们考虑的算法当我们考虑它们如何影响搜索结果时。
现在,回到我们的类比。
我们有许多不同的网站特征被评级,就像我们有许多食物元素最终出现在我们的餐盘上一样。
为了产生想要的结果,我们必须有大量的公式和子算法来创建板上的每个元素,并掌握算法来确定每个元素的数量和位置。
听起来有点熟?
当我们想到“谷歌的算法”时,我们实际上指的是算法和公式的大量集合,每个集合都完成一个特定的功能,并由一个线索或我敢说是“核心”算法聚集在一起放置结果。
所以,我们有:
- 有的算法可以帮助谷歌根据特定特征判断、过滤、惩罚和奖励内容,并且该算法可能包含无数其他算法。
- 有的算法可以来判断链接并解决那里的垃圾邮件。 但是这种算法肯定需要来自其他预先存在的负责评估链接的算法的数据,并且可能需要一些新的算法来理解常见的链接垃圾邮件特征,以便更大的算法可以完成它的工作。
- 特定于任务的算法。
- 组织算法。
- 算法负责收集所有数据并将其放入产生所需结果的上下文中,即用户会发现有用的 SERP。
因此,我们有它。这就是搜索算法的核心工作方式。
为什么搜索算法使用实体
最近得到一些体面关注的搜索领域之一是实体的概念,尽管没有得到充分强调。
对于上下文,Google 将实体定义为:“一个事物或概念是单一的、独特的、明确的和可区分的。”
所以,在我们的晚餐类比中,有我。我是一个实体。
我家的每个成员也是他们自己的实体。事实上,我的家庭单位本身就是一个实体。
出于这个原因,烤肉和其中的每种成分也是它们自己的实体。布丁也是如此,制作它的面粉也是如此。
Google 将世界视为实体的集合。原因如下:
在我的餐桌上,我有四个单独的实体,它们将拥有状态“吃”和许多实体被消耗。
以这种方式对我们所有人进行分类比简单地将我们的活动评估为一系列词对谷歌有很多好处。
每个进食实体现在可以将盘子上的实体分配给他们(烤牛肉、青豆、土豆泥、布丁,但实体没有肉汁)。
谷歌使用这种类型的分类来判断一个网站。将坐在桌子上的每个实体想象成一个页面。代表我们所有人的全球实体(我们称这个实体为“A”)将是关于“烤牛肉晚餐”,但代表个人(或我们类比中的页面)的每个个体实体都是不同的。
通过这种方式,谷歌可以很容易地对网站与整个世界的互联性进行分类和判断。
基本上,搜索引擎不负责只判断一个网站——他们必须对所有网站进行排名。
实体“A”被认为是关于“烤牛肉晚餐”,但隔壁的实体(我们称这个实体为“B”)是关于“炒菜”的。
现在,如果一个名为“C”的外部实体想要确定在哪里吃饭,可以根据他们的偏好或查询将选项排名到 C。
实体的真正价值在于第二天发生的事情。我们有一些剩菜。
通过使用不同的公式处理实体“烤牛肉”并添加实体面包、奶酪和洋葱,我们有:
搜索算法如何使用实体
好的,这对于理解搜索算法以及实体如何以这种方式工作的重要性似乎并不明显。
虽然了解谷歌如何看待一个网站的整体内容具有明显的价值,但您可能会问为什么谷歌了解我的烤牛肉和牛肉蘸酱是相关的并且实际上是来自同一个核心实体是相关的。
让我们考虑一下 Google 理解网页是关于烤牛肉的。让我们还考虑另一个页面链接到它,并且该页面是关于牛肉蘸酱的。
在这种情况下,谷歌知道烤牛肉和牛肉蘸酱来自同一个核心实体,这一点非常重要。
他们可以根据这些实体的连通性为该链接分配相关性。
在实体的概念进入搜索之前,引擎只能根据词的接近度、密度和其他容易被误解和操纵的元素来分配相关性。
实体更难操纵。
页面要么是关于实体的,要么不是。
通过抓取网络并绘制实体关联的常见方式,搜索引擎可以预测哪些关系应该具有最大的权重。
那么,搜索算法如何工作?
好的,我们已经介绍了很多内容,您可能已经饿了。你想要一些外卖。
背景很重要
了解算法如何将上下文应用于您正在体验/阅读的内容非常重要。
当您听说算法更新时,重要的是要知道正在更新的内容可能是一个非常大的难题的一小部分。
了解这一点有助于解释站点或世界的哪些方面正在更新中进行调整,以及该调整如何适应引擎的大目标。
实体非常重要
此外,了解这些实体至关重要:
- 在当今的搜索算法中发挥着重要作用。
- 有自己的算法。
- 随着时间的推移,将扮演越来越重要的角色。
了解这一点不仅可以帮助您了解哪些内容是有价值的,还可以帮助您了解哪些链接可能会得到更有利的判断。
这只是列举几个优点。
一切都与用户意图有关
搜索算法作为其他算法和公式的大量集合,每个都有自己的目的和任务,以产生用户满意的结果。
事实上,有一些算法可以监控结果的这方面,并根据用户与它的交互方式,在认为排名页面不满足用户意图的地方进行调整。
其中包括专门设计用于理解实体以及实体如何相互关联的算法,以便为其他算法提供相关性和上下文。
Leave a comment