搜索引擎算法的工作原理

#搜索引擎 #算法
搜索算法是其他算法的大量集合,每個算法都有自己的目的和任務。這就是它的工作原理。
經常發現自己專注於執行特定功能的特定策略?如何編寫引人注目的副本以在搜索中排名?哪些結構化數據可以輕鬆獲勝?
這些重要問題經常在搜索引擎期刊的非常有用的文章中介紹。但重要的是不僅要了解哪些策略可能有助於您排名。你需要了解它是如何工作的。
了解戰略運作的結構對於理解該戰略為何有效以及它如何以及試圖完成什麼至關重要。
本章將探討搜索算法如何工作的基礎知識。
什麼是算法?把它當做一個食譜
如果你問谷歌什麼是算法,你會發現引擎本身(以及幾乎所有其他人)將它定義為“在計算或其他解決問題的操作中要遵循的過程或規則集,尤其是計算機。”
如果你從這個定義中得到任何東西,那麼在我們這裡的上下文中理解它不是什麼是至關重要的。
算法不是公式。
為了了解差異,為什麼它很重要,以及它們各自的作用,讓我們考慮一下今晚可能會在餐盤上放的那頓飯。
我們會選擇我最喜歡的:
- 烤牛肉
- 布丁
- 綠豆
- 土豆泥
- 肉汁
(加拿大人吃的不僅僅是肉醬和楓糖漿,雖然兩者都很棒,但可能不在一起。)
烤牛肉需要經過調味和完美烹飪。
調味料與烘烤相結合就是一個公式的例子——生產一種產品需要多少每種東西。
使用的第二個公式是考慮到烤肉的重量,烤肉的烹飪時間和溫度。列表中的每個項目都會發生同樣的情況。
在一個非常基本的層面上,我們將有 10 個公式(5 個項目 x 2 - 一個用於測量,另一個用於基於體積的烹飪時間和持續時間),以創建一個算法集,目標是創建最喜歡的一頓飯。
我們甚至沒有包括生產原料所需的各種公式和算法,例如飼養牛或種植土豆。
不過,讓我們再添加一個公式——一個考慮我盤子裡想要的不同食物數量的公式。
所以,我們現在有一個算法來完成這個非常重要的任務。極好的!
現在我們只需要個性化該算法,以便我的家人也能享受他們的用餐。
我們需要考慮到每個人都是不同的,並且會想要不同數量的每種成分,並且可能想要不同的調味料。
因此,我們為每個人添加一個公式。好吧。
一種算法的算法
搜索算法和餐桌到底有什麼共同點?
比你想像的要多得多。
讓我們看一下網站的一些核心特徵以進行比較。 (“很少”的意思是離一切都很近。甚至不接近。)
- 網址
- 內容
- 內部鏈接
- 外部鏈接
- 圖片
- 速度
正如我們在晚餐算法中看到的那樣,這些區域中的每一個都使用不同的公式進一步劃分,事實上,使用不同的子算法。
如果我們不將其視為一種算法,而將其視為一種算法,那可能會更好。
同樣重要的是要記住,雖然有許多算法和無數公式在起作用,但仍然存在算法。
它的工作是確定這些其他因素如何加權以產生我們在 SERP 上看到的最終結果。
因此,承認有某種類型的算法在頂部是完全合理的——可以這麼說,一種算法可以統治所有這些算法——但始終認識到還有無數其他算法,通常它們是我們考慮的算法當我們考慮它們如何影響搜索結果時。
現在,回到我們的類比。
我們有許多不同的網站特徵被評級,就像我們有許多食物元素最終出現在我們的餐盤上一樣。
為了產生想要的結果,我們必須有大量的公式和子算法來創建板上的每個元素,並掌握算法來確定每個元素的數量和位置。
聽起來有點熟?
當我們想到“谷歌的算法”時,我們實際上指的是算法和公式的大量集合,每個集合都完成一個特定的功能,並由一個線索或我敢說是“核心”算法聚集在一起放置結果。
所以,我們有:
- 有的算法可以幫助谷歌根據特定特徵判斷、過濾、懲罰和獎勵內容,並且該算法可能包含無數其他算法。
- 有的算法可以來判斷鍊接並解決那裡的垃圾郵件。 但是這種算法肯定需要來自其他預先存在的負責評估鏈接的算法的數據,並且可能需要一些新的算法來理解常見的鏈接垃圾郵件特徵,以便更大的算法可以完成它的工作。
- 特定於任務的算法。
- 組織算法。
- 算法負責收集所有數據並將其放入產生所需結果的上下文中,即用戶會發現有用的 SERP。
因此,我們有它。這就是搜索算法的核心工作方式。
為什麼搜索算法使用實體
最近得到一些體面關注的搜索領域之一是實體的概念,儘管沒有得到充分強調。
對於上下文,Google 將實體定義為:“一個事物或概念是單一的、獨特的、明確的和可區分的。”
所以,在我們的晚餐類比中,有我。我是一個實體。
我家的每個成員也是他們自己的實體。事實上,我的家庭單位本身就是一個實體。
出於這個原因,烤肉和其中的每種成分也是它們自己的實體。布丁也是如此,製作它的麵粉也是如此。
Google 將世界視為實體的集合。原因如下:
在我的餐桌上,我有四個單獨的實體,它們將擁有狀態“吃”和許多實體被消耗。
以這種方式對我們所有人進行分類比簡單地將我們的活動評估為一系列詞對谷歌有很多好處。
每個進食實體現在可以將盤子上的實體分配給他們(烤牛肉、青豆、土豆泥、布丁,但實體沒有肉汁)。
谷歌使用這種類型的分類來判斷一個網站。將坐在桌子上的每個實體想像成一個頁面。代表我們所有人的全球實體(我們稱這個實體為“A”)將是關於“烤牛肉晚餐”,但代表個人(或我們類比中的頁面)的每個個體實體都是不同的。
通過這種方式,谷歌可以很容易地對網站與整個世界的互聯性進行分類和判斷。
基本上,搜索引擎不負責只判斷一個網站——他們必須對所有網站進行排名。
實體“A”被認為是關於“烤牛肉晚餐”,但隔壁的實體(我們稱這個實體為“B”)是關於“炒菜”的。
現在,如果一個名為“C”的外部實體想要確定在哪裡吃飯,可以根據他們的偏好或查詢將選項排名到 C。
實體的真正價值在於第二天發生的事情。我們有一些剩菜。
通過使用不同的公式處理實體“烤牛肉”並添加實體麵包、奶酪和洋蔥,我們有:
搜索算法如何使用實體
好的,這對於理解搜索算法以及實體如何以這種方式工作的重要性似乎並不明顯。
雖然了解谷歌如何看待一個網站的整體內容具有明顯的價值,但您可能會問為什麼谷歌了解我的烤牛肉和牛肉蘸醬是相關的並且實際上是來自同一個核心實體是相關的。
讓我們考慮一下 Google 理解網頁是關於烤牛肉的。讓我們還考慮另一個頁面鏈接到它,並且該頁面是關於牛肉蘸醬的。
在這種情況下,谷歌知道烤牛肉和牛肉蘸醬來自同一個核心實體,這一點非常重要。
他們可以根據這些實體的連通性為該鏈接分配相關性。
在實體的概念進入搜索之前,引擎只能根據詞的接近度、密度和其他容易被誤解和操縱的元素來分配相關性。
實體更難操縱。
頁面要么是關於實體的,要么不是。
通過抓取網絡並繪製實體關聯的常見方式,搜索引擎可以預測哪些關係應該具有最大的權重。
那麼,搜索算法如何工作?
好的,我們已經介紹了很多內容,您可能已經餓了。你想要一些外賣。
背景很重要
了解算法如何將上下文應用於您正在體驗/閱讀的內容非常重要。
當您聽說算法更新時,重要的是要知道正在更新的內容可能是一個非常大的難題的一小部分。
了解這一點有助於解釋站點或世界的哪些方面正在更新中進行調整,以及該調整如何適應引擎的大目標。
實體非常重要
此外,了解這些實體至關重要:
- 在當今的搜索算法中發揮著重要作用。
- 有自己的算法。
- 隨著時間的推移,將扮演越來越重要的角色。
了解這一點不僅可以幫助您了解哪些內容是有價值的,還可以幫助您了解哪些鏈接可能會得到更有利的判斷。
這只是列舉幾個優點。
一切都與用戶意圖有關
搜索算法作為其他算法和公式的大量集合,每個都有自己的目的和任務,以產生用戶滿意的結果。
事實上,有一些算法可以監控結果的這方面,並根據用戶與它的交互方式,在認為排名頁面不滿足用戶意圖的地方進行調整。
其中包括專門設計用於理解實體以及實體如何相互關聯的算法,以便為其他算法提供相關性和上下文。
發表評論