TrustRank 算法
  • 更新時間:2024-11-06 16:36:08
  • 網(wǎng)站建設(shè)
  • 發(fā)布時間:1年前
  • 324

TrustRank 算法

TrustRank是近年來比較受關(guān)注的一種基于鏈接的排名算法。 TrustRank可以翻譯為“信任指數(shù)”。

TrustRank算法最初來自于2004年斯坦福大學(xué)和雅虎的聯(lián)合研究,用于檢測垃圾網(wǎng)站,并于2006年獲得專利。TrustRank算法的發(fā)明者還專門發(fā)表了一份PDF文檔解釋TrustRank算法的應(yīng)用。感興趣的讀者可以在以下網(wǎng)址下載PDF文件:http://www.vldb.org/conf/2004/Rs15P3.PDF

TrustRank算法并不是Google提出的,但是由于Google的市場占有率最大,TrustRank也是Google排名中很重要的一個因素,所以有人誤認(rèn)為TrustRank是Google提出的。更讓人迷惑的是,谷歌曾經(jīng)申請過TrustRank作為商標(biāo),但TrustRank商標(biāo)中的TrustRank指的是谷歌檢測含有惡意代碼的網(wǎng)站的方法,而不是排名算法中的信任指數(shù)。

TrustRank 算法基于一個基本假設(shè):好網(wǎng)站(北京網(wǎng)站制作)很少鏈接到壞網(wǎng)站。反之則不然,也就是說,壞網(wǎng)站很少鏈接到好網(wǎng)站的說法是不正確的。相反,很多垃圾網(wǎng)站會鏈接到權(quán)威度高、信任度高的網(wǎng)站,企圖提高自己的信任度。

基于這樣的假設(shè),如果我們能夠選擇能夠100%信任的網(wǎng)站,那么這些網(wǎng)站的TrustRank將是最高的,而這些TrustRank最高的網(wǎng)站所鏈接的網(wǎng)站仍然會非常高,即使索引是略低。同樣,二級可信網(wǎng)站鏈接的三級網(wǎng)站的信任度繼續(xù)下降。由于種種原因,好的網(wǎng)站難免會鏈接到一些垃圾網(wǎng)站,但點擊距離越接近一級網(wǎng)站,傳遞的信任指數(shù)越高,點擊距離越遠(yuǎn),信任度越高。指數(shù)會更高。會依次下降。這樣,通過TrustRank算法,可以為所有網(wǎng)站計算出相應(yīng)的信任指數(shù)。離一級網(wǎng)站越遠(yuǎn),成為垃圾網(wǎng)站的可能性就越大。

計算TrustRank值,首先需要選擇一批種子網(wǎng)站,然后人工檢查網(wǎng)站設(shè)置一個初始TrustRank值。選擇種子網(wǎng)站有兩種方法。一種是選擇外向鏈接最多的網(wǎng)站,因為TrustRank 算法計算外向鏈接衰減的指數(shù)。導(dǎo)出鏈接多的網(wǎng)站,某種意義上可以理解為具有比較高的“反向PR值”。

另一種選擇種子網(wǎng)站的方法是選擇PR值高的網(wǎng)站,因為PR值越高,出現(xiàn)在搜索結(jié)果頁面的概率就越大。這些網(wǎng)站是TrustRank算法最關(guān)注、需要調(diào)整排名的網(wǎng)站。那些PR值很低的頁面在沒有TrustRank算法的情況下排名也很低,TrustRank的計算意義不大。

據(jù)測算,通過選取約200個網(wǎng)站(高端建站)作為種子,可以更準(zhǔn)確地計算出所有網(wǎng)站的TrustRank值。

TrustRank隨鏈接關(guān)系遞減的公式有兩種計算方式。一種是隨著鏈接數(shù)衰減,也就是說,如果第一層頁面的TrustRank指數(shù)為100,第二層頁面衰減到90,第三層衰減到80。第二種計算方法是賦值TrustRank值是根據(jù)出鏈數(shù)來計算的,即如果一個頁面的TrustRank值為100,頁面上有5個出鏈,每個鏈接將傳遞TrustRank值的20%。衰減和分配這兩種計算方法通常結(jié)合使用,總體效果是TrustRank值隨著鏈路級別的增加而逐漸降低。一旦推導(dǎo)出網(wǎng)站的頁面和TrustRank 值,排名就會受到兩種方式的影響。一種是根據(jù)TrustRank值對傳統(tǒng)排名算法選擇的多個頁面進(jìn)行比較,重新調(diào)整排名。另一個是設(shè)置一個最小的TrustRank 值閾值。只有超過此閾值的頁面才被認(rèn)為具有足夠的質(zhì)量進(jìn)入排名。低于閾值的頁面將被視為垃圾頁面并從搜索結(jié)果中過濾掉。

雖然TrustRank算法最初是作為一種檢測垃圾郵件的方法,但在目前的搜索引擎排名算法中,TrustRank的概念被更廣泛地使用,往往會影響大多數(shù)網(wǎng)站的整體排名。 TrustRank 算法最初是針對頁面級別的?,F(xiàn)在在搜索引擎算法中,TrustRank值通常是在域名層面上表示的。整個域名的信任指數(shù)越高,綜合排名能力越強(qiáng)。

我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對接開發(fā)等。十余年開發(fā)經(jīng)驗,每一個項目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!

本文章出于推來客官網(wǎng),轉(zhuǎn)載請表明原文地址:https://www.tlkjt.com/web/13778.html
推薦文章

在線客服

掃碼聯(lián)系客服

3985758

回到頂部