婷婷久久综合九色综合,欧美成色婷婷在线观看视频,偷窥视频一区,欧美日本一道道一区二区

<tt id="bu9ss"></tt>
  • <span id="bu9ss"></span>
  • <pre id="bu9ss"><tt id="bu9ss"></tt></pre>
    <label id="bu9ss"></label>

    當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

    SEOer應善用索引創(chuàng)建過程中的加權方法

     2018-10-08 17:06  來源: 用戶投稿   我來投稿 撤稿糾錯

      阿里云優(yōu)惠券 先領券再下單

    搜索引擎會給予每一個頁面一定的權重值,這個值也會隨著頁面的更新和時間地流逝而改變。

    今天,小小課堂SEO自學網為大家?guī)淼氖恰禨EOer應善用索引創(chuàng)建過程中的加權方法》。希望對大家有所幫助。

    一、索引創(chuàng)建中的權值

    搜索引擎蜘蛛的爬行與抓取,頁面的收錄與索引,是一個頁面能夠在用戶搜索關鍵詞時能夠獲得展現(xiàn)的幾個基本步驟,其中索引創(chuàng)建中包含著對頁面內容本身的加權因素。

    ① 索引項權值概念

    索引項的權值,在一定程度上反應了文檔中詞的相對重要性,這個值通常用于索引排序過程中計算分值,也就是影響搜索引擎排序的重要因素之一。

    ② 索引項權值怎么得來的?

    索引項權值,是由檢索模式中的加權組件利用文檔統(tǒng)計結果來計算得出的。

    ③ 索引項加權方法

    傳統(tǒng)的檢索模式中最常見的加權方法:TF-IDF算法。

    二、TF-IDF算法

    ① TF-IDF算法定義

    TF-IDF算法,基于索引項出現(xiàn)在一個文檔中的次數(shù)或頻率,以及索引項在整個文檔集合中出現(xiàn)的頻率,兩者的組合(或者說兩者的乘積)。

    ② TF-IDF算法中詞的解析

    1)TF

    次數(shù)和頻率稱之為詞頻,英文簡稱為tf。

    2)IDF

    索引項在整個文檔集合中出現(xiàn)的頻率,稱之為范文檔頻率,英文簡稱為idf。

    ③ TF-IDF算法的簡單說明

    TFIDF的核心思想,是指某個詞或某個短語在一篇文檔中出現(xiàn)的頻率高,并且在索引庫的其他文檔中出現(xiàn)較少,就認為這個詞或短句有很好的類別區(qū)分能力,可以用來進行分類。

    簡單來講,某個詞或某個短語就是索引詞,對于這篇文章而言,該詞項將被賦予較高的權值。

    打個比方說,“TWNM-SEO”這個短語完全是小小課堂網提出的,在《全網營銷SEO【TWNM-SEO】這就是屬于我的網站優(yōu)化》一文中,這個短語出現(xiàn)的頻率非常高,同時,在此之前也沒有其他人提到過這個短語,那么對于這篇文檔來講,該詞項“TWNM-SEO”就被賦予了很高的權值。

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    三、理解并使用TF-IDF算法

    對于SEOer來講,了解上面的知識已經足夠了,沒必要非得知道是用哪個函數(shù),哪個公式算出來的結果。

    其實,通過TF-IDF算法的學習,我們可以更好理解一些常識性的SEO知識。

    ① 品牌詞容易優(yōu)化

    品牌詞一般是自己創(chuàng)造的,滿足TF值大,同時IDF值大,頁面加權高,自然排名很容易。

    ② 行業(yè)核心詞難優(yōu)化

    無數(shù)網站都在優(yōu)化這同一個詞,然而首頁的位置卻是有限的,大家都滿足TF大,但同樣IDF越小,證明這個詞越難優(yōu)化。

    這也就是平時在判斷關鍵詞優(yōu)化難度時,為什么將百度搜索的相關結果數(shù)作為優(yōu)化難度之一的原因。

    ③ 多挖掘沒有百度指數(shù)的關鍵詞-降低優(yōu)化難度

    行業(yè)中有百度指數(shù)的詞,大家都在做優(yōu)化與排名,這樣的詞不光是競爭壓力大,可能還帶不來多少點擊。因為百度指數(shù)可能是100,真實用戶也許只有2個,另外的98個都是企業(yè)的競爭者們。

    我們應該挖掘一些沒有百度指數(shù)的詞,但是需要這次保持一定的搜索量,這樣可以保證降低優(yōu)化難度的同時,帶來更多真實流量。

    ④ TF并不是萬能!過度堆積害處大!

    根據(jù)TF-IDF算法,很多人會想,增加關鍵詞密度或頻率,以增加TF值,從而獲得更好的排名。然而,這種做法可以適當做,但超過一定度的話,沒什么好處,反而可能會因為過度堆積被搜索引擎降權!

    所謂的2%~8%的關鍵詞密度只是個大概范圍,很多排名好的頁面很多都在2%一下,當然也有在8%以上的,只要密度不是過小,不必過度在乎這個。

    舉個例子,已經是5%的密度了,非要故意堆積到8%,甚至百分之20%,就會變得非常沒有意義。這是對TF高的一種誤解。

    也就是我們能夠根據(jù)TF-IDF算法中得到的啟發(fā)是不應該讓關鍵詞的密度或頻率(TF)過低,然而對于IDF來說,我們只能通過尋找IDF值高的關鍵詞來優(yōu)化,如果我們優(yōu)化的關鍵詞的IDF值本來就很低,我們也不能對其改變這個現(xiàn)狀,IDF值越低,證明這個詞在一定程度上就越難優(yōu)化。

    所以,在網站優(yōu)化過程中,除了要做好頁面外,還需要關注內鏈與外鏈優(yōu)化。

    四、TF-IDF算法公式

    ① TF公式

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    TF(i,j):關鍵詞j在文檔i中的出現(xiàn)頻率。

    n(i,j):關鍵詞j在文檔i中出現(xiàn)的次數(shù)。

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    舉例來講:

    一篇文章總共100個詞,其中“SEO培訓”一共出現(xiàn)了10詞,那么TF就是10/100,結果就是0.1。

    然而,由于文章中會出現(xiàn)大量的“的”、“得”、“嗎”、“地”,不能正常反應文章的詞,所以,就得用IDF來做一個限制了。

    ② IDF公式

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    IDF(i):詞語i的反文檔頻率

    |D|:語料庫中的文件總數(shù)

    |j:t(i)屬于d(j)|出現(xiàn)詞語i的文檔總數(shù)

    +1是為了防止分母變0。

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    IDF就可以防止常用詞的干擾了。

    還是剛才的例子:

    一篇文章總共100個詞,其中“SEO培訓”一共出現(xiàn)了10詞,那么TF就是10/100,結果就是0.1。

    另外“我們”一共出現(xiàn)了10詞,其TF結果也是0.1。

    假設語料庫總共有1000篇文章,其中“SEO培訓”文章有10篇,“我們”文章有1000篇。

    “SEO培訓”的IDF=log(1000/10)= 2

    “我們”的IDF=log(1000/1000)= 0

    ③ TF-IDF公式

    TF-IDF = TF*IDF

    SEOer應善用索引創(chuàng)建過程中的加權方法-小小課堂SEO培訓教程

    “SEO培訓”的TF*IDF=0.1*0=0

    “我們”的TF*IDF=0.1*2=0.2

    那么很顯然,對于這篇文章而言,“SEO培訓”比“我們”更加重要。

    以上就是小小課堂SEO自學網為大家?guī)淼氖恰禨EOer應善用索引創(chuàng)建過程中的加權方法》。感謝您的觀看。SEO培訓認準小小課堂!更多seo教程搜索小小課堂。原創(chuàng)文章歡迎轉載并保留版權:https://www.xxkt.org/

    申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

    相關標簽
    網站權重
    seoer

    相關文章

    • 中國有權重網站數(shù)據(jù)現(xiàn)狀

      全網備案網站280萬個,分別列舉了移動站、PC站有權重的網站數(shù)量,不含未備案網站。從下文中,我們可以看到,能做到權重9的網站非常少,近有200個網站左右,這些網站要么是知名門戶、要么是政府類網站。權重1-3雖然沒有列出來

      標簽:
      網站權重
    • 網站權重細解:百度快排的原理是什么

      今天聊一聊網站權重那些事兒,詳細解讀一下什么是網站權重。首先、拋出一個問題:你覺得網站權重存在嗎?網站權重“高”或“低”是從哪里得出的數(shù)據(jù)?這些數(shù)據(jù)值得信賴嗎?

      標簽:
      網站權重
    • 簡單幾步教您如何批量查詢網站權重數(shù)據(jù)

      網站權重數(shù)據(jù)是衡量網站的一個重要的指標,隨著網站數(shù)目的增加,如果需要批量去查詢網站的權重數(shù)據(jù)變得費事費力那么有沒有什么簡單的方式或者免費的工具可以一鍵搞定海量網站的權重查詢操作呢?答案很簡單,

      標簽:
      網站權重
    • 如何利用百度百科提升自己網站權重排名分析

      百度搜索引擎作為互聯(lián)網的入口,掌握了大部分流量的去處,當然旗下的產品會給予很高的權重,我們現(xiàn)在搜索一個資料的時候,通常排在前面的比如百度知道、百度百科、百度文庫等。那么今天,我們就來談談如何在百度百科中巧妙的植入你的廣告

    • 網站怎么利用內容更新雙重境界快速提高網站權重?

      站怎么利用內容更新雙重境界快速提高網站權重?網站的權重總是提不上來,做了很多優(yōu)化都沒有多大作用,怎么通過內容更新來提升網站權重呢?詳細內容請看下文介紹

      標簽:
      網站權重

    熱門排行

    信息推薦