<em id="9rr3h"><dl id="9rr3h"></dl></em>

      <output id="9rr3h"><strike id="9rr3h"><cite id="9rr3h"></cite></strike></output>

              <ol id="9rr3h"></ol>
              <output id="9rr3h"></output>
              <ol id="9rr3h"></ol>

                <nobr id="9rr3h"><dl id="9rr3h"></dl></nobr>

                說說SEO論壇:SEO算法深度分析之倒排索引,來解釋SEO排名的問題

                SEO教程 黑帽SEO培訓 瀏覽

                小編:今天給我們同享一下倒排索引的一些工作,為什么要說倒排索引呢?由于當用戶查找一個詞的時分,回來的查找效果頁面就是通過倒排索引和一系列算法過濾后的效果排序,查找引擎優化

                今天給我們同享一下倒排索引的一些工作,為什么要說倒排索引呢?由于當用戶查找一個詞的時分,回來的查找效果頁面就是通過倒排索引和一系列算法過濾后的效果排序,查找引擎優化苦苦尋求的不就是排名的多少嗎?

                說的粗淺一點,其實查找引擎的索引好比是我們往常看書時的目錄,為了讓我們更快找到適宜自己的東西,比如導航站其實就是互聯網上小型索引的結構案例。

                上面會有一些分類比如新聞、電影、小說、圖片等等板塊,讓用戶快速的找到自己所需。

                索引是查找引擎中最為中心的技術之一,由于在許多的網頁中,怎樣才能更快、更精準的找到用戶查詢這個詞的查找目的。

                先給我們說幾個概念,為了下面的敘說中,我們都能看得懂。

                1、文檔:我們是以網頁的辦法看到互聯網頁面的,而網頁中包含許多的東西,比如:TXT、EXCEL、PDF等等許多各式各樣的文件都被成為文檔。

                2、文檔集結:由許多的文檔組成一個集結,稱為文檔集結。

                3、文檔編號:互聯網上每一個文檔都有各自且絕無僅有的編號。

                4、單詞編號:每個單詞都有各自的僅有編號,用編號來代表這個單詞或、短語者句子。

                5、倒排索引:是在查找引起的索引庫中,以單詞對應網頁的一種存儲的辦法,可以根據單詞快速的獲取相關的文檔。

                其實倒排索引非常的簡略,下面就結合一些特征案例來逐步深化的分析這個算法,我們先了解一些底子的思路即可。

                上圖是每個文檔編號對應的不同文檔,如編號“1”對應“小明吃早飯”,編號“2”對應“小明早上吃了什么”,以此類推。

                其他由于中文和英文的文明特征不相同,中文的漢字之間沒有明顯像英文單詞那樣的分隔符,索引首要對中文要進行一下分詞(下面舉例中暫時不去掉中止詞),這樣就把一句話變成了一個個的詞組,如下圖。

                上圖單詞的ID記錄了每個單詞的編號,第二列是編號所對應的單詞,第三列是哪幾個文檔中包含了這個單詞。

                比如單詞“小明”,其其單詞編號為“1”,倒排列表“1,2,4,5”,表明這幾個文檔集結中都包含了這個單詞。實際上查找引擎更為凌亂,不只是記錄了單詞的文檔編號,還記錄了單詞的頻率(TF,什么意思呢?許多查找引擎優化從業者都在說關鍵詞的密度,

                市面上核算頁面中關鍵詞密度的核算公式有三個:

                公式一: 關鍵詞次數/頁面總字數 x100%

                公式二: 關鍵詞次數/頁面總字數/關鍵詞字數 x 100%

                公式三: 關鍵詞次數/頁面分詞數量 x 100%

                先不談論哪個公式的核算辦法更加精準,我們發現公式中都出現了關鍵詞的次數,那這個TF就是該單詞在頁面中出現的次數)

                這個TF在查找引擎核算查找效果排序時,分析查詢詞和文檔庫中哪個文檔更為相關的一個參閱要素。

                上圖是比較凌亂的,我們來看看文檔頻率為多個文檔包含這個單詞,如:“小明”在“ 4 個文檔”中出現了。“吃”在“ 4 個文檔”中出現了,后邊的以此類推。倒排列表小明 (1;1), 1 為文檔1,中心的 1 為這個詞在這個文檔中出現的頻率,是這個詞在文檔中出現的方位1,即在文檔中第一個詞。

                實戰運用,在紙上談的再多,不如通過實戰去驗證這個觀念,是否對排名有幫忙。下面就來看看。

                以主頁天然排名的 10 個網站的網頁類型和標題為例:

                主頁,排名第一,“早點練習_早餐練習班_早點練習學校【免費吃住】”

                主頁,排名第二,“早餐練習_早餐練習班_早餐練習學校【免費加盟】”

                主頁,排名第三,“上海頂正小吃練習學校_早點練習_生煎包練習_燒烤練習全國最專.....”

                主頁,排名第四,“上海早點練習|重慶小面練習|山東雜糧餅練習|鹵菜練習|小吃練習.......”

                主頁,排名第五,“小吃練習_特征小吃_小吃項目加盟-老灶臺特征小吃練習學校”

                內頁,排名第六,“早點練習 正規早點練習班-練習通”

                主頁,排名第七,“藝尚食代-早餐早點練習”

                主頁,排名第八,“小吃練習,早點練習,上海面點練習,上海德志廚藝美食練習中心021-...”

                主頁,排名第九,“早餐店加盟_營養早餐加盟_特征早點加盟店_早餐店連鎖加盟練習_開...”

                內頁,排名第十,“早點練習班 正宗早點練習中心-練習通”

                分析得出:早點練習在這個 10 個網站中底子上都出現了 2 詞,我們有沒有發現早點和早餐是近義詞,(比如:我早點吃了什么,我早餐吃了什么。這兩句話表達的是同一個意思。)等于是增加了一遍詞頻,也就是 3 次了,在這里提示我們關鍵詞千萬不要堆砌,要堅持一個天然性。

                其他通過之前的實驗數據得出標題最左面的詞權重最高,只是結合這兩點,排名第一的網站標題做的比其他的網站標題都到位。其他標題結尾處“【免費吃住】”這是一個吸引用戶點擊的營銷點,所以標題是技術與藝術的結合。

                下圖是網站從上線到現在的錄入和權重的部分截圖:

                從上面的兩張圖片我們可以看出,這個網站的權重從 2017 年 12 月 11 日的站長權重是0, 4 天后權重抵達1,仍是比較輕松的。而且后來站內文章到投稿中止現已 5 個月沒有更新了,為什么有些查找引擎優化er天天更新文章,網站排名卻做不起來?有小伙伴說假設不寫文章,那么每天都不知道做些什么。

                在我看來這個不是影響排名的重要要素,由于前期網站信任度做好可以節省后期的許多工作(PS:這就是佛系SEO,讓網站自己讓排名)。

                通過上圖發現早點練習這個詞一直在主頁第一,非常的安穩。所以通過算法來優化網站仍是非常靠譜的。

                查找引擎是這個世界上最凌亂的程序之一,揭穿的算法不勝其數,有興趣的小伙伴們可以看看查找引擎公司他們申請專利的一個文檔,文檔中也會涉及到高等數學等等常識,假設你能堅持的去看而且結合實踐的話,那么你優化網站不用再靠猜排名了。

                《說說SEO論壇:SEO算法深度分析之倒排索引,來解釋SEO排名的問題》當前網址:http://www.jsdssp.com/seo/20190228179.html

                ?
                你可能喜歡的:
                骚虎影院-在线影院-成人站,亚洲大香蕉网伊人,全球最大黄色