尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

搜索引擎是如何網(wǎng)頁是不是重復(fù)的

作者:長瘦不老i 瀏覽:229 發(fā)布時間:2018-01-18
分享 評論 0

  在互聯(lián)網(wǎng)中,信息的重復(fù)性是在所難免的。然而,搜索引擎怎樣識別重復(fù)信息?怎樣判斷哪些網(wǎng)頁的信息是原創(chuàng)的?哪些是復(fù)制的?怎樣認(rèn)為哪些重復(fù)的信息是有價值的?哪些又是可以舍棄的呢?


  在網(wǎng)站中,重復(fù)信息主要包括轉(zhuǎn)載和鏡像內(nèi)容兩大類。搜索引擎對頁面分析的時候,必須具備是被重復(fù)信息的能力。因?yàn)榇罅康闹貜?fù)信息不但占用巨大的服務(wù)器資源,而且還增加了用戶尋找信息的時間,降低了用戶體驗(yàn)。但這并不意味著所有重復(fù)信息都是沒有用的。搜索引擎會認(rèn)為轉(zhuǎn)載內(nèi)容沒有原創(chuàng)重要,賦予原創(chuàng)內(nèi)容更高的權(quán)重,而鏡像內(nèi)容則幾乎忽略。


  轉(zhuǎn)載頁面是指與原創(chuàng)內(nèi)容相同或相近的頁面。然而,搜索引擎如何識別轉(zhuǎn)載頁面呢?首先,它把網(wǎng)頁正文內(nèi)容分為n個區(qū)域進(jìn)行比較,如果其中有m個區(qū)域是相同或相似的,則認(rèn)為這些頁面是互為轉(zhuǎn)載頁面。


  在確定頁面的轉(zhuǎn)載關(guān)系后,接下來,搜索引擎在結(jié)合頁面的最后修改時間,頁面權(quán)重等因素判斷原創(chuàng)頁面與轉(zhuǎn)載頁面。


  鏡像頁面是指內(nèi)容完全相同的兩個頁面。和上述一樣,把內(nèi)容分出n個區(qū)域,比對吼n個區(qū)域完全一樣則互為鏡像頁面。


  鏡像網(wǎng)站。下一上完全相同的網(wǎng)站,形成鏡像網(wǎng)站主要有兩種情況。一個多個域名或IP指向同一服務(wù)器的物理目錄。另外就是整個網(wǎng)站內(nèi)容被復(fù)制到使用不同域名或者不同IP的服務(wù)器上。


  為了識別站點(diǎn)間是否互為鏡像網(wǎng)站搜索引擎首先判斷這些網(wǎng)站的首頁是否互為鏡像。然后綜合頁面權(quán)重,建立時間等諸多因素識別源網(wǎng)站。這也是為什么搜索引擎對于鏡像網(wǎng)站收錄極少,甚至不收錄的原因。