尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

采集很狡詐,識(shí)別原創(chuàng)很艱難

作者:黑貓警長(zhǎng) 瀏覽:176 發(fā)布時(shí)間:2018-01-11
分享 評(píng)論 0

2.1 采集冒充原創(chuàng),篡改關(guān)鍵信息
  當(dāng)前,大量的網(wǎng)站批量采集原創(chuàng)內(nèi)容后,用人工或機(jī)器的方法,篡改作者、發(fā)布時(shí)間和來源等關(guān)鍵信息,冒充原創(chuàng)。此類冒充原創(chuàng)是需要搜索引擎識(shí)別出來予以適當(dāng)調(diào)整的。
  2.2 內(nèi)容生成器,制造偽原創(chuàng)
  利用自動(dòng)文章生成器等工具,“獨(dú)創(chuàng)”一篇文章,然后安一個(gè)吸引眼球的title,現(xiàn)在的成本也低得很,而且一定具有獨(dú)創(chuàng)性。然而,原創(chuàng)是要具有社會(huì)共識(shí)價(jià)值的,而不是胡亂制造一篇根本不通的垃圾就能算做有價(jià)值的優(yōu)質(zhì)原創(chuàng)內(nèi)容。內(nèi)容雖然獨(dú)特,但是不具社會(huì)共識(shí)價(jià)值,此類偽原創(chuàng)是搜索引擎需要重點(diǎn)識(shí)別出來并予以打擊的。
  2.3 網(wǎng)頁差異化,結(jié)構(gòu)化信息提取困難
  不同的站點(diǎn)結(jié)構(gòu)化差異比較大,html標(biāo)簽的含義和分布也不同,因此提取關(guān)鍵信息如標(biāo)題、作者和時(shí)間的難易程度差別也比較大。做到既提得全,又提得準(zhǔn),還要最及時(shí),在當(dāng)前的中文互聯(lián)網(wǎng)規(guī)模下實(shí)屬不易,這部分將需要搜索引擎與站長(zhǎng)配合好才會(huì)更順暢的運(yùn)行,站長(zhǎng)們?nèi)绻酶逦慕Y(jié)構(gòu)告知搜索引擎網(wǎng)頁的布局,將使搜索引擎高效地提取原創(chuàng)相關(guān)的信息。