尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

搜索引擎技術(shù)揭密:排序技術(shù)

作者:小雞燉蘑菇 瀏覽:136 發(fā)布時(shí)間:2018-05-19
分享 評(píng)論 0

    隨著"眼球經(jīng)濟(jì)"席卷互聯(lián)網(wǎng),成千上萬(wàn)的資金迅速流向最能吸引瀏覽著眼球的搜索引擎市場(chǎng).有大量調(diào)查顯示搜索引擎市場(chǎng)正處在高速發(fā)展時(shí)期,成為了未來(lái)幾年內(nèi)最具發(fā)展?jié)摿Φ漠a(chǎn)業(yè)之一.隨著Google、百度、中國(guó)搜索等各具特色的搜索引擎逐漸成為人們最常用的網(wǎng)絡(luò)工具,企業(yè)對(duì)搜索引擎的注意力也從"觀察"升級(jí)為"動(dòng)武".


    隨著市場(chǎng)容量和使用者人數(shù)的不斷激增,如何完善搜索功能使之更加公平、公開(kāi)、標(biāo)準(zhǔn)和人性化也就隨之成為了一個(gè)備受關(guān)注的話題.但是有一個(gè)矛盾體在這其中不斷的顯現(xiàn)出來(lái):收費(fèi)可以為搜索引擎公司帶來(lái)利潤(rùn),但同時(shí)會(huì)降低訪問(wèn)者的體驗(yàn)滿意度.如何權(quán)衡金錢(qián)和用戶需求之間的天平呢?


    Google成功的秘密


    到2004年為止,Google 已經(jīng)連續(xù)兩年被評(píng)為全球第一品牌,Google成立僅五年時(shí)間,最初只是兩個(gè)斯坦福大學(xué)學(xué)生的研究項(xiàng)目.這不能不說(shuō)是一個(gè)奇跡,就像比爾?蓋茨創(chuàng)制奇跡一樣.比爾?蓋茨能創(chuàng)造奇跡,是因?yàn)樗礈?zhǔn)了個(gè)人計(jì)算機(jī)軟件市場(chǎng)的趨勢(shì),所以創(chuàng)建的公司叫Microsoft(微軟):Micro(小)Soft(軟件). 那么Google呢?在Google出來(lái)之前已經(jīng)有一些很有成就的搜索引擎公司,其實(shí)力也很強(qiáng),看來(lái)不只是Google看見(jiàn)了搜索的趨勢(shì).Google究竟成功的秘密在哪兒?


    Google的成功有許多因素,最重要的是Google對(duì)搜索結(jié)果的排序比其它搜索引擎都要好.Google保證讓絕大部分用搜索的人,都能在搜索結(jié)果的第一頁(yè)找到他想要的結(jié)果.客戶得到了滿足,下一次還過(guò)來(lái),而且會(huì)向其他人介紹,這一來(lái)一往,使用的人就多了.所以Google在沒(méi)有做任何廣告的前提下,讓自己成為了全球最大的品牌.Google究竟采用了哪種排序技術(shù)?PageRank,即網(wǎng)頁(yè)級(jí)別.


    Google有一個(gè)創(chuàng)始人叫Larry Page,據(jù)說(shuō)PageRank的專利是他申請(qǐng)的,于是依據(jù)他的名字就有了Page Rank.國(guó)內(nèi)也有一家很成功的搜索引擎公司,叫百度.百度的創(chuàng)始人李彥宏說(shuō),早在1996年他就申請(qǐng)了名為超鏈分析的專利,PageRank的原理和超鏈分析的原理是一樣的,而且PageRank目前還在Paten-pending(專利申請(qǐng)中).言下之意是這里面存在專利所有權(quán)的問(wèn)題.這里不討論專利所有權(quán),只是從中可看出,成功搜索引擎的排序技術(shù),就其原理上來(lái)說(shuō)都差不多,那就是鏈接分析.超鏈分析和PageRank都屬于鏈接分析.


    鏈接分析到底為何物?由于李彥宏的超鏈分析沒(méi)有具體的介紹,筆者唯一看過(guò)的就是在美國(guó)專利局網(wǎng)站上關(guān)于李彥宏的專利介紹.PageRank的介紹倒是不少,而且目前Google畢竟是全球最大的搜索引擎,這里以PageRank為代表,詳細(xì)介紹鏈接分析的原理.


    PageRank揭密


    PageRank的原理類似于科技論文中的引用機(jī)制:誰(shuí)的論文被引用次數(shù)多,誰(shuí)就是權(quán)威.說(shuō)的更白話一點(diǎn):張三在談話中提到了張曼玉,李四在談話中也提到張曼玉,王五在談話中還提到張曼玉,這就說(shuō)明張曼玉一定是很有名的人.在互聯(lián)網(wǎng)上,鏈接就相當(dāng)于"引用",在B網(wǎng)頁(yè)中鏈接了A,相當(dāng)于B在談話時(shí)提到了A,如果在C、D、E、F中都鏈接了A,那么說(shuō)明A網(wǎng)頁(yè)是最重要的,A網(wǎng)頁(yè)的PageRank值也就最高.


    如何計(jì)算PageRank值有一個(gè)簡(jiǎn)單的公式:


    其中:系數(shù)為一個(gè)大于0,小于1的數(shù).一般設(shè)置為.網(wǎng)頁(yè)1、網(wǎng)頁(yè)2至網(wǎng)頁(yè)N表示所有鏈接指向A的網(wǎng)頁(yè).


    由以上公式可以看出三點(diǎn):


    1、鏈接指向A的網(wǎng)頁(yè)越多,A的級(jí)別越高.即A的級(jí)別和指向A的網(wǎng)頁(yè)個(gè)數(shù)成正比,在公式中表示,N越大, A的級(jí)別越高;


    2、鏈接指向A的網(wǎng)頁(yè),其網(wǎng)頁(yè)級(jí)別越高, A的級(jí)別也越高.即A的級(jí)別和指向A的網(wǎng)頁(yè)自己的網(wǎng)頁(yè)級(jí)別成正比,在公式中表示,網(wǎng)頁(yè)N級(jí)別越高, A的級(jí)別也越高;


    3、鏈接指向A的網(wǎng)頁(yè),其鏈出的個(gè)數(shù)越多,A的級(jí)別越低.即A的級(jí)別和指向A的網(wǎng)頁(yè)自己的網(wǎng)頁(yè)鏈出個(gè)數(shù)成反比,在公式中現(xiàn)實(shí),網(wǎng)頁(yè)N鏈出個(gè)數(shù)越多,A的級(jí)別越低.


    每個(gè)網(wǎng)頁(yè)有一個(gè)PageRank值,這樣形成一個(gè)巨大的方程組,對(duì)這個(gè)方程組求解,就能得到每個(gè)網(wǎng)頁(yè)的PageRank值.互聯(lián)網(wǎng)上有上百億個(gè)網(wǎng)頁(yè),那么這個(gè)方程組就有上百億個(gè)未知數(shù),這個(gè)方程雖然是有解,但計(jì)算畢竟太復(fù)雜了,不可能把這所有的頁(yè)面放在一起去求解的.對(duì)具體的計(jì)算方法有興趣的朋友可以去參考一些數(shù)值計(jì)算方面的書(shū).


    總之,PageRank有效地利用了互聯(lián)網(wǎng)所擁有的龐大鏈接構(gòu)造的特性. 從網(wǎng)頁(yè)A導(dǎo)向網(wǎng)頁(yè)B的鏈接,用Google創(chuàng)始人的話講,是頁(yè)面A對(duì)頁(yè)面B的支持投票,Google根據(jù)這個(gè)投票數(shù)來(lái)判斷頁(yè)面的重要性,但Google除了看投票數(shù)(鏈接數(shù))以外,對(duì)投票者(鏈接的頁(yè)面)也進(jìn)行分析.「重要性」高的頁(yè)面所投的票的評(píng)價(jià)會(huì)更高,因?yàn)榻邮苓@個(gè)投票頁(yè)面會(huì)被理解為「重要的物品」.從新浪、雅虎、微軟的首頁(yè)都有我網(wǎng)頁(yè)的三個(gè)鏈接的話,可能比我在其他網(wǎng)站找三十個(gè)鏈接還強(qiáng).如果還有人不理解這個(gè)原理,就去想想有句成語(yǔ)叫:三人成虎.如果有三個(gè)人都說(shuō)北京大街上有老虎,那么許多人會(huì)認(rèn)為有老虎,如果這三個(gè)人都是國(guó)家領(lǐng)導(dǎo)人的話,那么所有人都會(huì)認(rèn)為北京大街上有老虎.


    每個(gè)網(wǎng)頁(yè)都會(huì)有PageRank值,如果大家想知道自己網(wǎng)站的網(wǎng)頁(yè)P(yáng)ageRank值是多少,最簡(jiǎn)單的辦法就是下載一個(gè)Google的免費(fèi)工具欄


    每當(dāng)你打開(kāi)一個(gè)網(wǎng)頁(yè),都可以很清楚的看見(jiàn)此網(wǎng)頁(yè)的PageRank值.當(dāng)然這個(gè)值是一個(gè)大概數(shù)字.


    據(jù)Google技術(shù)負(fù)責(zé)人介紹,Google除了用PageRank衡量網(wǎng)頁(yè)的重要程度以外,還有其它上百種因素來(lái)參與排序.其它搜索引擎也是如此,不可能按照某一種規(guī)則來(lái)進(jìn)行搜索結(jié)果的排序.