中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

信息過(guò)量抓取有限:談搜索引擎相關(guān)性技術(shù)

2019-03-05    來(lái)源:www.seo.com.cn

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

核心提示:相關(guān)性,是搜索引擎優(yōu)化中的重點(diǎn),主要是由搜索引擎的特點(diǎn)決定的。首先Web網(wǎng)頁(yè)數(shù)量已經(jīng)達(dá)到上十億的規(guī)模,其次,搜索引擎用戶(hù)自身的檢索專(zhuān)業(yè)能力通常很有限。

相關(guān)性,是搜索引擎優(yōu)化中的重點(diǎn)。但是對(duì)于相關(guān)性的搜索引擎工作原理,相信大部分的SEOER對(duì)于都缺乏了解。但是只需要我們主流搜索引擎技術(shù)的方向,你就可以知道搜索引擎時(shí)代的脈搏。

相關(guān)度排序技術(shù)的產(chǎn)生主要是由搜索引擎的特點(diǎn)決定的。首先,現(xiàn)代搜索引擎能夠訪問(wèn)的Web網(wǎng)頁(yè)數(shù)量已經(jīng)達(dá)到上十億的規(guī)模,哪怕用戶(hù)只是搜索其中很少的一部分內(nèi)容,基于全文搜索技術(shù)的搜索引擎也能返回成千上萬(wàn)的頁(yè)面。即便這些結(jié)果網(wǎng)頁(yè)都是用戶(hù)所需要的,用戶(hù)也沒(méi)有可能對(duì)所有的網(wǎng)頁(yè)瀏覽一遍,所以能夠?qū)⒂脩?hù)最感興趣的結(jié)果網(wǎng)頁(yè)放于前面,勢(shì)必可以增強(qiáng)搜索引擎用戶(hù)的滿(mǎn)意度。其次,搜索引擎用戶(hù)自身的檢索專(zhuān)業(yè)能力通常很有限,在最為普遍的關(guān)鍵詞檢索行為中,用戶(hù)一般只是鍵人幾個(gè)詞語(yǔ)。例如,Spink等曾對(duì)Excite等搜索引擎的近300位用戶(hù)做過(guò)實(shí)驗(yàn)調(diào)查,發(fā)現(xiàn)人均輸入的檢索詞為3.34個(gè)。國(guó)內(nèi)部分學(xué)者也有相似的結(jié)論,發(fā)現(xiàn)90%左右的用戶(hù)輸入的中文檢索單字為2~6個(gè),而且2字詞居多,約占58%,其次為4字詞(約占18%)和3字詞(約占14%)。

過(guò)少的檢索詞事實(shí)上無(wú)法真正表達(dá)用戶(hù)的檢索需求,而且用戶(hù)通常也不去進(jìn)行復(fù)雜的邏輯構(gòu)造,只有相當(dāng)少的用戶(hù)進(jìn)行布爾邏輯檢索、限制性檢索和高級(jí)檢索等方法,僅有5.24%的檢索式中包含有布爾邏輯算符。國(guó)內(nèi)的部分學(xué)者的研究結(jié)果也表明,約40%的用戶(hù)不能正確運(yùn)用字段檢索或二次檢索,80%左右的用戶(hù)不能正確運(yùn)用高級(jí)檢索功能,甚至還發(fā)現(xiàn)用戶(hù)缺乏動(dòng)力去學(xué)習(xí)復(fù)雜的檢索技能,多數(shù)用戶(hù)都寄希望于搜索引擎能夠自動(dòng)地為他們構(gòu)造有效的檢索式。由于缺乏過(guò)去聯(lián)機(jī)檢索中常常具備的檢索人員,因此,用戶(hù)實(shí)際的檢索行為與用戶(hù)理想的檢索行為存在事實(shí)上的差距,檢索結(jié)果的不滿(mǎn)意也是不奇怪的。正是由于這個(gè)特點(diǎn),搜索引擎就必須設(shè)法將用戶(hù)最想要的網(wǎng)頁(yè)結(jié)果盡可能地放到網(wǎng)頁(yè)結(jié)果的前面,這就是網(wǎng)頁(yè)相關(guān)度排序算法在搜索引擎中為什么非常重要的原因。

現(xiàn)階段的相關(guān)度排序技術(shù)主要有以下幾種:一是基于傳統(tǒng)信息檢索技術(shù)的方式,它主要利用關(guān)鍵詞本身在文檔中的重要程度來(lái)對(duì)文檔與用戶(hù)查詢(xún)要求的相關(guān)度做出測(cè)量,如利用網(wǎng)頁(yè)中關(guān)鍵詞出現(xiàn)的頻率和位置。一般而言,檢索出的網(wǎng)頁(yè)文檔中含有的查詢(xún)關(guān)鍵詞個(gè)數(shù)越多,相關(guān)性越大,并且此關(guān)鍵詞的區(qū)分度越高;同時(shí),查詢(xún)關(guān)鍵詞如果出現(xiàn)在諸如標(biāo)題字段等重要位置上,則比出現(xiàn)在正文的相關(guān)度要大。二是超鏈分析技術(shù),使用此技術(shù)的代表性搜索引擎有Google和Baidu等。和前者相比,它以網(wǎng)頁(yè)被認(rèn)可的重要程度作為檢索結(jié)果的相關(guān)度排序依據(jù)。從設(shè)計(jì)思想上看,它更注重第三方對(duì)該網(wǎng)頁(yè)的認(rèn)可,如具有較大鏈入網(wǎng)頁(yè)數(shù)的網(wǎng)頁(yè)才是得到廣泛認(rèn)可的重要網(wǎng)頁(yè),而根據(jù)關(guān)鍵詞位置和頻率的傳統(tǒng)方法只是一種網(wǎng)頁(yè)自我認(rèn)可的形式,缺乏客觀性。最后還有一些其他方式,如由用戶(hù)自由定義排序規(guī)則的自定義方式。北京大學(xué)的天網(wǎng)FTP搜索引擎就采用這種排序方式,它可以讓用戶(hù)選擇諸如時(shí)間、大小、穩(wěn)定性和距離等具體排序指標(biāo)來(lái)對(duì)結(jié)果網(wǎng)頁(yè)進(jìn)行相關(guān)度排序。再如收費(fèi)排名模式,它作為搜索引擎的一種主要贏利手段,在具有網(wǎng)絡(luò)門(mén)戶(hù)特點(diǎn)的大型搜索引擎中廣為使用,但于擔(dān)心影響搜索結(jié)果的客觀性,這種方式不是它們的主流排序方式,而僅僅作為一個(gè)補(bǔ)充顯示在付費(fèi)搜索欄目中。

標(biāo)簽: 搜索引擎 信息 技術(shù) 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:走出鏈接誤區(qū)提升關(guān)鍵詞排名

下一篇:seo網(wǎng)站優(yōu)化外鏈的基本策略