中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

搜索引擎的工作原理—SEO原創(chuàng)秘笈(二)

2018-10-22    來源:SEO研究協(xié)會網(wǎng)

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

搜索引擎的工作原理-SEO原創(chuàng)秘笈(二)


接下來的課程中,廣州新川教育的專業(yè)SEO老師,龐洪老師將為大家解答關(guān)于搜索引擎的工作的問題,眾所周知,SEO也叫做搜索引擎優(yōu)化,也就是要讓我們的網(wǎng)頁盡量符合搜索引擎的工作習慣,盡量去迎合它的過程。我們必須先搞清楚搜索引擎的工作原理,然后才能迎合它的工作。

搜索引擎的工作原理—SEO原創(chuàng)秘笈(二)


那么搜索引擎的工作原理是什么呢,它是如何工作的呢?我們分如下八步來給大家講解搜索引擎的工作原理:

1、當搜索引擎蜘蛛進入到一個網(wǎng)站(如果是一個單個的網(wǎng)頁則不要管這一步)后,第一時間是查找網(wǎng)站根目錄下的robots.txt文件,這個文件是向蜘蛛表明哪些網(wǎng)頁它可以去,哪些網(wǎng)頁是不需要它去收錄的文件,它將嚴格依照這個文件的規(guī)定。然后它會查找這個網(wǎng)站下的網(wǎng)站地圖,即sitemap文件,看看如何去收錄這個網(wǎng)站,那當然,你的網(wǎng)站中如果沒有這兩個文件,對搜索引擎將是不利的(如何制作這兩個文件,在我們后面的SEO優(yōu)化課程里將會有詳細的講解)。

2、當搜索引擎進入到網(wǎng)頁后,會先查找網(wǎng)頁的title和H1標簽和keywords和description標簽,所以我們要保證這四個標簽的關(guān)鍵詞的高度統(tǒng)一;

3、提取文字:

搜索引擎的抓取是以文字內(nèi)容為基礎(chǔ)的,所以,從優(yōu)化的角度出發(fā),動畫網(wǎng)站,Javascript 的代碼,圖片內(nèi)容是不能被引擎抓取的,對優(yōu)化網(wǎng)站是不利的。“提取文字”是指搜索引擎先從HTML 文件中去掉標簽,程序,提取出可以用于頁面排名處理的文字內(nèi)容。

4、分析、確定關(guān)鍵詞(中文分詞):

對于西文的網(wǎng)站而言,搜索引擎判斷一個詞的方法非常簡單,有空格就會產(chǎn)生一個詞,所以,搜索引擎在判斷西文網(wǎng)站的關(guān)鍵詞時比較簡單,這個詞出現(xiàn)機會越大就越有可能是關(guān)鍵詞。

中文分詞是中文搜索引擎特有的步驟,搜索引擎在處理數(shù)據(jù)時都是以詞為基礎(chǔ)的,英文等語言單詞與單詞之間有空格,可以直接分詞,而中文詞與詞之間沒有任何分隔符,一個句子中的所有字和詞是連在一起的,搜索引擎要先分辨哪幾個字是一個詞,哪些字本來就是一個詞,比如“減肥方法”可能被分為“減肥”和“方法”兩個詞。

當搜索引擎發(fā)現(xiàn)title、keywords、description、H等標簽中出現(xiàn)的詞與正文中大量出現(xiàn)的詞相同或者相近時,它會認為這個詞就是這個頁面的關(guān)鍵詞。

5、去停止詞:

如的,地,得,啊,哈,呀之類的詞,這類詞是任何網(wǎng)頁都不可能將之作為關(guān)鍵詞的詞,就叫停止詞,搜索引擎在將網(wǎng)頁收錄進數(shù)據(jù)庫之前會去掉這些詞。

6、消除噪聲:

噪聲是指網(wǎng)頁上對頁面主題沒有貢獻的內(nèi)容,比如版權(quán)聲明文字,導(dǎo)航條,廣告等,這些都屬于噪聲,對頁面排名不利,它對于主題只能起分散作用。消噪的基本方法是根據(jù)html 標簽對頁面分塊,區(qū)分出頁頭,導(dǎo)航,正文,頁腳,廣告等區(qū)域,在網(wǎng)站上大量重復(fù)出現(xiàn)的區(qū)塊往往是噪聲,所以這些地方大家最好不要放置關(guān)鍵詞。以免給搜索引擎造成誤會,因為它會認為,這些地方出現(xiàn)的詞不應(yīng)該是關(guān)鍵詞。所以大家會經(jīng)?吹侥承┚W(wǎng)頁的最下方,有人會故意放置很多的關(guān)鍵詞,這是不但無益而且有害的。

7、去重:

同一文章經(jīng)常出現(xiàn)在不同網(wǎng)頁上,搜索引擎不喜歡這樣重復(fù)性的內(nèi)容,喜歡原創(chuàng)。所以,有些人為了頁面的更新度,會將人家的文章進行復(fù)制,然后加入一些簡單的內(nèi)容進行所謂的偽原創(chuàng),這是不能逃過引擎的去重算法。 每個網(wǎng)站有著不同的權(quán)重,這也導(dǎo)致不同的頁面也有不同的權(quán)重,用來衡量網(wǎng)站權(quán)重最有效的概念是PR值。簡單來說,權(quán)重的概念可以這樣理解,如果一個有影響力的人(權(quán)重高)說一件事,相信的人會很多,而一個不為人知的小人物(權(quán)重低)說了同一件事,人們會認為可信度不高。

當相同或者相似度很高的文章出現(xiàn)在不同的網(wǎng)站上,權(quán)重高的網(wǎng)頁會排名靠前,反之權(quán)重低的網(wǎng)頁排名靠后甚至根本不收錄,這就是去重的概念。

8、索引: 經(jīng)過文字提取,確定關(guān)鍵詞,消噪,去重后,搜索引擎得到的就是獨特的能反映頁面主體內(nèi)容的,以詞為單位的內(nèi)容。接下來搜索引擎索引程序會進行如下的操作:

1).提取關(guān)鍵詞:按照分詞程序分好的詞,把頁面轉(zhuǎn)換為一個關(guān)鍵詞組成的集合;

2).記錄每一個關(guān)鍵詞在頁面上的出現(xiàn)頻率、出現(xiàn)次數(shù)、格式(比如關(guān)鍵詞是否出現(xiàn)在標題、黑體、H 標簽、錨文字等標簽中)、位置(比如是否在頁面第一段文字)等,這樣,每一個頁面都可以記錄為一連串關(guān)鍵詞的集合。當用戶在搜索引擎中輸入關(guān)鍵詞與本頁匹配時,引擎會根據(jù)它的算法為你的頁面進行排名處理,然后顯示在搜索引擎中。

以上八步,就是搜索引擎的工作原理,也就是搜索引擎抓取網(wǎng)頁的整個過程。我們做網(wǎng)站SEO優(yōu)化,就是要最大程度去迎合搜索引擎的工作的過程,當我們明白搜索引擎的工作原理后,就可以有的放矢地做SEO工作。

本文僅代表作者個人觀點,不代表SEO研究協(xié)會網(wǎng)官方發(fā)聲,對觀點有疑義請先聯(lián)系作者本人進行修改,若內(nèi)容非法請聯(lián)系平臺管理員,郵箱cxb5918@163.com。更多相關(guān)資訊,請到SEO研究協(xié)會網(wǎng)www.bingfeng168.cn學習互聯(lián)網(wǎng)營銷技術(shù)請到巨推學院www.jutuiedu.com。

標簽: seo 代碼 互聯(lián)網(wǎng) 排名 數(shù)據(jù)庫 搜索 搜索引擎 搜索引擎優(yōu)化 學習互聯(lián)網(wǎng) 中文搜索引擎

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:URL網(wǎng)址規(guī)范化—網(wǎng)站想排名首頁必須做的SEO技術(shù)!

下一篇:做SEO多久見效?這個困惑今天解開了