中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何制作符合搜索引擎要求的XML地圖

2019-03-05    來源:Chinaz用戶投稿

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

正如我們所知道的那樣,網(wǎng)站地圖總共有兩種格式,一為HTML網(wǎng)站地圖(就是我們?cè)诤芏嗑W(wǎng)站中常見的底部文件中的站點(diǎn)地圖),主要是方便用戶快速了解網(wǎng)站框架服務(wù)并快速定位到其所想訪問的內(nèi)容,同時(shí)有助于搜索引擎有組織、有條理的訪問網(wǎng)站;另一種是XML網(wǎng)站地圖,這種站點(diǎn)地圖主要是為包括GOOGLE、YAHOO等在內(nèi)的大型搜索引擎服務(wù)的,BAIDU目前雖還未明確表態(tài)支持這種網(wǎng)站地圖,但隨著目前各大搜索引擎紛紛支持的趨勢(shì)發(fā)展下去,BAIDU恐也很難免俗。

我們今天要探討的是XML格式的網(wǎng)站地圖制作及提交流程,至于HTML的站點(diǎn)地圖,留著以后再開篇文章專門討論。

在探討XML戰(zhàn)地地圖如何制作之前,我們要先知道:什么是XML網(wǎng)站地圖?為什么要做XML的網(wǎng)站地圖?

先來解決第一個(gè)問題:什么是XML格式的網(wǎng)站地圖?

根據(jù)GOOGLE網(wǎng)站管理員工具中關(guān)于Sitemap.xml的定義:XML Sitemap - 通常稱為 Sitemap(使用大寫 S),是您向 Google 提供有關(guān)您網(wǎng)站信息的一種方法。 Sitemap 就是您網(wǎng)站上網(wǎng)頁(yè)的列表。 創(chuàng)建并提交 Sitemap 有助于確保 Google 知道您網(wǎng)站上的所有網(wǎng)頁(yè),包括 Google 的正常抓取過程可能無法找到的網(wǎng)址。

是不是覺得GOOGLE官方的解釋晦澀難懂呢,像我們這種非專業(yè)人士其實(shí)完全可以簡(jiǎn)單通俗易懂的理解一下,就是:Sitemap.xml是google搞出來的鬼,也就是網(wǎng)站地圖,不過這個(gè)網(wǎng)站地圖是用xml寫的,而且要按google的標(biāo)準(zhǔn)來寫,并且要將寫出來的這個(gè)文件sitemap.xml上傳到自己的服務(wù)器空間中去。至于什么是XML文件,怎么編寫XML文件,也不在今天探討的范圍之內(nèi),建議有興趣的可以自行GOOGLE學(xué)習(xí)一下。

好了,第一個(gè)問題解決了,緊接下來是第二個(gè)問題:為什么要制作sitemap.xml??

我們還是先看一下GOOGLE對(duì)于制作sitemap.xml的目的官方說明,然后再給個(gè)比較通俗點(diǎn)的理解(今天很多概念、說法等都需要引用GOOGLE的官方說法,同時(shí)再給個(gè)通俗一點(diǎn)的解釋,倒不是為了反襯GOOGLE的說明有多難懂,而是站在我們草根一族角度來說:寫不了高深的武林秘籍,題個(gè)讀后感之類的露個(gè)臉也可以)。

GOOGLE對(duì)于為啥要做sitemaps.xml的官方解釋:

如果網(wǎng)站屬于下列情況,那么 Sitemap 會(huì)特別實(shí)用:

網(wǎng)站含動(dòng)態(tài)內(nèi)容。

網(wǎng)站有不容易被 Googlebot 在抓取過程中發(fā)現(xiàn)的頁(yè)面,如有大量富 AJAX 或 Flash 內(nèi)容的頁(yè)面。

網(wǎng)站為新網(wǎng)站且指向網(wǎng)站的鏈接不多。 (Googlebot 會(huì)跟隨鏈接從一個(gè)網(wǎng)頁(yè)到另一個(gè)網(wǎng)頁(yè)抓取網(wǎng)絡(luò),因此,如果您的網(wǎng)站沒有很好地鏈接,我們可能很難發(fā)現(xiàn)它。)

網(wǎng)站有大量?jī)?nèi)容頁(yè)存檔,這些內(nèi)容頁(yè)相互沒有很好地鏈接,或根本就沒有鏈接。

草根一點(diǎn)的理解就是:提交sitemap一是有利于搜索抓取一些正常抓取過程中無法抓取的網(wǎng)址,比如動(dòng)態(tài)網(wǎng)頁(yè),包含大量AJAX的網(wǎng)頁(yè)或者flash的頁(yè)面。二是為搜索蜘蛛指明“工作方向”。Sitemap就是你網(wǎng)站上頁(yè)面的列表,googlebot就按照這個(gè)去一個(gè)個(gè)的抓取收錄頁(yè)面,顯然比它自己去找會(huì)效率高,而且要全。

好了,回答完以上兩個(gè)問題后,馬上就切入正題了:如何制作符合搜索引擎要求的XML SITEMAP。

GOOGLE在其幫助指南中提供了多種創(chuàng)作sitemap.xml的方法,如基于GOOGLE協(xié)作平臺(tái)創(chuàng)建并驗(yàn)證的網(wǎng)站可直接提交、使用RSS或ATOM供稿作為SITEMAP、根據(jù)SITEMAP協(xié)議創(chuàng)作的sitemap.xml與其他方式等。

這么多方法中,目前符合國(guó)內(nèi)使用習(xí)慣或多數(shù)人采用的,是根據(jù)sitemap協(xié)議自行創(chuàng)作sitemap.xml,這也是我們今天要討論的。如果網(wǎng)站采用ASP編程,可在網(wǎng)上搜索添加一段開源代碼使其在后臺(tái)中按照想要的格式生成相應(yīng)的sitemap.xml文件;如果使用的是基于wordpress的開源系統(tǒng),可使用WP自行攜帶的功能生成文件;如果你感覺自己的技術(shù)很牛又不喜歡用這些功能的話,可自行手動(dòng)編寫符合 sitemap協(xié)議0.9(GOOGLE支持的)標(biāo)準(zhǔn)的站點(diǎn)地圖……………如果,再如果,你的網(wǎng)站不是以上情況中的任何一種,同時(shí)技術(shù)跟我一樣很菜的情況下,那么,只能借助于目前一些免費(fèi)的軟件來制作我們所想要的地圖了。

一直在苦苦搜尋一款比較好用的Sitemap制作工具,可惜找了許久都無功而返,不是搜索鏈接不全,就是速度過慢,前段遇到一個(gè)稍微好用點(diǎn)的,可是有數(shù)量限制,生成1000個(gè)之后就自動(dòng)退出(目前網(wǎng)上這種軟件魚目混珠,一搜一大把,但基本是限制在1000個(gè)鏈接內(nèi)的)。直到這幾天,我找到了它——老虎牌sitemap生成器,以前的郁悶一掃而空,同時(shí)不斷的帶來驚喜,不但沒有1000個(gè)鏈接的限制,而且操作使用極其方便,在此感謝不認(rèn)識(shí)的老虎兄弟的辛苦工作,才讓我們菜鳥們有這么一塊好用的利器。

這個(gè)是老虎SITEMAP生成器的操作頁(yè)面,功能不復(fù)雜,操作極其簡(jiǎn)單。

在制作SITEMAP之前,可先做一些設(shè)置。點(diǎn)擊“工具”,選擇“選項(xiàng)”,在彈出框中選定“默認(rèn)值”一欄,里面有關(guān)于SITEMAP中的一些設(shè)置,包括更新頻次(changefreq)與優(yōu)先級(jí)(priority)兩項(xiàng),這是sitemap.xml中要體現(xiàn)的,關(guān)于這兩個(gè)參數(shù)的含義下面將具體描述。

因軟件功能限制,可以在操作之前將這兩個(gè)參數(shù)設(shè)置一下,也可以留空后面再根據(jù)需要補(bǔ)充,我用的時(shí)候就是留空,等結(jié)束了再手動(dòng)設(shè)定借個(gè)頁(yè)面的更新頻次與優(yōu)先級(jí),影響不大。

輸入要做地圖的網(wǎng)站網(wǎng)址,同時(shí)選擇保存路徑,要注意的一點(diǎn)是,默認(rèn)的文件格式是xml,不要修改。點(diǎn)擊“開始”即可,記得在生成過程中定時(shí)保存。

在這個(gè)頁(yè)面中,注意到右側(cè)的“上次更改時(shí)間”、“更新頻率”、“優(yōu)先級(jí)”都為空,在整個(gè)站點(diǎn)地圖生成完畢后,統(tǒng)一修改。目前網(wǎng)上的SITEMAP生成軟件(包括老虎在內(nèi)),都沒有提供一個(gè)比較智能的頁(yè)面更新頻次與優(yōu)先級(jí)設(shè)定功能,因此這邊采用最傳統(tǒng)的方式,也偷懶一點(diǎn),先是所有的鏈接更新頻次設(shè)定為“daily“,優(yōu)先級(jí)設(shè)置為”0.6“,然后挑出幾個(gè)重要頁(yè)面與特殊頁(yè)面,手動(dòng)修改其更新頻次與優(yōu)先級(jí),如首頁(yè)www.kinig.com的更新頻次為daily,優(yōu)先級(jí)為1.0,而about us或contact us的更新頻次可能就是yearly,優(yōu)先級(jí)為0.4了,幾個(gè)認(rèn)為比較重要的頁(yè)面修改一下,如果偷懶全置空或者所有的更新頻次與優(yōu)先級(jí)全設(shè)置為相同,那么在上傳并提交給GOOGLE后會(huì)出現(xiàn)錯(cuò)誤的提示。

操作方法是隨便選擇一條鏈接,雙擊之后會(huì)彈跳出一個(gè)頁(yè)面,頁(yè)面中“更新頻次”選擇daily,“優(yōu)先級(jí)”選擇0.6,點(diǎn)擊右側(cè)“應(yīng)用到所有鏈接”后確定即可,然后手動(dòng)挑選出重要頁(yè)面,按照上述方法進(jìn)行修改,唯一的區(qū)別就是不選擇“應(yīng)用到所有鏈接”。

sitemap完全生成并修改后,保存,然后點(diǎn)擊上面的第四個(gè)按鈕”sitemap“,查看sitemap.xml文件。

xml文件的創(chuàng)建在google官方中詳細(xì)描述,這里只簡(jiǎn)單介紹一下部分代碼語(yǔ)句:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

      <url>

             <loc>http://www.kinig.com</loc>

             <lastmod>2008-12-29</lastmod>

             <changefreq>daily</changefreq>

             <priority>1.0</priority>

      </url>

      <url>

             <loc>http://www.kinig.com/contact.htm</loc>

             <lastmod>2008-12-19</lastmod>

             <changefreq>yearly</changefreq>

             <priority>0.4</priority>

      </url>

      …

      …

</urlset>

代碼解釋: 

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

        這兩行就相當(dāng)于網(wǎng)頁(yè)文件中的<html>標(biāo)簽一樣的作用。不必管這兩行什么意思,照抄即可。

        切記:一個(gè)字符也不能錯(cuò),即使多一個(gè)空格,google網(wǎng)站采集時(shí)也會(huì)報(bào)錯(cuò)。另外,千萬別忘了在文件的末尾加上</urlset>標(biāo)簽。

<loc>http://www.kinig.com/contact.htm</loc>

        這里是頁(yè)面鏈接地址,也就是你希望蜘蛛訪問的地址。

lastmod:頁(yè)面最后修改時(shí)間

        這個(gè)很重要。Google的機(jī)器人會(huì)在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行比較,如果時(shí)間一樣就會(huì)跳過不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時(shí)的內(nèi)容有所改變,應(yīng)該更新該時(shí)間,讓Google下次索引時(shí)會(huì)重新 對(duì)該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:

年:YYYY(2008)

年和月:YYYY-MM(2008-12)

年月日:YYYY-MM-DD(2008-12-29)

年月日小時(shí)分鐘:YYYY-MM-DDThh:mmTZD(2008-12-29T10:37+08:00)

年月日小時(shí)分鐘秒:YYYY-MM-DDThh:mmTZD(2008-12-29T10:37:30+08:00)

這里需注意的是TZD,TZD指定就是本地時(shí)間區(qū)域標(biāo)記,像中國(guó)就是+08:00了

切記:其他格式可能引起出錯(cuò),比如將2008-08-08 寫成2008-8-8就會(huì)出問題。


changefreq:頁(yè)面內(nèi)容更新頻率。

        這里可以用來描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。如果要了解詳細(xì)的意思,可以查看google對(duì)于更新頻次的定義
。

priority:相對(duì)于其他頁(yè)面的優(yōu)先權(quán)

定于0.1 - 1.0之間 。

切記:建議將各類網(wǎng)頁(yè)根據(jù)重要性給出不同的數(shù)值,以方便蜘蛛的采集,不要耍小聰明全部寫1.0,google管理工具會(huì)報(bào)錯(cuò)的。

   sitemap.xml制作好后,上傳到網(wǎng)站根目錄下,如http://www.kinig.com/sitemap.xml,同時(shí)登陸GOOGLE管理員工具,按照其提示與要求進(jìn)行提交。Google提交網(wǎng)址:

http://www.google.com/webmasters/sitemaps/?hl=zh-CN

        提交后,在幾個(gè)小時(shí)內(nèi),系統(tǒng)就會(huì)開始下載處理了。

        提交后,還有一項(xiàng)工作需要做:SITEMAP的驗(yàn)證。

        驗(yàn)證網(wǎng)站地圖是否符合標(biāo)準(zhǔn),最方便的手段就是使用google的管理員工具了。

        在他下載sitemap.xml后幾天內(nèi),這個(gè)工具就會(huì)將詳細(xì)的分析結(jié)果反饋回來,包括:sitemap.xml中包含了多少地址,google已將多少地址加入索引,sitemap.xml中出現(xiàn)了哪些錯(cuò)誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網(wǎng)頁(yè)有404,500錯(cuò)誤都會(huì)詳細(xì)的羅列出來,非常方便。

        如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤快,頁(yè)面被收錄當(dāng)然也就更快。

標(biāo)簽: Baidu chinaz flash Google html PR site sitemap Sitemaps Sitemap制作 URL WordPress 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:四個(gè)也許網(wǎng)上從來沒有人提到過的SEO問題

下一篇:2008年SEO發(fā)展總結(jié):SEO獲得Google認(rèn)可