百度目前在站內(nèi)搜索中支持5個數(shù)據(jù)模板的提交,分別是:通用、影視、小說、游戲、論壇。在實(shí)際的工作中處理過2個,所以分享下這2個的處理方法。 1、按照慣例,百度的這個提交是需要用xml地圖集的形式,先來說說游戲模板
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
??????? <loc>http://www.880sy.com/games/64929.html#gid.html</loc> |
著陸頁 |
??????? <lastmod>2013-01-01</lastmod> |
文件一次更新時間 |
??????? <data> |
|
??????????? <name>*</name> |
游戲名稱 |
??????????? <url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> |
著陸頁 |
??????????? <gameCategory>移動游戲</gameCategory> |
可根據(jù)tag調(diào)整 |
??????????? <gameSubCategory>手機(jī)游戲</gameSubCategory> |
可根據(jù)tag調(diào)整 |
??????????? <description>《魔獸》(World of Warcraft)…</description> |
測試下來,站內(nèi)搜索展示前140個字符正好,如果沒有字符,別忘了要技術(shù)寫個判斷加上些類似“暫無介紹”的文字,不然會報錯 |
??????????? <image> |
|
??????????????? <name>*圖標(biāo)</name> |
可以是圖片的alt標(biāo)簽 |
??????????????? <url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> |
游戲的展示圖片,例如手游的話是app圖標(biāo) |
??????????? </image> |
|
??????????? <datePublished>2011-12-20</datePublished> |
游戲的發(fā)布時間 |
??????????? <size>*MB</size> |
游戲大小 |
??????????? <tag>RPG,射擊</tag> |
游戲類型,這個可以根據(jù)站點(diǎn)的tag標(biāo)簽調(diào)整 |
??????????? <developer><legalName>*</legalName></developer> |
開發(fā)商 |
??????????? <version>V2.4.0</version> |
版本號 |
??????????? <device>*</device> |
設(shè)備類型 |
??????? </data> |
|
??? </url> |
|
</urlset> |
|
<downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> |
地址,有的話放上去,不是必填項(xiàng) |
其他注意點(diǎn):整個文檔要字符串形式, 這種需要轉(zhuǎn)義,自己注意。文件量太大的話用sitemapindex索引的xml。提交后很快能在百度站內(nèi)搜索中看到結(jié)果。
? 這部分需要到樣式自定義里面去把游戲樣式調(diào)用出來。
? 2、通用模板樣式
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
|
??????? <loc>http://ky.kaoyan.com/04/467393/</loc> |
|
著陸頁 |
??????? <lastmod>2013-04-10</lastmod> |
|
更新時間 |
??????? <changefreq>always</changefreq> |
|
更新平率 |
??????? <priority>0.5</priority> |
|
重要值 |
??????? <data> |
|
|
??????????? <display> |
|
|
??????????????? <title>【寫給即將上戰(zhàn)場的你們】努力為王,心態(tài)為皇</title> |
|
文章標(biāo)題,建議用頁面的title格式 |
??????????????? <content>略</content> |
|
可以全部提交正文,不用等蜘蛛來抓取了,注意把圖片格式,鏈接格式全部去掉 |
??????????????? <tag>考研復(fù)習(xí)</tag><tag>經(jīng)驗(yàn)</tag> |
|
根據(jù)tag標(biāo)簽 |
??????????????? <pubTime>2012-12-04T11:20:13</pubTime> |
|
發(fā)布時間 |
??????????????? <breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> |
|
相當(dāng)于面包屑的層級關(guān)系 |
??????????????? <breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> |
|
??????????????? <thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> |
|
縮略圖 |
??????????????? <image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七個常用的泰勒展開式”/> |
|
文章的個圖片,默認(rèn)缺省的話會調(diào)用縮略圖 |
??????????? </display> |
|
|
??????? </data> |
|
|
??? </url> |
|
|
</urlset> |
|
下圖是通用模板的自定義結(jié)構(gòu)化因子,可以增加展示整個通用模板里還有很多其他的信息。在其中還可以看到比如discount(折扣);price(價格)等影響的因素。有興趣的可以去研究整個通用模板的數(shù)據(jù)結(jié)果,都包含在里面。
下圖的面包屑的層級是用breadcrumb:title這個結(jié)構(gòu)因子產(chǎn)生出來的。并且終還可以根據(jù)你的這些標(biāo)簽(比如price)進(jìn)行排序。 
說說重點(diǎn)的地方: 1、希望哪,這些提交的內(nèi)容能在百度搜索引擎(不是自己的站內(nèi))結(jié)果展示上有一定的區(qū)別。
2、貌似阿拉丁百度開放平臺里提交的數(shù)據(jù)和這個有些像,之后研究下,可以的話提交行業(yè)數(shù)據(jù)試試。
推薦閱讀