成都網站建設,成都SEO公司,點瑞科技,為SEO而生!

SEO中robots文件的應用

編輯 : 點瑞網絡  日期:2019-06-19 10:11

robots文件是什么?
今天,上海網站優化—一易企排小編給大家整理關于robots文件的概念知識。

我們在與人交往的時候,往往會將自己最好的一面展現給對方,避免不好的方面給對方留下不好的印象。同樣,百度為了收錄更多有效的頁面,而SEO人員也為了展示更多有價值的頁面,避免百度收錄一些沒有意義的頁面,robots文件就誕生了。但是網站的程序是多樣化的,不可能每個頁面包括的數據庫都有價值,所以百度給出了一個優先級的txt文件,也就是robots.txt文件。這個robots文件里優先存儲的一般都是禁止百度蜘蛛爬行的文件,也就是不希望百度收錄該網站的頁面。

當百度蜘蛛首次爬行我們網站的時候,會優先爬行根目錄下的robots文件,根據robots文件里屏蔽的文件夾或者某個文件名,而跳過這些文件,然后進行其他目錄下頁面的爬行及收錄。如果網站下并不存在這個文件,那么百度或許會收錄一些不必要的文件,甚至暴露我們的數據庫等,這就會給一些不法分子造成空隙,通過我們的網站獲利。

1.robots.robots.txt所存放的位置

robots.txt文本文件必須存放在站點的根目錄下,也就是需要和首頁在同級目錄下。這樣一方面優先百度查找并進行排除,另一方面使百度蜘蛛沒有必要去判斷robots.txt文件存放在哪個目錄下。如果沒有robots.txt文件,會使百度蜘蛛爬行所有的網站,然后進行收錄等,增加了一些不必要的操作,加大了百度蜘蛛的工作量。

注意:百度蜘蛛只能識別小寫的rrobots文件,如圖,而且只能放在站點根目錄下。

2.robots.txt常用語句

一般情況下,為了快速建站,會使用一些網絡上的開源程序,而這些開源程序已經了解百度蜘蛛的模式,會默認在根目錄下添加robots.txt文件,并且已經屏蔽了某些文件夾。以織夢網站CMS(內容管理系統)里的robots.txt為例:
根據織夢網站的CMS里的robots.txt文件可以看到,User-agent:*表示禁止所有的搜索引擎收錄本站。Disallow的意思是禁止抓取,/data/表示數據庫,/dede/表示織夢默認的后臺登錄地址,/images/表示圖片文件,/include/表示配置文件,/plus/表示附加文件,/special/表示專題目錄,/templets/表示模板靜態文件,/uploads/表示上傳文件。最后的Sitemap是網站地圖,是告訴百度蜘蛛這是網站的運行軌跡。

以上是織夢網站CMS里的robots文件,每個程序都會有對應的robots文件,我們只需要根據不同的開源程序提供的robots文
件,我們只需要根據不同的開源程序提供的robots文件進行添加即可。

3.robots在網站中的展現形式

當SEO工作者需要在網站中展現robots文件的時候,可以根據自己的代碼知識,或者通過網站程序員的幫助,進行一些必要的代碼添加。而常用的代碼則是<META NAME="ROBOTS"CONTENT="INDEX,FOLLOW">

·META:HTML網站中一個最重要的標簽,通常可以展現網站的關鍵詞和網站描述等;

·NAME="ROBOTS":識別所有搜索引擎;

·CONTENT="INDEX,FOLLOW":搜索引擎索引該頁,并可以通過網頁的鏈接搜索其他頁面。

4.小結

一個優秀的網站都會存在robots文件,這個文件往往能幫助我們規避一些不必要的文件被展現出來。做SEO最重要的任務是展現我們的首頁、欄目頁及最重要的文章頁。只有當這些頁面優化得足夠好的時候,我們的網站才是一個優秀的網站。

點瑞科技,為SEO而生!網站建設 And 代理加盟

首頁 聯系我們 電話咨詢 短信咨詢 QQ咨詢
展開 展開 關閉

百度了 N家 網絡營銷公司不知道哪家好?哪家更實惠? 點我吧 ,點瑞科技 合作案例 ,網絡營銷認準點瑞品牌!

四肖中特