立即注冊 找回密碼

QQ登錄

只需一步,快速開始

查看: 5116|回復: 0
打印 上一主題 下一主題

[Discuz 通用教程] 禁止搜索引擎收錄網(wǎng)站內(nèi)容的幾種方法-如何讓網(wǎng)站不收錄任何內(nèi)容

[復制鏈接]

111

主題

16

回帖

1819

積分

大學四年級

Rank: 6Rank: 6

積分
1819
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2018-7-6 19:31:24 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
道勤網(wǎng)-數(shù)據(jù)bmrsportswear.com

親注冊登錄道勤網(wǎng)-可以查看更多帖子內(nèi)容哦。ò蕡D片、文字詳情等)請您及時注冊登錄-bmrsportswear.com

您需要 登錄 才可以下載或查看,沒有賬號?立即注冊

x
第一種、robots.txt方法
搜索引擎默認的遵守robots.txt協(xié)議,創(chuàng)建robots.txt文本文件放至網(wǎng)站根目錄下,編輯代碼如下:
User-agent: *
Disallow: /
通過以上代碼,即可告訴搜索引擎不要抓取采取收錄本網(wǎng)站,注意慎用如上代碼:這將禁止所有搜索引擎訪問網(wǎng)站的任何部分。
如何只禁止百度搜索引擎收錄抓取網(wǎng)頁
1、編輯robots.txt文件,設計標記為:
User-agent: Baiduspider
Disallow: /
以上robots文件將實現(xiàn)禁止所有來自百度的抓取。
這里說一下百度的user-agent,Baiduspider的user-agent是什么?
百度各個產(chǎn)品使用不同的user-agent:
產(chǎn)品名稱 對應user-agent
無線搜索 Baiduspider
圖片搜索 Baiduspider-image
視頻搜索 Baiduspider-video
新聞搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度聯(lián)盟 Baiduspider-cpro
商務搜索 Baiduspider-ads
網(wǎng)頁以及其他搜索 Baiduspider
你可以根據(jù)各產(chǎn)品不同的user-agent設置不同的抓取規(guī)則,以下robots實現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:
User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/
請注意:Baiduspider-cpro和Baiduspider-ads抓取的網(wǎng)頁并不會建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議,這個就需要和百度的人聯(lián)系才能解決了。
如何只禁止Google搜索引擎收錄抓取網(wǎng)頁,方法如下:
編輯robots.txt文件,設計標記為:
User-agent: googlebot
Disallow: /
編輯robots.txt文件
搜索引擎默認的遵守robots.txt協(xié)議
robots.txt文件放在網(wǎng)站根目錄下。
舉例來說,當搜索引擎訪問一個網(wǎng)站時,首先會檢查該網(wǎng)站根目錄中是否存在robots.txt這個文件,如果搜索引擎找到這個文件,它就會根據(jù)這個文件里的內(nèi)容,來確定它抓取的權限的范圍。
User-agent:
該項的值用于描述搜索引擎robot的名字,在”robots.txt”文件中,如果有多條User-agent記錄說明有多個robot會受到該協(xié)議的限制,對該文件來說,至少要有一條User-agent記錄。如果該項的值設為*,則該協(xié)議對任何機器人均有效,在”robots.txt”文件中,”User-agent:*”這樣的記錄只能有一條。
Disallow:
該項的值用于描述不希望被訪問到的一個URL,這個URL可以是一條完整的路徑,也可以是部分的,任何以Disallow開頭的URL均不會被robot訪問到。例如”Disallow:/help”對/help.html 和/help/index.html都不允許搜索引擎訪問,而”Disallow:/help/”則允許robot訪問/help.html,而不能訪問/help/index.html。任何一條Disallow記錄為空,說明該網(wǎng)站的所有部分都允許被訪問,在”/robots.txt”文件中,至少要有一條Disallow記錄。如果”/robots.txt”是一個空文件,則對于所有的搜索引擎robot,該網(wǎng)站都是開放的。

下面舉幾個robots.txt用法的例子:
User-agent: *
Disallow: /
禁止所有搜索引擎訪問網(wǎng)站的所有部分
User-agent: Baiduspider
Disallow: /
禁止百度收錄全站
User-agent: Googlebot
Disallow: /
禁止Google收錄全站
User-agent: Googlebot
Disallow:
User-agent: *
Disallow: /
禁止除Google外的一切搜索引擎收錄全站
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
禁止除百度外的一切搜索引擎收錄全站
User-agent: *
Disallow: /css/
Disallow: /admin/
禁止所有搜索引擎訪問某個目錄
(例如禁止根目錄下的admin和css)
第二種、網(wǎng)頁代碼方法

在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="robots" content="noarchive">代碼,此標記禁止搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="Baiduspider" content="noarchive">即可禁止百度搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="googlebot" content="noarchive">即可禁止谷歌搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
另外當我們的需求很怪異的時候,比如下面這幾種情況:
1. 網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來?
因為搜索引擎索引數(shù)據(jù)庫的更新需要時間。雖然Baiduspider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁,但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息,可能需要數(shù)月時間才會清除。另外也請檢查您的robots配置是否正確。如果您的拒絕被收錄需求非常急迫,也可以通過投訴平臺反饋請求處理。
2. 希望網(wǎng)站內(nèi)容被百度索引但不被保存快照,我該怎么做?
Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁meta的設置,使百度顯示只對該網(wǎng)頁建索引,但并不在搜索結果中顯示該網(wǎng)頁的快照。和robots的更新一樣,因為搜索引擎索引數(shù)據(jù)庫的更新需要時間,所以雖然您已經(jīng)在網(wǎng)頁中通過meta禁止了百度在搜索結果中顯示該網(wǎng)頁的快照,但百度搜索引擎數(shù)據(jù)庫中如果已經(jīng)建立了網(wǎng)頁索引信息,可能需要二至四周才會在線上生效。
希望被百度索引,但是不保存網(wǎng)站快照,如下代碼解決:
<meta name="Baiduspider" content="noarchive">
如果要禁止所有的搜索引擎保存你網(wǎng)頁的快照,那么代碼就是下面的:
<meta name="robots" content="noarchive">
常用的一些代碼組合:
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本頁,而且可以順著本頁繼續(xù)索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不許抓取本頁,但是可以順著本頁抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本頁,但是不許順著本頁抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁,也不許順著本頁抓取索引別的鏈接

道勤主機提供365天*24小時全年全天無休、實時在線、零等待的售后技術支持。竭力為您免費處理您在使用道勤主機過程中所遇到的一切問題! 如果您是道勤主機用戶,那么您可以通過QQ【792472177】、售后QQ【59133755】、旺旺【詮釋意念】、微信:q792472177免費電話、后臺提交工單這些方式聯(lián)系道勤主機客服! 如果您不是我們的客戶也沒問題,點擊頁面最右邊的企業(yè)QQ在線咨詢圖標聯(lián)系我們并購買后,我們?yōu)槟赓M進行無縫搬家服務,讓您享受網(wǎng)站零訪問延遲的遷移到道勤主機的服務!
本內(nèi)容系 道勤團隊 bmrsportswear.com 客服與技術人員研究整理的智慧結晶,轉(zhuǎn)載勿用于商業(yè)用途,并保留本文鏈接,侵權必究!
dsu_marcocopyright:copy_link 

【道勤網(wǎng)】- bmrsportswear.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網(wǎng)站設計教程!【道勤網(wǎng)】 - 論壇版權1、本主題所有言論和圖片純屬會員個人意見,與本論壇立場無關
2、本站所有主題由該帖子作者發(fā)表,該帖子作者與【道勤網(wǎng)】- bmrsportswear.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網(wǎng)站設計教程!【道勤網(wǎng)】享有帖子相關版權
3、其他單位或個人使用、轉(zhuǎn)載或引用本文時必須同時征得該帖子作者和【道勤網(wǎng)】- bmrsportswear.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網(wǎng)站設計教程!【道勤網(wǎng)】的同意
4、帖子作者須承擔一切因本文發(fā)表而直接或間接導致的民事或刑事法律責任
5、本帖部分內(nèi)容轉(zhuǎn)載自其它媒體,但并不代表本站贊同其觀點和對其真實性負責
6、如本帖侵犯到任何版權問題,請立即告知本站,本站將及時予與刪除并致以最深的歉意
7、【道勤網(wǎng)】- bmrsportswear.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網(wǎng)站設計教程!【道勤網(wǎng)】管理員和版主有權不事先通知發(fā)貼者而刪除本文

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

關閉

道勤網(wǎng)- 推薦內(nèi)容!上一條 /2 下一條

!jz_fbzt! !jz_sgzt! !jz_xgzt! 快速回復 !jz_fhlb! !jz_lxwm! !jz_gfqqq!

關于我們|手機版|小黑屋|地圖|【道勤網(wǎng)】-bmrsportswear.com 軟件視頻自學教程|免費教程|自學電腦|3D教程|平面教程|影視動畫教程|辦公教程|機械設計教程|網(wǎng)站設計教程【道勤網(wǎng)】 ( 皖ICP備15000319號-1 )

GMT+8, 2024-10-23 09:34

Powered by DaoQin! X3.4 © 2016-2063 Dao Qin & 道勤科技

快速回復 返回頂部 返回列表