易购平台

  • <small id="pulgf"><video id="pulgf"></video></small>
    <tr id="pulgf"></tr>

    <tr id="pulgf"><small id="pulgf"></small></tr>
  • <tr id="pulgf"></tr>
    <ins id="pulgf"></ins>

      1. 愛運營首頁
      2. 網站優化

      解讀百度搜索引擎工作原理

      在說這個話題前,我們先了解一下搜索引擎Spider抓取系統的工作機制。
      上圖為spider抓取系統的基本框架圖,其中包括鏈接存儲系統、鏈接選取系統、dns解析服務系統、抓取調度系統、網頁分析系統、鏈接提取系統、鏈接分析系統、網頁存儲系統。Baiduspider即是通過這種系統的通力合作完成對互聯網頁面的抓取工作。
      那么百度搜索引擎是根據什么指標來確定對一個網站的抓取頻次的呢,主要指標有四個:
      ?1,網站更新頻率:更新快多來,更新慢少來,直接影響Baiduspider的來訪頻率
      ?2,網站更新質量:更新頻率提高了,僅僅是吸引了Baiduspier的注意,Baiduspider對質量是有嚴格要求的,如果網站每天更新出的大量內容都被Baiduspider判定為低質頁面,依然沒有意義。
      ?簡單介紹幾種百度支持的返回碼:
      ? ? ? ? 1)最常見的404代表“NOT FOUND”,認為網頁已經失效,通常將在庫中刪除,同時短期內如果spider再次發現這條url也不會抓??;
      ? ? ? ? 2503代表“Service Unavailable”,認為網頁臨時不可訪問,通常網站臨時關閉,帶寬有限等會產生這種情況。對于網頁返回503狀態碼,百度spider不會把這條url直接刪除,同時短期內將會反復訪問幾次,如果網頁已恢復,則正常抓??;如果繼續返回503,那么這條url仍會被認為是失效鏈接,從庫中刪除。
      ? ? ? ? 3403代表“Forbidden”,認為網頁目前禁止訪問。如果是新url,spider暫時不抓取,短期內同樣會反復訪問幾次;如果是已收錄url,不會直接刪除,短期內同樣反復訪問幾次。如果網頁正常訪問,則正常抓??;如果仍然禁止訪問,那么這條url也會被認為是失效鏈接,從庫中刪除。
      ? ? ? ? 4301代表是“Moved Permanently”,認為網頁重定向至新url。當遇到站點遷移、域名更換、站點改版的情況時,我們推薦使用301返回碼,同時使用站長平臺網站改版工具,以減少改版對網站流量造成的損失。

      ?3,連通度:網站應該安全穩定、對Baiduspider保持暢通,經常給Baiduspider吃閉門羹可不是好事情
      ?4,站點評價:百度搜索引擎對每個站點都會有一個評價,且這個評價會根據站點情況不斷變化,是百度搜索引擎對站點的一個基礎打分(絕非外界所說的百度權重),是百度內部一個非常機密的數據。站點評級從不獨立使用,會配合其它因子和閾值一起共同影響對網站的抓取和排序。

      理論上,Baiduspider會將新頁面上所有能“看到”的鏈接都抓取回來,那么面對眾多新鏈接,Baiduspider根據什么判斷哪個更重要呢?兩方面:

      第一,對用戶的價值:
      1
      ,內容獨特,百度搜索引擎喜歡唯一的內容
      2
      ,主體突出,切不要出現網頁主體內容不突出而被搜索引擎誤判為空短頁面不抓取
      3
      ,內容豐富
      4
      ,廣告適當

      第二,鏈接重要程度:
      1
      ,目錄層級——淺層優先
      2
      ,鏈接在站內的受歡迎程度

      ☆☆☆☆☆☆搜索引擎的索引庫是分層級的,優質的網頁會被分配到重要索引庫,普通網頁會待在普通庫,再差一些的網頁會被分配到低級庫去當補充材料。目前60%的檢索需求只調用重要索引庫即可滿足,這也就解釋了為什么有些網站的收錄量超高流量卻一直不理想。

      那么,哪些網頁可以進入優質索引庫呢。其實總的原則就是一個:對用戶的價值。包括卻不僅于:
      1,有時效性且有價值的頁面:在這里,時效性和價值是并列關系,缺一不可。有些站點為了產生時效性內容頁面做了大量采集工作,產生了一堆無價值面頁,也是百度不愿看到的.
      2,內容優質的專題頁面:專題頁面的內容不一定完全是原創的,即可以很好地把各方內容整合在一起,或者增加一些新鮮的內容,比如觀點和評論,給用戶更豐富全面的內容。
      3,高價值原創內容頁面:百度把原創定義為花費一定成本、大量經驗積累提取后形成的文章。千萬不要再問我們偽原創是不是原創。
      4,重要個人頁面:這里僅舉一個例子,科比在新浪微博開戶了,即使他不經常更新,但對于百度來說,它仍然是一個極重要的頁面。

      搜索引擎抓取排序機制(下圖)
      解讀百度搜索引擎工作原理
      解讀百度搜索引擎工作原理
      簡單來說這個流程圖:網站生成頁面,搜索引擎蜘蛛抓取后存儲到數據庫里面(對應開頭的那個流程圖),程序對這個頁面進行分析,利用切詞分詞技術建立外部索引。

      用戶輸入關鍵詞進行檢索,百度搜索引擎在排序環節要做兩方面的事情,第一是把相關的網頁從索引庫中提取出來,第二是把提取出來的網頁按照不同維度的得分進行綜合排序?!安煌S度”包括:
      ? ? ? ? 1,相關性:網頁內容與用戶檢索需求的匹配程度,比如網頁包含的用戶檢查關鍵詞的個數,以及這些關鍵詞出現的位置;外部網頁指向該頁面所用的錨文本等
      ? ? ? ? 2,權威性:用戶喜歡有一定權威性網站提供的內容,相應的,百度搜索引擎也更相信優質權威站點提供的內容。
      ? ? ? ? 3,時效性:時效性結果指的是新出現的網頁,且網頁內承載了新鮮的內容。目前時效性結果在搜索引擎中日趨重要。
      ? ? ? ? 4,重要性:網頁內容與用戶檢查需求匹配的重要程度或受歡迎程度
      ? ? ? ? 5,豐富度:豐富度看似簡單卻是一個覆蓋范圍非常廣的命題??梢岳斫鉃榫W頁內容豐富,可以完全滿足用戶需求;不僅可以滿足用戶單一需求,還可以滿足用戶的延展需求。
      ? ? ? ? 6,受歡迎程度:指該網頁是不是受歡迎。

      以上便是百度搜索引擎決定搜索結果排序時考慮的六大原則,那么六大原則的側重點是怎樣的呢?哪個原則在實際應用時占比最大呢?其實在這里沒有一個確切的答案。在百度搜索引擎早期,這些閾值的確是相對固定的,比如“相關性”在整體排序中的重量可以占到七成。但隨著互聯網的不斷發展,檢索技術的進步,網頁數量的爆發式增長,相關性已經不是難題。于是百度搜索引擎引入了機器學習機制,讓程序自動產出計算公式,推進排序策略更加合理。

      外部鏈接的作用:

      1,?吸引蜘蛛抓?。弘m然百度在挖掘新好站點方面下了很大工夫,開放了多個數據提交入口,開避了社會化發現渠道,但超鏈依然是發現收錄鏈接的最重要入口。

      2,?向搜索引擎傳遞相關性信息:百度除了通過TITLE、頁面關鍵詞、H標簽等對網頁內容進行判斷外,還會通過錨文本進行鋪助判斷。使用圖片作為點擊入口的超鏈,也可以通過alt屬性和title標簽向百度傳情達意。

      3,?提升排名:百度搜索引擎雖然降低了對超鏈的依賴,但對超鏈的識別力度從未下降,制定出更加嚴格的優質鏈接、正常鏈接、垃圾鏈接和作弊鏈接標準。對于作弊鏈接,除了對鏈接進行過濾清理外,也對鏈接的受益站進行一定程度的懲罰。相應的,對優質鏈接,百度依然持歡迎的態度。

      4,?內容分享,獲取口碑:優質內容被廣泛傳播,網站借此獲得的流量可能并不多,但如果內容做得足夠,也可以樹立自己的品牌效應。

      本文內容來源:百度站長學院

      去年今日運營文章

      1. 2019:  這項職場必備技能,為什么只有1%的人能靠它月入過萬?(2)
      2. 2019:  三流的企業做品牌,一流的企業做內容(0)
      3. 2018:  B2B市場人,你的核心競爭力究竟在哪里?(0)
      4. 2018:  如何建立一個自媒體完美矩陣,打造最強運營渠道(0)
      5. 2018:  如何讓運營崗位的工作不可替代?你需要建立自己的個人品牌(0)

      原創文章,作者:愛運營,如若轉載,請注明出處:http://www.fawz8.com/seo/13778.html

      發表評論

      登錄后才能評論

      聯系我們

      187-1891-2971

      在線咨詢:點擊這里給我發消息

      郵件:admin@iyunying.org

      工作時間:周一至周五,9:30-18:30,節假日休息

      QR code
      宿松| 天门| 紫荆关| 察哈尔右翼中旗| 白水| 三水| 弥渡| 稻城| 长寿| 平鲁| 安龙| 沅陵| 揭西| 临潭| 乌恰| 灯塔| 昌邑| 清水河| 平舆| 大佘太| 霍城| 东乌珠穆沁旗| 昆明| 中环| 昌乐| 长治| 永靖| 定海| 定海| 茶陵| 安德河| 漯河| 彭州| 衡东| 张家港| 沙塘| 全南| 云霄| 白云| 杭锦后旗| 侯马| 都安| 普洱| 麟游| 献县| 勐腊| 勉县| 仙居| 那曲| 察哈尔右翼中旗| 文昌| 万安| 番禺| 丹东| 阳新| 丰县| 于都| 巴东| 阆中| 伊川| 东丰| 秀山| 合阳| 横县| 兖州| 邵阳县| 安康| 襄城| 邵阳县| 宽甸| 井陉| 理塘| 新昌| 永登| 宁陕| 中牟| 扶沟| 突泉| 温江| 乌拉特后旗| 合水| 定远| 三门| 浦江| 余杭| 高力板| 乐业| 平乡| 四子王旗| 贵德| 和龙| 榆中| 普定| 天池| 罗甸| 青浦| 宁强| 定陶| 察哈尔右翼后旗| 德阳| 闻喜| 辰溪| 巴里坤| 石阡| 肇东| 宁化| 开平| 朝阳| 呼伦贝尔| 阳高| 弋阳| 监利| 壤塘| 棠荫| 丰润| 宁南| 北塔山| 马鞍山| 白城| 崇礼| 孝感| 大勐龙| 五常| 儋州| 漯河| 马边| 平和| 碌曲| 玛多| 盘县| 阳谷| 安图| 莱西| 香格里拉| 卢龙| 霍山| 宁远| 腾冲| 祥云| 日喀则| 鄂尔多斯| 湄潭| 米林| 新沂| 临沂| 浦东| 霞浦| 什邡| 罗山| 湛江| 海渊| 浩尔吐| 鹤峰| 郎溪| 老河口| 桂东| 万安| 肥城| 安阳| 奈曼旗| 龙胜| 莘县| 夏津| 望谟| 通辽钱家店| 汾西| 宿迁| 崇礼| 巴彦诺尔贡| 霸州| 樟树| 瑞金| 新乡| 保靖| 民和| 泸溪| 富川| 丹凤| 武城| 江都| 漳浦| 镇巴| 浦江| 屯溪| 高碑店| 乳源| 天台| 福贡| 平舆| 阳山| 浪卡子| 徐水| 黄泛区| 汉中| 大通| 忻城| 东安| 义县| 息烽| 乳源| 华蓥山| 涠洲岛| 湟中| 兴隆| 中宁| 沁水| 若尔盖| 横县| 榆社| 蒙阴| 安义| 湖州| 沐川| 无为| 紫云| 乌鲁木齐牧试站| 会同| 牙克石| 吉水| 海西| 兰坪| 唐海| 勉县| 通山| 黄南| 麻黄山| 晋宁| 贵港| 黄泛区| 巴彦| 如东| 丹凤| 江都| 吴起| 明溪| 南和| 富平| 三峡| 大通| 桃江| 宝丰| 湖州| 平潭| 宣城| 柏乡| 赤峰| 红安| 岚皋| 海口| 永登| 兰溪| 大连| 崇礼| 宝应| 正宁| 长阳| 高唐| 武夷山| 崇明| 硕龙| 夹江| 牟平| 舒城| 本溪| 封丘| 长春| 白河| 东至| 化州| 汶上| 庐山| 斋堂| 扶余| 紫云| 黄平旧洲| 连山| 上杭| 科尔沁右翼中旗| 吕梁| 长丰| 岚皋| 罗山| 贺州| 徐水| 绥滨| 香港| 大兴安岭| 武夷山| 璧山| 滁州| 杭州| 阿巴嘎旗| 沂南| 阿克陶| 贺州| 马站| 虞城| 宣威| 尼勒克| 元江| 平江| 芜湖| 霍城| 朔州| 兰坪| 秀山| 太平| 小金| 长汀| 玉山| 沁水| 合浦| 辉县| 八里罕| 淮滨| 会泽| 都兰| 香港| 宁安| 漳平| 崇信| 武义| 苏家屯| 易县| 旌德| 潮连岛| 淇县| 南乐| 资中| 株洲县| 大城| 嵩明| 孝感| 比如| 兴城| 宣城| 抚宁| 大柴旦| 三原| 新竹市| 新密| 汶川| 蒙山| 板栏| 泾阳| 阿拉善右旗| 烟筒山| 咸宁| 康保| 洪雅| 新余| 化隆| 安宁| 沁城| 将乐| 沧州| 前郭| 安国| 托勒| 柳林| 大厂| 柞水| 密云| 雅江| 铜陵| 泸定| 汉阴| 新化| 柯坪| 岱山| 乐昌| 尼勒克| 纳溪| 炉山| 翁源| 沛县| 青岛| 大荔| 大姚| 莫索湾| 小渠子| 绥中| 郸城| 资源| 临潭| 阜南| 吴川| 台安| 东川| 鹰潭| 兴和| 台北县| 穆棱| 自贡| 广汉| 郧县| 磁县| 舞阳| 固阳| 原阳