首頁 » 網站架設相關 » 架站教學 » [Crawler]主題16: 如何使用爬蟲功能加快網站速度

[Crawler]主題16: 如何使用爬蟲功能加快網站速度

主題:Crawler

簡介

何謂爬蟲(Crawler)?

遊走於網站的後台裡, 然後更新頁面中已過期的快取內容. 最主要的目地是盡可能保持最新快取內容(cached), 同時盡量減少訪客接觸到無快取內容的風險.

一般訪客到來時, WordPress主機會先取得訪客的要求, 存取資料庫內容, 然後送出當下頁面內容到訪客的瀏覽器中, 當同一時間訪客過多時, 就容易造成Server端的負擔, 進而影響網站的效能, 速度就會變慢!

而Crawler就直接利用System cron的觸發時間去爬取整個網站的內容, 然後儲存於cached, 這樣子訪客來時, 就能直接從cached中下載內容, 就不容易影響Server的運作了, 網站速度就會變快了!

Crawler的設定也很重要, 若是使用太頻繁或同時過多爬蟲使用, 反而會造成網站的效能減低.

另外, Crawler的功能開啟是需要透過主機商的管理員來處理! 也曾詢過管理員, Crawler的功能是否會影響網站中的廣告輪播或CDN, 答案是不會!

啟用Crawler

此Crawler功能是搭配LiteSpeed Cache plugin下使用的, 目前版本是5.3.1! 在WP後台左側功能表裡可以找到LiteSpeed Cache\檢索程式.

在主機商的管理員已啟用此功能之後, 可以利用此外掛[General Settings]\檢索程式, 設定ON/OFF.

這裡補充一下, 主機商的管理員是在Server端中加入Crawler的功能配置, 而WP後台裡, 只是讓Crawler活動(啟用或關閉), 即使設定關閉, 此Crawler功能依然存在於主機內, 但它並不會有任何影響.

Crawler功能設置

針對Crawler的使用方式, 主要依據網站的活動情形, 官方建議以預設為主, 適用於大多數網站, 這裡只修改Crawl Interval的時間, 預設是3.5天會啟用一次Crawler, 修改成7天(604800).

輸入網站的Sitemap路徑, 這裡需要提供XML格式的sitemap, 否則Crawler是不會去爬取網站的內容.

Crawler功能畫面簡介

在Summary頁面下, 可以看到目前Crawler的相關資訊, 包括:啟用時間, 上次完成時間等等.

這裡是預設就加入8個Cron Name, 其中Status區中, 有四種不同顏色區塊, 意義各代表如下:

灰色: 等待Crawler

綠色:已經產生Cached

藍色:已經成功Crawled,但還未存到Cached

紅色:封鎖項目

在Map頁面下, 可以得知網站總共有多少網址數(Sitemap Total), 如果顯示0的話, 可以按下[Refresh Crawler Map]按鈕做更新.

Crawler 活動中

在Watch Crawler Status中, 就可以看到目前Crawler的最新狀態,

總結:

透過Crawler的功能, 可以增加網站整體效能, 但需要先和主機商的管理員確認是否能使用, 而設定上也不用過多繁雜的步驟就能輕易上手!

以上僅供參考!

Share via:

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *