搜尋引擎的工作方式(搜尋引擎是用來做什麼的)

搜尋引擎的工作過程大體分為四個步驟:爬行和抓取、建立索引、搜尋詞處理、展示排名,人們日常使用搜尋引擎查詢資料的過程只是搜尋引擎工作過程中的一個環節。

首先,搜尋引擎會向全球資訊網派出一個能夠發現新網頁並抓取網頁檔案的程式,這個程式通常被稱為蜘蛛(Spider)。其在工作的時候從網站的某一個頁面開始,讀取網頁的內容,找到在網頁中的其它連結地址,然後通過這些連結地址尋找下一個網頁,這樣一直迴圈下去,直到把這個網站所有的頁面都抓取完為止。如果把整個網際網路當做一張大網,那麼這個程式就像是蜘蛛一樣抓取所有的網頁內容。

在蜘蛛程式抓取了網頁檔案之後,通過對網頁內容的分析和處理,對網頁資訊進行提取並組織建立索引庫,即建立一定的搜尋原則,也就是說當使用者查詢某一關鍵詞時,搜尋引擎能根據關鍵詞在資料庫中進行查詢和搜尋,找到相應的位置。

當搜尋引擎對網路資料建立了資料庫之後,接下來就是使用者使用階段了,當使用者在搜尋欄輸入搜尋詞,單擊“搜尋”按鈕後,搜尋引擎即對輸入的搜尋詞進行處理,以提取出相應的關鍵詞,通過關鍵詞在資料庫中進行索引和查詢,實際的應用中,搜尋詞的處理是十分快速的。

當搜尋引擎根據搜尋詞找到相關的網頁之後,接下來就遇到了一個問題,究竟把哪一個網頁的連結呈現在前面,哪些連結放在後面呢?這就涉及到搜尋引擎工作的最後一步──展示排名。在眾多網頁中,搜尋引擎會根據演算法計算得出,一個網站所提供資訊的有效性,原創性和資訊的認可度等指標,結合網站自身權重等綜合演算法給出相應的排名顯示,同樣的,會將一些質量較低的垃圾網站進行過濾,以提高使用者檢索的有效性。

(武清區科學技術協會)