搜索引擎的原理是什么 搜索引擎的原理是什么意思


搜索引擎的原理是什么 搜索引擎的原理是什么意思

文章插圖
大家好,小跳來為大家解答以上的問題 。搜索引擎的原理是什么意思,搜索引擎的原理是什么這個很多人還不知道,現在讓我們一起來看看吧!
【搜索引擎的原理是什么 搜索引擎的原理是什么意思】1、搜索引擎的基本工作原理包括如下三個過程:首先在互聯網中發現、搜集網頁信息;同時對信息進行提取和組織建立索引庫;再由檢索器根據用戶輸入的查詢關鍵字 , 在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,并將查詢結果返回給用戶 。
2、抓取網頁 。
3、每個獨立的搜索引擎都有自己的網頁抓取程序爬蟲(spider) 。
4、爬蟲Spider順著網頁中的超鏈接,從這個網站爬到另一個網站 , 通過超鏈接分析連續訪問抓取更多網頁 。
5、被抓取的網頁被稱之為網頁快照 。
6、由于互聯網中超鏈接的應用很普遍,理論上,從一定范圍的網頁出發,就能搜集到絕大多數的網頁 。
7、2、處理網頁 。
8、搜索引擎抓到網頁后,還要做大量的預處理工作,才能提供檢索服務 。
9、其中,最重要的就是提取關鍵詞,建立索引庫和索引 。
10、其他還包括去除重復網頁、分詞(中文)、判斷網頁類型、分析超鏈接、計算網頁的重要度/豐富度等 。
11、3、提供檢索服務 。
12、用戶輸入關鍵詞進行檢索,搜索引擎從索引數據庫中找到匹配該關鍵詞的網頁;為了用戶便于判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息 。
本文到此分享完畢,希望對大家有所幫助 。