搜索引擎分幾種可分為三種 搜索引擎分類搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(Full Text Search Engine)、目錄索引類搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine) 。全文搜索引擎全文搜索引擎是名副其實的搜索引擎,國外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,國內著名的有百度(Baidu) 。它們都是通過從互聯網上提取的各個網站的信息(以網頁文字為主)而建立的數據庫中,檢索與用戶查詢條件匹配的相關記錄,然后按一定的排列順序將結果返回給用戶,因此他們是真正的搜索引擎 。從搜索結果來源的角度,全文搜索引擎又可細分為兩種,一種是擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,并自建網頁數據庫,搜索結果直接從自身的數據庫中調用,如上面提到的7家引擎;另一種則是租用其他引擎的數據庫,并按自定的格式排列搜索結果,如Lycos引擎 。目錄索引目錄索引雖然有搜索功能,但在嚴格意義上算不上是真正的搜索引擎,僅僅是按目錄分類的網站鏈接列表而已 。用戶完全可以不用進行關鍵詞(Keywords)查詢,僅靠分類目錄也可找到需要的信息 。目錄索引中最具代表性的莫過于大名鼎鼎的Yahoo雅虎 。其他著名的還有Open Directory Project(DMOZ)、LookSmart、About等 。國內的搜狐、新浪、網易搜索也都屬于這一類 。元搜索引擎(META Search Engine) 元搜索引擎在接受用戶查詢請求時,同時在其他多個引擎上進行搜索,并將結果返回給用戶 。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎 。在搜索結果排列方面,有的直接按來源引擎排列搜索結果,如Dogpile,有的則按自定的規則將結果重新排列組合,如Vivisimo 。除上述三大類引擎外,還有以下幾種非主流形式: 集合式搜索引擎:如HotBot在2002年底推出的引擎 。該引擎類似META搜索引擎,但區別在于不是同時調用多個引擎進行搜索,而是由用戶從提供的4個引擎當中選擇,因此叫它“集合式”搜索引擎更確切些 。門戶搜索引擎:如AOL Search、MSN Search等雖然提供搜索服務,但自身即沒有分類目錄也沒有網頁數據庫,其搜索結果完全來自其他引擎 。免費鏈接列表(Free For All Links,簡稱FFA):這類網站一般只簡單地滾動排列鏈接條目,少部分有簡單的分類目錄,不過規模比起Yahoo等目錄索引來要小得多 。由于上述網站都為用戶提供搜索查詢服務,為方便起見,我們通常將其統稱為搜索引擎 。搜索引擎基本工作原理了解搜索引擎的工作原理對我們日常搜索應用和網站提交推廣都會有很大幫助 。全文搜索引擎在搜索引擎分類部分我們提到過全文搜索引擎從網站提取信息建立網頁數據庫的概念 。搜索引擎的自動信息搜集功能分兩種 。一種是定期搜索,即每隔一段時間(比如Google一般是28天),搜索引擎主動派出“蜘蛛”程序,對一定IP地址范圍內的互聯網站進行檢索,一旦發現新的網站,它會自動提取網站的信息和網址加入自己的數據庫 。另一種是提交網站搜索,即網站擁有者主動向搜索引擎提交網址,它在一定時間內(2天到數月不等)定向向你的網站派出“蜘蛛”程序,掃描你的網站并將有關信息存入數據庫,以備用戶查詢 。由于近年來搜索引擎索引規則發生了很大變化,主動提交網址并不保證你的網站能進入搜索引擎數據庫,因此目前最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多機會找到你并自動將你的網站收錄 。當用戶以關鍵詞查找信息時,搜索引擎會在數據庫中進行搜尋,如果找到與用戶要求內容相符的網站,便采用特殊的算法——通常根據網頁中關鍵詞的匹配程度,出現的位置/頻次,鏈接質量等——計算出各網頁的相關度及排名等級,然后根據關聯度高低,按順序將這些網頁鏈接返回給用戶 。目錄索引 與全文搜索引擎相比,目錄索引有許多不同之處 。首先,搜索引擎屬于自動網站檢索,而目錄索引則完全依賴手工操作 。用戶提交網站后,目錄編輯人員會親自瀏覽你的網站,然后根據一套自定的評判標準甚至編輯人員的主觀印象,決定是否接納你的網站 。其次,搜索引擎收錄網站時,只要網站本身沒有違反有關的規則,一般都能登錄成功 。而目錄索引對網站的要求則高得多,有時即使登錄多次也不一定成功 。尤其象Yahoo!這樣的超級索引,登錄更是困難 。(由于登錄Yahoo!的難度最大,而它又是商家網絡營銷必爭之地,所以我們會在后面用專門的篇幅介紹登錄Yahoo雅虎的技巧) 此外,在登錄搜索引擎時,我們一般不用考慮網站的分類問題,而登錄目錄索引時則必須將網站放在一個最合適的目錄(Directory) 。最后,搜索引擎中各網站的有關信息都是從用戶網頁中自動提取的,所以用戶的角度看,我們擁有更多的自主權;而目錄索引則要求必須手工另外填寫網站信息,而且還有各種各樣的限制 。更有甚者,如果工作人員認為你提交網站的目錄、網站信息不合適,他可以隨時對其進行調整,當然事先是不會和你商量的 。目錄索引,顧名思義就是將網站分門別類地存放在相應的目錄中,因此用戶在查詢信息時,可選擇關鍵詞搜索,也可按分類目錄逐層查找 。如以關鍵詞搜索,返回的結果跟搜索引擎一樣,也是根據信息關聯程度排列網站,只不過其中人為因素要多一些 。如果按分層目錄查找,某一目錄中網站的排名則是由標題字母的先后順序決定(也有例外) 。目前,搜索引擎與目錄索引有相互融合滲透的趨勢 。原來一些純粹的全文搜索引擎現在也提供目錄搜索,如Google就借用Open Directory目錄提供分類查詢 。而象 Yahoo! 這些老牌目錄索引則通過與Google等搜索引擎合作擴大搜索范圍 。在默認搜索模式下,一些目錄類搜索引擎首先返回的是自己目錄中匹配的網站,如國內搜狐、新浪、網易等;而另外一些則默認的是網頁搜索,如Yahoo 。搜索引擎的第三定律搜索引擎走到今天,已經是一個結束過去,開辟未來的時候了 。為了說清楚我所講的第三定律,我們先來回顧一下第一和第二定律 。第一定律 相關性定律聽起來象是一篇學術論文,的確,就連第一,第二定律的提法以前也沒有過,但是第一,第二定律的內容確早已在業界和學術界得到了公認 。其實這第一定律是早在互聯網出現之前就被學術界廣泛研究過的,那就是所謂的相關性定律 。這個領域那時叫情報檢索,或信息檢索,也有叫全文檢索的 。那時的相關性都是基于詞頻統計的,也就是說,當用戶輸入檢索詞時,搜索引擎去找那些檢索詞在文章(網頁)中出現頻率較高的,位置較重要的,再加上一些對檢索詞本身常用程度的加權,最后排出一個結果來(檢索結果頁面)。早期的搜索引擎結果排序都是基于本文的第一定律的,如Infoseek,Excite,Lycos等,它們基本上是沿用了網絡時代之前學術界的研究成果,工業界的主要精力放在處理大訪問量和大數據量上,對相關性排序沒有突破 。詞頻統計其實根本沒有利用任何跟網絡有關的特性,是前網絡時代的技術 。然而,網絡時代的主要文獻是以網頁的形式存在的,而幾乎每個人都可以隨心所欲地在網上發表各種內容,詞頻相同的兩個網頁,質量相差可以很遠,可是按照搜索引擎的第一定律,對這兩個網頁的排序應該是一樣的 。為了能夠派在某些檢索結果的前幾位,許多網頁內容的制作者絞盡腦汁,在其頁面上堆砌關鍵詞,搜索引擎對此防不勝防,苦不堪言 。這種情況到了 1996年開始有了改變 。第二定律 人氣質量定律 1996年4月,我到賭城拉斯維加斯開一個有關信息檢索方面的學術會議,會議的內容就象拉斯維加斯的天氣一樣,照例比較枯燥乏味 。但遠離公司的我,卻難得有一個靜下心來認真思考問題的機會 。就在聽一個毫不相干的論文演講的時候,我突然把科學引文索引的機制跟Web上的超級鏈接聯系起來了 - 感謝北大,她在我上大三的時候就教授了我科學引文索引的機制,美國恐怕沒有一所大學會在你本科的時候教這玩藝兒 ??茖W引文索引的機制,說白了就是誰的論文被引用次數多,誰就被認為是權威,論文就是好論文 。這個思路移植到網上就是誰的網頁被鏈接次數多,那個網頁就被認為是質量高,人氣旺 。在加上相應的鏈接文字分析,就可以用在搜索結果的排序上了 。這就引出了搜索引擎的第二定律:人氣質量定律 。根據這一定律,搜索結果的相關性排序,并不完全依賴于詞頻統計,而是更多地依賴于超鏈分析 。我意識到這是一個突破性的東西,回去以后就很快總結了思路,于96年6月申請了這一方面的美國專利 。1999年 7月6號,美國專利和商標局批準了專利號為5,920,859的,以我為唯一發明人的專利 。大約在96年底,斯坦福大學計算機系的兩位研究生也想到了同樣的解決方法,他們后來創立了一個叫Google的搜索引擎,Google的網站上至今仍然說他們的這項技術是Patent-pending (專利申請中) ,不知道美國專利局是不是還會再批這樣的專利 。Anyway, 超鏈分析的方法98年以后逐漸被各大搜索引擎所接受,由于鏈接是網絡內容的一個根本特性,這時候的搜索引擎才開始真正利用網絡時代的檢索技術 。世事難料,2000年起網絡泡沫迅速破滅,各大搜索引擎要么遭人收購,要么推遲上市,所有使用人氣質量定律的搜索引擎公司都未能幸免 。那么,搜索引擎的出路到底在哪兒?第三定律 自信心定律 人氣質量定律解決的還是一個技術層面的問題,然而搜索引擎從誕生的那一天起,從來就不是一個純技術現像,它融合了技術,文化,市場等各個層面的因素 。解決搜索引擎公司的生存和發展問題需要搜索引擎的第三定律--自信心定律 。1998年的時候,沒有太多的人拿一家遠在硅谷500英里以外,剛剛成立的,叫作GoTo.com(現已更名為Overture)的公司當回事兒 。它不過是買了一個搜索引擎的技術服務,然后再向那些網站的擁有者們拍賣他們網站在GoTo檢索結果中的排名,誰付的錢多,誰的網站就排在前面,而且付費是根據網民點擊該網站的情況來計算的,僅僅在搜索結果中出現并不需要付費 。這就是自信心定律的最早實踐者!根據這一定律,搜索結果的相關性排序,除了詞頻統計和超鏈分析之外,更注重的是競價拍賣 。誰對自己的網站有信心,誰就排在前面 。有信心的表現就是愿意為這個排名付錢 。需要聲明的是,自信心定律也是我自己給這一模式起的名字,以前的文獻中并沒有人這樣總結過 。今天,在網絡業一片蕭條,那斯達克風聲鶴唳的時候,GoTo卻如日中天,市值高達13億美金,收入高達雅虎總收入的35% 。反觀門戶網站,有哪一個能從它們的搜索引擎服務中賺出總收入的三分之一呢?究其原因,就是因為GoTo最早實踐了搜索引擎的自信心定律 。以前的搜索引擎都是靠CPM來收費的,而CPM是從傳統廣告業借鑒過來的,沒有考慮網絡媒體即時性,交互性,易競價的特點,而競價排名,點擊收費則是為網站擁有者直接提供銷售線索,而不是傳統意義上的廣告宣傳 。自信心定律一改過去搜索引擎靠CPM收錢的尷尬局面,開創了真正屬于互聯網的收費模式 。
什么是搜索引擎?搜索引擎是一個對互聯網信息資源進行搜索整理和分類,并儲存在網絡數據庫中供用戶查詢的系統,包括信息搜集、信息分類、用戶查詢三部分 。
工作原理
1.爬行:搜索引擎是通過一種特定規律的軟件跟蹤網頁的鏈接,從一個鏈接爬到另外一個鏈接,像蜘蛛在蜘蛛網上爬行一樣,所以被稱為“蜘蛛”也被稱為“機器人” 。搜索引擎蜘蛛的爬行是被輸入了一定的規則的,它需要遵從一些命令或文件的內容 。
2.抓取存儲:搜索引擎是通過蜘蛛跟蹤鏈接爬行到網頁,并將爬行的數據存入原始頁面數據庫 。其中的頁面數據與用戶瀏覽器得到的HTML是完全一樣的 。搜索引擎蜘蛛在抓取頁面時,也做一定的重復內容檢測,一旦遇到權重很低的網站上有大量抄襲、采集或者復制的內容,很可能就不再爬行 。
3.預處理:搜索引擎將蜘蛛抓取回來的頁面,進行各種步驟的預處理 。
搜索引擎的作用是什么?搜索引擎是一個對互聯網信息資源進行搜索整理和分類,并儲存在網絡數據庫中供用戶查詢的系統,包括信息搜集、信息分類、用戶查詢三部分 。
工作原理
1.爬行:搜索引擎是通過一種特定規律的軟件跟蹤網頁的鏈接,從一個鏈接爬到另外一個鏈接,像蜘蛛在蜘蛛網上爬行一樣,所以被稱為“蜘蛛”也被稱為“機器人” 。搜索引擎蜘蛛的爬行是被輸入了一定的規則的,它需要遵從一些命令或文件的內容 。
2.抓取存儲:搜索引擎是通過蜘蛛跟蹤鏈接爬行到網頁,并將爬行的數據存入原始頁面數據庫 。其中的頁面數據與用戶瀏覽器得到的HTML是完全一樣的 。搜索引擎蜘蛛在抓取頁面時,也做一定的重復內容檢測,一旦遇到權重很低的網站上有大量抄襲、采集或者復制的內容,很可能就不再爬行 。
3.預處理:搜索引擎將蜘蛛抓取回來的頁面,進行各種步驟的預處理 。
什么是網站搜索引擎鏈接網站搜索引擎鏈接……
應該是網站搜索引擎的連接……就是地址啦
至于網站優化應該是指網站文件目錄的優化. 現在有許多網站的整個網站基本都是放在一個文件夾內. 這樣很不方便,網站的每個欄目都應該有一個合理的文件夾,它以一方面可以讓自己的網站文件條理化,查找修改起來方便,另外一方面可以有利于搜索引擎搜索.
什么是搜索引擎搜索引擎是一個對互聯網信息資源進行搜索整理和分類,并儲存在網絡數據庫中供用戶查詢的系統,包括信息搜集、信息分類、用戶查詢三部分 。
工作原理
1.爬行:搜索引擎是通過一種特定規律的軟件跟蹤網頁的鏈接,從一個鏈接爬到另外一個鏈接,像蜘蛛在蜘蛛網上爬行一樣,所以被稱為“蜘蛛”也被稱為“機器人” 。搜索引擎蜘蛛的爬行是被輸入了一定的規則的,它需要遵從一些命令或文件的內容 。
2.抓取存儲:搜索引擎是通過蜘蛛跟蹤鏈接爬行到網頁,并將爬行的數據存入原始頁面數據庫 。其中的頁面數據與用戶瀏覽器得到的HTML是完全一樣的 。搜索引擎蜘蛛在抓取頁面時,也做一定的重復內容檢測,一旦遇到權重很低的網站上有大量抄襲、采集或者復制的內容,很可能就不再爬行 。
3.預處理:搜索引擎將蜘蛛抓取回來的頁面,進行各種步驟的預處理 。
什么是網站搜索引擎鏈接?它與網站搜索引擎有何區別?什么是網站優化?搜索引擎鏈接是在搜索引擎上通過輸入某個關健詞而查詢出來的結果列表,與這個關健詞相關連的網站鏈接 。
網站優化可以從狹義和廣義兩個方面來說明,狹義的網站優化,即搜索引擎優化,也就是讓網站設計適合搜索引擎檢索,滿足搜索引擎排名的指標,從而在搜索引擎檢索中獲得排名靠前,增強搜索引擎營銷的效果 。
廣義的網站優化所考慮的因素不僅僅是搜索引擎,也包括充分滿足用戶的需求特征、清晰的網站導航、完善的在線幫助等,在此基礎上使得網站功能和信息發揮發揮的效果 。也就是以企業網站為基礎,與網絡服務商(如搜索引擎等)、合作伙伴、顧客、供應商、銷售商等網絡營銷環境中各方面因素建立良好的關系 。
搜索引擎鏈接是搜索引擎的查詢結果的鏈接列表,網站優化總得說來是為了讓搜索引擎對網站變得更友好,使網站在搜索引擎上有一個更好的排名 。
【搜索引擎的作用是什么 鏈接搜索引擎】關于鏈接搜索引擎和的內容就分享到這兒!更多實用知識經驗,盡在 m.apearl.cn
- 一番拼音怎么寫,一番拼音怎么讀音發音
- 庖丁解牛什么意思的意思,庖丁解牛什么意思螞蟻森林
- 高鐵的時速是多少啊 高鐵時速多少
- 場的拼音字,場院的拼音
- 通過護理安全教育培訓學到了哪些內容 標準預防的概念及主要措施
- 雞蛋英語怎么讀 單詞,蛋糕英語怎么讀
- abb的擬聲詞,AABB的擬聲詞有哪些
- 喧鬧的近義詞是什么 二年級,喧鬧的近義詞是什么二年級下冊語文
- 懷念英文縮寫,懷念英文字母
- 物理反應有哪些,物理反應放熱
