搜尋引擎

搜尋引擎為一組專案提供了一個介面，使用戶能夠指定關於感興趣的專案的標準，並讓引擎找到匹配的專案，這些標準稱為搜尋查詢。在文字搜尋引擎的情況下，搜尋查詢通常表示為辨識一個或多個文件可能包含的期望概念的一組單詞。^[1]有多種樣式的搜尋查詢語法在嚴格性上有差異。它也可以在以前的站點中搜尋搜尋引擎中的名稱。而一些文字搜尋引擎要求用戶輸入由白色空格分隔的兩個或三個字，其他搜尋引擎可以使用戶能夠指定整個文件，圖片，聲音和各種形式的自然語言。一些搜尋引擎對搜尋查詢進行改進，以增加通過稱為查詢擴充的過程提供質素集合的可能性。查詢理解方法可用於標準化查詢語言。

基於索引的搜尋引擎符合查詢指定條件的專案列表通常會排序或排名。按相關性排列專案（從最高到最低）減少尋找所需資訊所需的時間。概率搜尋引擎根據相似性度量（每個專案和查詢之間，通常以1到0,1的比例最相似）和有時受歡迎程度或權限或使用相關性反饋來評估專案。布林搜尋引擎通常只返回匹配的專案，而不考慮排列順序，為了提供根據一些標準快速排序的一組匹配專案，搜尋引擎通常將通過稱為索引的過程來收集關於所考慮的一組專案的元數據。索引通常需要較少量的電腦儲存，這就是為什麼一些搜尋引擎僅儲存索引的資訊而不是每個專案的完整內容，而是提供導航到搜尋引擎結果頁面中的專案的方法。或者，搜尋引擎可以將每個專案的副本儲存在高速緩衝記憶體中，使得用戶可以在索引時或為了歸檔目的看到該專案的狀態，或者使得重複的行程更有效和更快地工作。其他類型的搜尋引擎不儲存索引。抓取器或蜘蛛型搜尋引擎（也稱為即時搜尋引擎）可以在搜尋查詢時收集和評估專案，基於起始專案的內容（稱為種子或種子URL）動態考慮附加專案互聯網爬蟲的情況）。元搜尋引擎既不儲存索引也不儲存快取，而只是重新使用一個或多個其他搜尋引擎的索引或結果來提供聚合的最終結果集。

類型

按來源

桌面搜尋（Desktop search）
聯合搜尋（英語：Federated search）（Federated search）
人類搜尋引擎（英語：Human search engine）（Human search engine）
元搜尋引擎（Metasearch engine）
多搜尋（英語：Multisearch）（Multisearch）
搜尋聚合器（英語：Search aggregator）（Search aggregator）
網頁搜尋引擎（Web search engine）
實體搜尋引擎（Physical search engine）

按內容類型

音頻搜尋引擎（英語：Audio search engine）（Audio search engine）
全文檢索（Full text search）
圖像搜尋（Image search）
影片搜尋引擎（英語：Video search engine）（Video search engine）

按介面

增量搜尋（英語：Incremental search）（Incremental search）
即時回答（英語：Instant answer）（Instant answer）
語意檢索（Semantic search）
基於選擇的搜尋（英語：Selection-based search）（Selection-based search）
語音搜尋（Voice Search）

按主題

書目資料庫（Bibliographic database）
企業搜尋（英語：Enterprise search）（Enterprise search）
醫學文獻檢索（英語：Medical literature retrieval）（Medical literature retrieval）
垂直搜尋（英語：Vertical search）（Vertical search）

另見

電腦科學
文字自動摘要
索引
倒排索引
搜尋引擎列表
搜尋服務
企業搜尋供應商
搜尋引擎最佳化
搜尋建議下拉式清單（英語：Search suggest drop-down list）
求解程式（英語：Solver）
垃圾索引
SQL
文字挖掘

參考文獻

^ Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.

[1] Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.

[1]