搜索引擎接收到用戶輸入的搜索詞后,需要對搜索詞做一些處理,才能進(jìn)入排名過程。
搜索詞處理包括以下幾方面:
(1)中文分詞。與頁面索引時一樣,搜索詞也必須進(jìn)行中文分詞,將查詢字符串轉(zhuǎn)換為以詞為基礎(chǔ)的關(guān)鍵詞組合。分詞原理與頁面分詞相同。
(2)指令的處置。平時咱們在搜索時會輸入多個詞語,實在默認(rèn)的情況下,搜索引擎把多個默認(rèn)的詞語都依照“與”來進(jìn)行詞語。比方你搜索“seo”“培訓(xùn)”時,搜索引擎會默認(rèn)咱們輸入的“seo培訓(xùn)”來進(jìn)行處置,獨自包括“seo”或者“培訓(xùn)”的網(wǎng)站內(nèi)容實踐上將不會返回,但實際情況往往也會呈現(xiàn)獨自包括一個詞語的網(wǎng)站。另外,還要處置各種高等搜索指令的詞語,比方加號減號等。
(3)停止詞。和索引時一樣,搜索引擎也需要把搜索詞中的停止詞去掉,最大限度地提高排名相關(guān)性及效率。
(4)過錯糾正。用戶如果輸入了明顯錯誤的字或英文單詞拼錯,搜索引擎會提示用戶正確的用字或拼法。
(5)整合搜索觸發(fā)。某些搜索詞會觸發(fā)整合搜索,比如明星姓名就經(jīng)常觸發(fā)圖片和視頻內(nèi)容,當(dāng)前的熱門話題又容易觸發(fā)資訊內(nèi)容。