1.用戶真正的需求是什么
搜索引擎用戶輸入的發(fā)芽請(qǐng)求很是簡(jiǎn)短,發(fā)芽的平均長(zhǎng)度是2.7個(gè)單詞。若何年夜如斯短的發(fā)芽請(qǐng)求里獲知潛匿厥后的真適用戶需求?這是搜索引擎首先需要解決的很是主要的問(wèn)題。如不美觀不能獲取用戶真正的搜索意圖,搜索的切確性無(wú)年夜談起,即使后續(xù)內(nèi)容匹配算法再精巧也無(wú)濟(jì)于事。
年夜此吐矣閩角度看,即使是統(tǒng)一個(gè)發(fā)芽詞,分歧用戶的搜索目的是分歧的,若何識(shí)別這種差異?如不美觀更進(jìn)一步,即使是統(tǒng)一個(gè)用戶發(fā)出的統(tǒng)一個(gè)發(fā)芽詞,也可能因?yàn)橛脩羲巿?chǎng)景分歧,其目的存在差異,又若何識(shí)別?所有這些都是搜索引擎需要解決的焦點(diǎn)問(wèn)題,寄暌姑戶在此時(shí)此地發(fā)出某個(gè)發(fā)芽,他的真正搜索意圖到底是什么。
3.哪些信息是用戶可以相信的
2.哪些信息是和用戶需求真正相關(guān)的
上述第一個(gè)焦點(diǎn)問(wèn)題是年夜用戶需求角度出發(fā)的,此外兩個(gè)焦點(diǎn)問(wèn)題則是年夜數(shù)據(jù)角度考慮的。搜索引擎素質(zhì)上是一個(gè)匹配過(guò)程,即海量數(shù)據(jù)瑯縵沔找到能夠匹配用戶需求的內(nèi)容。所以,在明晰用戶真實(shí)意鈐記個(gè)前提前提做到后,若何找到能夠知足用戶需求的信息則成為關(guān)頭身分。
判定內(nèi)容和用戶發(fā)芽關(guān)頭辭書(shū)相關(guān)性,一向是信息檢索規(guī)模的焦燈揭捉?究課題,不竭提出的信息檢索模子即在試圖解決這個(gè)問(wèn)題。相關(guān)研究歷時(shí)近60年,盡管不竭有新體例提出,檢索效不美觀總體而言也在逐漸改良,可是這個(gè)規(guī)模的根基指導(dǎo)思惟仍是基于關(guān)頭辭書(shū)匹配,搜羅此刻所有搜索引擎的相關(guān)性計(jì)較部門,其根基計(jì)較思緒和幾十年前對(duì)比并無(wú)素質(zhì)差異。
搜索素質(zhì)上是找到能夠知足用戶需求的信息,盡管相關(guān)性是權(quán)衡信息是否知足用戶需求的一個(gè)主要方面,但并非全數(shù)。信息是否值得相信是此吐矣閩主要的權(quán)衡尺度。
搜索引擎需要措置的信息對(duì)象是互聯(lián)網(wǎng)上肆意用戶發(fā)布的內(nèi)容,可是內(nèi)容發(fā)布者所發(fā)布內(nèi)容是否可托并無(wú)明晰判定尺度。這其寄放在惡意的信息發(fā)布者居心歪曲事實(shí)的情形,也有信息發(fā)布者無(wú)心的錯(cuò)誤。在統(tǒng)一個(gè)發(fā)芽的搜索結(jié)不美觀內(nèi),完全可能存在互相矛盾的搜索謎底,此時(shí)信息的可托性即成為凸起問(wèn)題。
年夜氖亟誶度看,鏈接剖析之所以能夠改善搜索結(jié)不美觀,可以認(rèn)為是對(duì)信息的可托賴度做出的評(píng)判。即將網(wǎng)頁(yè)的主要性作為是否可托賴的一個(gè)判定尺度,返回主要網(wǎng)頁(yè)即是返回可托賴網(wǎng)頁(yè)。