如今,在互聯(lián)網(wǎng)誕生近50年后,搜索的意義已經(jīng)遠(yuǎn)遠(yuǎn)不只“關(guān)鍵詞+回車(chē)”找出相關(guān)信息。大數(shù)據(jù)、云計(jì)算、人工智能賦予了搜索全新的意義,搜索已經(jīng)無(wú)處不在:當(dāng)我們?cè)谑褂冒俣葧r(shí),當(dāng)我們拿起iPhone詢問(wèn)Siri天氣如何,當(dāng)我們將照片放入搜索框……搜索已經(jīng)融入我們的生活,查詢變成了我們?nèi)粘5囊徊糠帧?/span>
搜索現(xiàn)在已經(jīng)發(fā)展到什么階段了?
搜索未來(lái)會(huì)變成什么樣子?
搜索還能帶給我們什么……
作者斯特凡·韋茨身為必應(yīng)搜索的高級(jí)總監(jiān),多年在微軟致力于搜索的研究和推廣。在這本書(shū)中,斯特凡為我們展示了智能時(shí)代未來(lái)搜索的全景圖。未來(lái)的搜索是當(dāng)你搜索一部電影名稱(chēng)時(shí),你的訂票系統(tǒng)已經(jīng)根據(jù)你的日程表開(kāi)始為你推薦今天的觀影時(shí)間和地點(diǎn);當(dāng)你查詢路況,電子地圖軟件自動(dòng)為你推薦出回家的躲避擁堵方案;當(dāng)你和朋友對(duì)話時(shí)提到晚上一起吃飯,你的手機(jī)助手立刻在結(jié)束通話時(shí)為你列選出最符合你口味的就餐地點(diǎn)……
讀完這本書(shū),你會(huì)被搜索的強(qiáng)大力量所震撼,也會(huì)意識(shí)到目前我們使用到的搜索功能只是搜索的冰山一角。當(dāng)搜索遇到人工智能,當(dāng)搜索與物聯(lián)網(wǎng)結(jié)合,當(dāng)搜索和機(jī)器學(xué)習(xí)碰撞……搜索的潛能將被激發(fā)出巨大的能量為人類(lèi)生活、生產(chǎn)的便利帶來(lái)質(zhì)的飛躍。同時(shí),也會(huì)給我們帶來(lái)前所未有的挑戰(zhàn)。
準(zhǔn)備好了嗎?讓作者帶你走進(jìn)未來(lái)5年、10年、20年后的搜索!
搜索在今天的意義遠(yuǎn)遠(yuǎn)不只文字搜索,它變得更加智能和強(qiáng)大,作者用通俗的語(yǔ)言為我們描繪了未來(lái)搜索的方向,以及我們需要小心和需要反思的地方;
作者為微軟搜索總監(jiān),他站在互聯(lián)網(wǎng)時(shí)代背景下用專(zhuān)業(yè)的眼光結(jié)合多年的一線工作經(jīng)驗(yàn)講述搜索的本質(zhì)、搜索的意義、搜索的未來(lái)以及搜索對(duì)商業(yè)的意義;
著名大數(shù)據(jù)專(zhuān)家涂子沛,XPRICE創(chuàng)始人、奇點(diǎn)大學(xué)執(zhí)行主席,《富足》合著者彼得·赫曼迪斯, Siri合創(chuàng)人亞當(dāng)·奇耶等IT界大咖鼎力推薦。
前言(節(jié)選):
未來(lái)將會(huì)怎樣?
我的日常工作是微軟必應(yīng)(Bing)的高級(jí)搜索總監(jiān)。有很多員工致力于推廣并提升我們的搜索引擎技術(shù),我只是其中一員。我從一開(kāi)始就在必應(yīng)工作,也很幸運(yùn)一直參與在我想象中最繁復(fù)的啟動(dòng)工作中。2013年12月,有人打電話問(wèn)我是不是愿意寫(xiě)一本關(guān)于搜索的書(shū)。我的反應(yīng)是當(dāng)然可以,為什么不呢?當(dāng)時(shí)我正計(jì)劃環(huán)球旅行,到14個(gè)城市去進(jìn)行已經(jīng)安排好的談話和會(huì)議。我正在微軟啟動(dòng)若干新的產(chǎn)品,也剛剛戒除咖啡因。很顯然,我有點(diǎn)兒失衡。
每個(gè)設(shè)備、我們周?chē)拿總(gè)物體、每個(gè)人都互相連接,我們也開(kāi)發(fā)出從噪聲中識(shí)別出模式的系統(tǒng)。面臨這樣的現(xiàn)實(shí),寫(xiě)下我對(duì)此的觀點(diǎn)很重要。搜索的力量在于提醒我們那些自己都不知道但其實(shí)應(yīng)該知道的東西,也能在廣義上讓我們變得更好。我看到數(shù)字化的黃金時(shí)代正在來(lái)臨,每個(gè)人、每個(gè)地方、每樣?xùn)|西都可以用數(shù)字的形式描述。一旦那個(gè)時(shí)代降臨,而系統(tǒng)從我們復(fù)雜的思想中過(guò)濾掉那些知識(shí)殘?jiān)敲慈祟?lèi)的能力將得以增強(qiáng),我們就可以做出更好的決定,還能在一念之間就操縱物理世界,而最終也會(huì)更加幸福。我在晚宴或者講座上描述我的工作以及我對(duì)搜索未來(lái)的愿景時(shí),人們無(wú)一例外地對(duì)這些可能性感到興奮不已。
當(dāng)我談到科技帶來(lái)的超級(jí)鏈接、超級(jí)分析、超級(jí)指引到底意味著什么等深入內(nèi)容時(shí),更多的人才開(kāi)始深思。
技術(shù)產(chǎn)業(yè)的圈子其實(shí)很小,我就有很多朋友在谷歌工作。而谷歌通常被認(rèn)為是微軟的主要競(jìng)爭(zhēng)對(duì)手。雖然我對(duì)工作在山景城的同胞在做什么沒(méi)有明確的信息,但在用晚餐的時(shí)候我會(huì)聽(tīng)到他們?cè)谒伎际裁矗约氨貞?yīng)和谷歌都在試圖解決的問(wèn)題。
這本書(shū)接下來(lái)所講述的并不是必應(yīng)、微軟或者任何其他公司建立這樣的未來(lái)搜索產(chǎn)品的計(jì)劃。事實(shí)上,書(shū)中很多概念是矛盾的,也涉及監(jiān)管方面的擦邊球。在某些情形中,社會(huì)就是不能接受一個(gè)超級(jí)互聯(lián)的世界以及由此帶來(lái)的透明度。我們這本書(shū)說(shuō)的是未來(lái)的形勢(shì)。而我每天深度生活在互聯(lián)網(wǎng)之中,一年要和數(shù)百家公司的工程師和技術(shù)專(zhuān)家以及那些推進(jìn)著技術(shù)發(fā)展的學(xué)者交流。總體來(lái)說(shuō),我相信技術(shù)的力量能建立起一個(gè)更自由也更幸福的社會(huì)。
當(dāng)人類(lèi)與機(jī)器融合我們?nèi)祟?lèi)總是想尋找方法捕捉我們?cè)诂F(xiàn)實(shí)世界中看到的東西,從而將其保存、傳承并從中學(xué)習(xí)。巖畫(huà)、日記、散文、照片、錄音、錄像……所有這些蹤跡使我們能織出一張生動(dòng)又不朽的掛毯,其描繪的世界超越了我們個(gè)體生命的短暫本質(zhì),而且我們?cè)絹?lái)越多地用機(jī)械來(lái)保存、分析、解釋這些蹤跡。
與此同時(shí),我們一直在嘗試通過(guò)一些架構(gòu)連接人機(jī)之間不兼容的界面,從而將兩者結(jié)合。比如紐約中央火車(chē)站是一個(gè)匯聚了人類(lèi)和機(jī)器的移動(dòng)的中心。我們通過(guò)結(jié)合人類(lèi)和機(jī)器的兩個(gè)獨(dú) 一 無(wú) 二的特性—人類(lèi)精細(xì)、自主但是緩慢的移動(dòng)結(jié)合機(jī)器利用引
擎和軌道進(jìn)行的粗放、限定但快速的移動(dòng)—讓人們走得更快,走得更遠(yuǎn)。融合了人類(lèi)和機(jī)器各自的能力后會(huì)發(fā)生什么?如果我們用機(jī)器可以利用的方式捕獲現(xiàn)實(shí)世界,然后利用機(jī)器的能力來(lái)大幅提升人類(lèi)的能力會(huì)怎樣?這就是搜索的未來(lái),其獨(dú) 一 無(wú) 二的能力是對(duì)現(xiàn)實(shí)世界進(jìn)行有意義的索引,并同時(shí)作為這些知識(shí)的通用接口。搜索就是我們一直想要的“鉸鏈”。
我重申一次,這不是我們今天所認(rèn)為的搜索,那只是一個(gè)信息獲取系統(tǒng),我們輸入一個(gè)名詞并希望得到一個(gè)包含那個(gè)名詞的結(jié)果頁(yè)面。我們必須要把搜索看作空中的一位無(wú)所不知的觀察者。它知曉蒼穹之下、大地之上發(fā)生的一切。要想這一切變?yōu)楝F(xiàn)實(shí),搜索本身必須被解構(gòu),還原成各個(gè)元任務(wù):對(duì)這個(gè)世界及其中的一切進(jìn)行索引并理解;讀懂感受,于是搜索系統(tǒng)可以看、可以聽(tīng)(最終能聞、能摸。能和我們以更自然的方式交互;和我們?nèi)祟?lèi)的交流方式要與情景匹配—不論這樣的情景是文字、對(duì)話,還是代表我們和其他機(jī)器通信并在真實(shí)世界中讓事件發(fā)生。
在下面幾章中,我們會(huì)探討將搜索轉(zhuǎn)變?yōu)檫B接人機(jī)獨(dú)特能力的“鉸鏈”的進(jìn)展。我們會(huì)先審視這一新的網(wǎng)絡(luò)以及搜索引擎面臨的挑戰(zhàn),接著我們會(huì)分析在新的職能下搜索引擎能做些什么,還會(huì)介紹搜索引擎的新規(guī)則。等到我們對(duì)未來(lái)搜索的潛力有了切實(shí)的理解,我們會(huì)討論新一代的搜索會(huì)怎樣在更大程度上包容人性,提升人類(lèi)的能力,真正成為我們?cè)谡鎸?shí)世界和虛擬世界中的代理人。
雖說(shuō)我們這些技術(shù)人員設(shè)想了那么光明的前景,搜索的未來(lái)如何卻還沒(méi)有確定。我們會(huì)審視那些當(dāng)前阻礙我們迎來(lái)搜索黃金年代的障礙。這些障礙包括技術(shù)挑戰(zhàn),也有更寬泛意義上的社會(huì)問(wèn)題,比如我們是否想要這種洞察我們的世界以及其中一切的看似無(wú)所不在的能力。最后,我們要討論的是在將人類(lèi)的潛力和機(jī)器層面的能力結(jié)合而形成共生關(guān)系,并顛覆了諸如商業(yè)、隱私以及日常生活等現(xiàn)有概念后,搜索到底還有怎樣的意義。
微軟必應(yīng)搜索的高級(jí)總監(jiān)。他在微軟時(shí)的主要工作就是和其他同行以及行業(yè)內(nèi)的組織一起,推廣并改進(jìn)搜索技術(shù)。他不僅關(guān)注微軟的產(chǎn)品線,同時(shí),也在其工作覆蓋的整個(gè)行業(yè)深入研究以更好地理解搜索行為、學(xué)術(shù)發(fā)展以及各方面的創(chuàng)新。他就像是搜索的“傳道者”,搜集并整理各方面的反饋,以此促進(jìn)搜索技術(shù)的進(jìn)步。
作為一名在微軟工作了17年的老員工,他在諸多項(xiàng)目小組(Windows系統(tǒng)、硬件、信息安全以及全球商業(yè)戰(zhàn)略)中負(fù)責(zé)技術(shù)開(kāi)發(fā)、項(xiàng)目管理、業(yè)務(wù)拓展開(kāi)發(fā)以及市場(chǎng)營(yíng)銷(xiāo)等不同環(huán)節(jié)并獲得不少專(zhuān)利。他也經(jīng)常為企業(yè)和學(xué)術(shù)團(tuán)體就信息存儲(chǔ)、獲取和使用的未來(lái)發(fā)表演講。
目前居住在華盛頓州西雅圖市。
第1章 搜索將看到什么?
搜索走到了哪里?
文字的局限
更有能力的網(wǎng)絡(luò)
社交網(wǎng)絡(luò)
個(gè)人信息
互聯(lián)現(xiàn)實(shí)
設(shè)備
“事物”
事件
地點(diǎn)
混合系統(tǒng)
支付系統(tǒng)
大數(shù)據(jù),大影響
設(shè)備推動(dòng)了“能力網(wǎng)絡(luò)”
無(wú)所不在的通信為“能力網(wǎng)絡(luò)”加油
用“能力網(wǎng)絡(luò)”去理解物理世界
將現(xiàn)實(shí)編織在一起
第2章 搜索將如何應(yīng)對(duì)?
沒(méi)有萬(wàn)靈丹
由此及彼
下一代搜索查詢
更好的聽(tīng)眾:從妄語(yǔ)中發(fā)現(xiàn)真知
更認(rèn)真地聽(tīng)
更智能地聆聽(tīng)
理解現(xiàn)實(shí)世界
幫助搜索引擎去理解人們
設(shè)備驅(qū)動(dòng)了對(duì)理解的需求
構(gòu)建一張世界知識(shí)地圖
第3章 搜索將做什么?
搜索將具有洞見(jiàn)并給出預(yù)測(cè)
挑戰(zhàn):好奇心帶來(lái)的洞見(jiàn)
只是夠用就足矣?
從查找到行動(dòng)
超越應(yīng)用末日
讓一切變得更智能
設(shè)備交朋友,相互有影響
把一切整合起來(lái)
下一代搜索能提升我們的幸福感嗎
第4章 搜索將會(huì)如何?
提升我們這個(gè)世界的精度
機(jī)器學(xué)習(xí)和智能
消耗更少,做得更多
另一個(gè)途徑:模仿人類(lèi)大腦
人就是搜索引擎
慢速搜索
人可以彌補(bǔ)“小數(shù)據(jù)”造成的錯(cuò)誤嗎
是快是慢,它就在那里
第5章 搜索能給我們帶來(lái)什么?
搜索將增強(qiáng)現(xiàn)實(shí)
搜索將增強(qiáng)我們的自然能力
搜索將帶來(lái)實(shí)時(shí)決策
超人類(lèi)的搜索
第6章 誰(shuí)拖了搜索的后腿—技術(shù)
信息孤島
你的檔案
硬件孤島
安全或不安全
淹沒(méi)在數(shù)據(jù)海洋
平衡的訣竅
大數(shù)據(jù):數(shù)量真的很重要嗎
大數(shù)據(jù)及其帶來(lái)的意外結(jié)果
決策的無(wú)能和一致性
反擊:當(dāng)大數(shù)據(jù)遇上大計(jì)算
希望的微光
第7章 誰(shuí)拖了搜索的后腿—商業(yè)
系統(tǒng)中遍地黃金
未來(lái)搜索的商業(yè)模式
另一種搜索付費(fèi)方式
廣告的再思考
其他贏利模式
隱私
技術(shù)、社交、個(gè)人及社會(huì)維度
我的隱私值多少錢(qián)
數(shù)據(jù):你的、我的和我們的
個(gè)人云
是服務(wù)條款,還是奴役
一流的網(wǎng)絡(luò)
解決之道:陽(yáng)光普照
第8章 信仰時(shí)刻
數(shù)字化的你:真正得以量化的自我
一個(gè)更數(shù)字化的世界
控制循環(huán)
對(duì)生活、宇宙和一切的影響
社會(huì)影響
商務(wù)影響
結(jié)語(yǔ)搜索的未來(lái)
致謝
搜索走到了哪里?
由于網(wǎng)絡(luò)是基于文本文檔構(gòu)建的,所以我們最初將其分類(lèi)的嘗試很像是一種原始的杜威十進(jìn)制圖書(shū)分類(lèi)法。雅虎就是一個(gè)由工程師維護(hù)的層級(jí)索引。對(duì)于某一個(gè)詞語(yǔ),有一系列的頁(yè)面和網(wǎng)站與這個(gè)詞語(yǔ)相關(guān)。這樣的層級(jí)索引過(guò)去是、現(xiàn)在也仍然是通往廣袤信息領(lǐng)域卓有成效的路標(biāo)。如果你對(duì)阿根廷的旅館感興趣,層級(jí)索引可以帶你訪問(wèn)一個(gè)網(wǎng)站,而那里列出了很多阿根廷旅館的信息。
網(wǎng)絡(luò)不斷擴(kuò)展,從成百上千個(gè)頁(yè)面到數(shù)百萬(wàn)乃至數(shù)億個(gè)頁(yè)面。這些頁(yè)面上使用的詞語(yǔ)也擴(kuò)展到了百萬(wàn)億計(jì),單純的層級(jí)索引不再適用,于是就誕生了搜索。
但糾結(jié)之處在于,索引本身不再有任何意義。索引主要用來(lái)在一本書(shū)中找到對(duì)應(yīng)于一個(gè)詞語(yǔ)或者詞組的頁(yè)面。顯然,如果一個(gè)索引包含了圖書(shū)館里所有書(shū)的話,它的用處就不大。比如我們查找“大象”這個(gè)詞語(yǔ),那就不得不瀏覽圖書(shū)館收藏的數(shù)百本書(shū)中的數(shù)千個(gè)結(jié)果。意識(shí)到這一點(diǎn)后,一場(chǎng)革命就不可避免了。
搜索工程師意識(shí)到,根據(jù)一本書(shū)和大象的相關(guān)性,可以對(duì)這些書(shū)加以排序。顯而易見(jiàn)的是,有些書(shū)(比如一位和大象生活了20年的非洲作者寫(xiě)的書(shū))相比另外一些書(shū)(比如說(shuō)迪士尼的《小飛象》)包含更多有關(guān)大象的信息。但即便是在數(shù)字時(shí)代,創(chuàng)建這樣一個(gè)排序的索引也會(huì)面臨挑戰(zhàn)。你怎么知道正給你做講演的人是馴馬專(zhuān)家?你怎能確信巖畫(huà)向你展示了刺殺野牛的正確方式?在過(guò)去的很多情形中,權(quán)威性排序由人們對(duì)該來(lái)源的評(píng)述決定,而這樣的評(píng)述通;谶@些來(lái)源是否能給予人們良好的信息,或者幫助他們成功地完成某項(xiàng)任務(wù)。隨著搜索引擎所包含的人類(lèi)知識(shí)越來(lái)越龐大,工程師開(kāi)始尋找在數(shù)字系統(tǒng)中重現(xiàn)這一現(xiàn)實(shí)世界的方法。
謝爾蓋·布林和拉里·佩奇設(shè)計(jì)了BackRub(返回觸摸)算法,成立了谷歌公司。他們衡量的是每個(gè)查詢返回結(jié)果的權(quán)重,該權(quán)重對(duì)應(yīng)著每個(gè)結(jié)果與該查詢的相關(guān)程度。通過(guò)找到一個(gè)頁(yè)面中鏈接到另外一個(gè)網(wǎng)頁(yè)的文本可以得到權(quán)重。A頁(yè)面上的這些鏈接文本(稱(chēng)為“錨文本”)為搜索引擎提供了目標(biāo)頁(yè)面(B頁(yè)面)可能的內(nèi)容描述。如果足夠多的、具有相似詞源的詞語(yǔ)都指向同一個(gè)頁(yè)面——比如,有10 000個(gè)頁(yè)面都包含“大象”這個(gè)錨文本,且都指向另外一個(gè)網(wǎng)頁(yè)(B頁(yè)面)——那么引擎可以假定B頁(yè)面很可能說(shuō)的就是大象。我們結(jié)合實(shí)際生活來(lái)思考一下這個(gè)過(guò)程。如果有足夠多的人告訴你洗手間在旅館的二樓,你很可能會(huì)相信他們。而如果這些人中的大部分還是在該旅館工作的人員,你對(duì)這個(gè)答案的信心會(huì)更強(qiáng),因?yàn)檫@些人在這個(gè)話題上有更高的權(quán)威性。搜索的情形也是如此:不僅僅是有10 000個(gè)頁(yè)面告訴引擎B頁(yè)面是關(guān)于大象的,這10 000個(gè)頁(yè)面的質(zhì)量(或者說(shuō)可信度)更是一個(gè)重要的衡量因素。
這些年來(lái),工程師研究出了數(shù)百個(gè)其他變量,讓搜索可以適應(yīng)不斷增長(zhǎng)的網(wǎng)絡(luò)。隨著頁(yè)面和鏈接數(shù)量的增加,我們的算法越來(lái)越擅長(zhǎng)識(shí)別鏈接的含義和網(wǎng)頁(yè)的其他特征,并確定當(dāng)用戶使用某一特定查詢時(shí)他可能想要查找什么。
不管怎樣,搜索這個(gè)領(lǐng)域還是相對(duì)簡(jiǎn)單的,因?yàn)槲覀円韵鄬?duì)簡(jiǎn)單的方式去搜索東西。頁(yè)面上的文字——偶爾加上圖片——成為現(xiàn)實(shí)世界里各種思想的一個(gè)低精度的替代品。
文字的局限
隨著互聯(lián)網(wǎng)的成長(zhǎng),它漸漸地能以更復(fù)雜的形式來(lái)表征這個(gè)世界。網(wǎng)絡(luò)不再是一系列頁(yè)面和鏈接,偶爾夾雜一些有趣的貓咪視頻。網(wǎng)絡(luò)更是一種方式,使得世上的一切得以重現(xiàn)、互聯(lián)、有意義。有了這個(gè)目標(biāo),我們不斷拓展了傳統(tǒng)搜索系統(tǒng)的極限。也就是說(shuō),傳統(tǒng)搜索更依賴(lài)于語(yǔ)言作為與日漸電子化的物理世界進(jìn)行交互的主要方式。
P6-8