我們每年向幾百名學(xué)生教授數(shù)據(jù)科學(xué),他們都對人工智能很著迷,并會提出很好的問題。汽車如何學(xué)習(xí)自動駕駛?亞歷克莎(Alexa)如何理解我在說什么?聲田(Spotify)是怎樣為我選擇如此精彩的播放列表的呢?臉書如何在我上傳的照片中識別我的朋友?這些學(xué)生意識到,人工智能不是來自未來的某種科幻機器人。
它存在于此時此刻。它在通過每一部智能手機改變世界。學(xué)生們都想理解人工智能,而且都想?yún)⑴c其中。
我們的學(xué)生不是唯一對人工智能產(chǎn)生熱情的人。和他們一樣欣喜的還有世界上最大的公司 — 從美國的亞馬遜、臉書、谷歌到中國的百度、騰訊、阿里巴巴。你可能聽說過,這些大型科技公司正在發(fā)動一場針對人工智能人才的昂貴的全球軍備競賽,他們認(rèn)為這對他們的未來非常重要。我們看到,多年來,他們一直在用 30 萬美元以上的年薪和遠(yuǎn)遠(yuǎn)優(yōu)于我們學(xué)術(shù)界的咖啡來吸引剛畢業(yè)的博士。
現(xiàn)在,我們看到更多公司參與到人工智能領(lǐng)域的人才爭奪之中 —比如坐擁海量數(shù)據(jù)的保險和石油公司,他們同樣可以提供可觀的薪水和獨具特色的咖啡機。
這種軍備競賽當(dāng)然是真實的,但我們認(rèn)為人工智能領(lǐng)域目前還有另一個更加強烈的趨勢 — 這個趨勢不是集中,而是擴散和傳播。是的,每家大型科技公司都在努力囤積數(shù)學(xué)和編程人才,但與此同時,人工智能背后的基本技術(shù)和思想正在以極快的速度擴散,被小公司、其他行業(yè)以及世界各地的愛好者、程序員、科學(xué)家和研究人員所掌握。這種民主化趨勢是最讓我們今天的學(xué)生感到激動的事情,因為他們正在考慮各種急切需要人工智能解決方案的問題。
比如,誰會想到一群大學(xué)生會對黃瓜數(shù)學(xué)如此著迷?當(dāng)他們聽說日本汽車工程師小池誠(Makoto Koike,音譯)的故事時,他們的確很著迷。小池誠的父母有一座黃瓜農(nóng)場。在日本,黃瓜具有各種令人眼花繚亂的大小、形狀、顏色和毛刺度 — 人們必須根據(jù)這些外觀特征將黃瓜分屬九種類別,這些類別具有不同的市場價格。
過去,小池的母親每天要花八個小時手工分揀黃瓜。后來,小池意識到,他可以用谷歌的開源人工智能軟件 TensorFlow 完成這項任務(wù)。他可以編寫一種“深度學(xué)習(xí)”算法程序,根據(jù)照片為黃瓜分類。
小池之前從未使用過人工智能和 TensorFlow,但他很容易就根據(jù)現(xiàn)有的所有免費資源完成了自學(xué)。當(dāng)他的人工智能分揀機器視頻在YouTube 上出現(xiàn)時,小池成了深度學(xué)習(xí)和黃瓜這兩個領(lǐng)域的國際名人。他不僅為人們提供了一個有趣的故事,為他的母親免除了無數(shù)個小時的辛勞,他還向全世界的學(xué)生和程序員傳達了一個令人鼓舞的消息:既然人工智能可以解決黃瓜農(nóng)場的問題,那么它應(yīng)該可以解決幾乎所有領(lǐng)域的問題。
這條消息目前正在迅速傳播。醫(yī)生正在用人工智能診斷和治療癌癥。電力公司用人工智能提高發(fā)電效率。投資者用人工智能管理財務(wù)風(fēng)險。石油公司用人工智能提高深海鉆井平臺的安全性。執(zhí)法機構(gòu)用人工智能追捕恐怖分子?茖W(xué)家用人工智能獲取天文、物理和神經(jīng)科學(xué)的新發(fā)現(xiàn)。世界各地的公司、研究人員和愛好者正在以數(shù)千種不同的方式使用人工智能,比如探測天然氣泄漏,開采鐵礦石,預(yù)測疾病暴發(fā),避免蜜蜂滅絕,量化好萊塢電影中的性別歧視。
這僅僅是開始。
我們認(rèn)為,人工智能的真實故事恰恰體現(xiàn)了這種擴散:從過去幾十年甚至幾百年間的幾個核心數(shù)學(xué)概念,到今天的超級計算機和講話、思考、分揀黃瓜的機器,到明天無處不在的新的數(shù)字奇跡。
我們這本書的目的就是向你講述這個故事。它在一定程度上是科技故事,但它主要講述的是思想以及思想背后的人 — 這些人所處的時代比現(xiàn)在早得多,他們只是在低調(diào)地解決他們面對的數(shù)學(xué)和數(shù)據(jù)問題,他們并不知道他們的解決方案將對現(xiàn)代社會起到怎樣的作用。讀完這個故事,你會理解人工智能的含義、來源、原理及其在生活中的重要意義。
人工智能到底是什么意思?
當(dāng)你聽到“人工智能”時,不要想到機器人。你應(yīng)該把它看成一種算法。
算法是一組帶有步驟的指令。這些指令非常清晰,就連計算機這樣頭腦簡單的事物也能遵循。(你可能聽說過下面的笑話。一個機器人卡在浴室里出不來了,因為洗發(fā)水瓶身上的算法是:“涂抹。沖洗。重復(fù)!保┧惴ū旧聿⒉槐入娿@更加聰明,它只能把一件事情做得很好,比如為數(shù)組排序,或者在網(wǎng)上搜索可愛的動物照片。不過,如果你將許多算法巧妙地組合在一起,你就可以生成人工智能,使人覺得它在某個領(lǐng)域可以做出智能行為。例如,你可能會向谷歌Home 這樣的數(shù)字助理提出“奧斯汀最好的早餐玉米卷餅在哪兒”等問題。這種詢問會引發(fā)算法的連鎖反應(yīng):
一個算法將原始聲波轉(zhuǎn)化成數(shù)字信號。
另一個算法將這個信號轉(zhuǎn)化成一串英語音素,即獨特的
聽覺感知:“brek-fust-tah-koze”。
下一個算法將這些音素劃分成詞語:“breakfast tacos”。
這些詞語被發(fā)送到搜索引擎 — 搜索引擎本身就是海量算法的集合,可以處理查詢,做出回答。
另一個算法將這種回答轉(zhuǎn)化成清晰的英語句子。
最后一個算法以聽上去不像機器人的方式表述這個句子:
“奧斯汀最好的早餐玉米卷餅在杜瓦爾街的胡里奧餐廳。您需要導(dǎo)航嗎?”
這就是人工智能。幾乎每個人工智能系統(tǒng)都會遵循這種“算法管道”模式,不管是自動駕駛汽車、自動黃瓜分揀機還是監(jiān)測信用卡賬戶盜刷的軟件。這種管道會接收來自某個具體領(lǐng)域的數(shù)據(jù),執(zhí)行一系列計算,然后輸出預(yù)測或決定。
人工智能使用的算法有兩個明顯特征。首先,這些算法處理的通常不是確定性,而是概率。例如,人工智能中的算法不會直接指出某筆信用卡交易存在欺詐。相反,它會指出欺詐概率是 92%,或者它根據(jù)數(shù)據(jù)得到的任何概率。第二個特征涉及這些算法是如何知道應(yīng)該遵循哪些指令的。在傳統(tǒng)算法中,比如運行網(wǎng)站或處理文字的算法,這些指令是程序員提前固定下來的。不過,在人工智能中,這些指令是算法直接從“訓(xùn)練數(shù)據(jù)”中學(xué)到的。沒有人告訴人工智能算法如何判斷信用卡交易是否存在欺詐。相反,算法會看到每個類別(欺詐,無欺詐)中的許多案例,它會找到區(qū)分二者的模式。
對于人工智能來說,程序員的作用不是告訴算法應(yīng)該做什么,而是告訴算法如何根據(jù)數(shù)據(jù)和概率規(guī)則獲知自己應(yīng)該做什么。
我們是如何走到今天的?
自動駕駛汽車和家庭數(shù)字助理等現(xiàn)代人工智能系統(tǒng)屬于新鮮事物。不過,你可能會吃驚地發(fā)現(xiàn),人工智能的重要思想其實很古老 — 許多思想已經(jīng)存在了數(shù)百年 — 我們的祖先一直在用它們解決問題。以自動駕駛汽車為例,谷歌第一款自動駕駛汽車于 2009年首次亮相。不過,你將在第三章發(fā)現(xiàn),這些汽車背后的主要思想之一是某個長老會牧師在 18 世紀(jì) 50 年代發(fā)現(xiàn)的 — 50 多年前,某個數(shù)學(xué)家團隊還用這種思想解決了冷戰(zhàn)時期最大的轟動性謎團之一。
另一個例子是圖像分類,比如自動在臉書照片中為你的朋友做標(biāo)記的軟件。圖像處理算法在過去五年取得了很大進步,但你將在第二章看到,這里的關(guān)鍵思想來自 1805 年 — 而且,一位不知名的天文學(xué)家亨麗埃塔·萊維特(Henrietta Leavitt)在一個世紀(jì)前利用這些思想幫助人類解答了歷史上最深刻的科學(xué)問題之一:宇宙有多大?
再以語音識別為例,這是人工智能近年來的偉大勝利之一。亞歷克莎和谷歌 Home 等數(shù)字助理在語言方面非常流利,而且它們只會變得越來越好。不過,第一個讓計算機理解英語的人是一位美國海軍少將,而且這件事發(fā)生在將近 70 年前。(見第四章。)
這里只舉了三個例子,但它們說明了一個驚人的事實:不管你考察人工智能的哪些方面,你都會找到一個被人們長期研究過的思想。所以,從各方面來看,最大的歷史謎團不是人工智能為什么會在今天出現(xiàn),而是它為什么沒有在很久以前出現(xiàn)。要想解釋這個謎團,我們必須考慮將這些寶貴思想帶入新時代的三個強大的技術(shù)力量。
第一個使人工智能成為可能的力量是計算機長達幾十年的指數(shù)增長速度,通常被稱為摩爾定律。你很難直觀地理解計算機目前的速度有多快。過去的常見說法是,阿波羅宇航員登陸月球時使用的計算能力還比不上一只袖珍計算器。不過,這種說法已經(jīng)無法使人產(chǎn)生共鳴了,因為……袖珍計算器是什么東西?所以,讓我們用汽車來類比。1951 年,尤尼瓦克是速度最快的計算機之一,每秒可以進行 2000 次計算,而速度最快的汽車之一阿爾法羅密歐 6C 的時速可達 180 公里。之后,汽車和計算機都在提速。不過,如果汽車能像計算機那樣提速,那么現(xiàn)代阿爾法羅密歐的速度將達到光速的800 萬倍。
人工智能的第二個助推器是新的摩爾定律:隨著人類所有信息的數(shù)字化,可用數(shù)據(jù)量出現(xiàn)了爆炸式增長。美國國會圖書館擁有10 太字節(jié)的存儲量,但是谷歌、蘋果、臉書、亞馬遜四大科技公司 2013 年一年收集的數(shù)據(jù)就是這個數(shù)字的大約 12 萬倍。而且,從互聯(lián)網(wǎng)視角來看,這已經(jīng)是上一代的事情了。數(shù)據(jù)積累的加速節(jié)奏比阿波羅火箭還要快。2017 年,YouTube 每分鐘上傳的視頻超過300 小時,Instagram 每天貼出的照片超過 1 億張。更多的數(shù)據(jù)意味著更聰明的算法。
第三個支撐人工智能的因素是云計算。消費者幾乎看不到這種趨勢,但它對人工智能產(chǎn)生了巨大的民主化影響。為說明這一點,我們要對數(shù)據(jù)和石油進行類比。假設(shè) 20 世紀(jì)早期的所有公司都擁有一些石油,但是它們需要獨自建設(shè)基礎(chǔ)設(shè)施,以便開采、運輸和提煉石油。如果一家公司有了利用石油的新思想,它需要面對巨大的固定起步成本。因此,大多數(shù)石油都不會得到使用。同樣的邏輯也適用于數(shù)據(jù),即 21 世紀(jì)的石油。如果用自己的數(shù)據(jù)打造人工智能系統(tǒng)需要購買所有的裝備和專業(yè)人才,大多數(shù)愛好者和小公司都會面對難以負(fù)擔(dān)的成本。不過,微軟 Azure、IBM 和亞馬遜 WebServices 等平臺提供的云計算資源將這種固定成本轉(zhuǎn)化成了可變成本,極大地改變了大規(guī)模數(shù)據(jù)存儲和分析的支出比重。今天,任何想要使用個人“石油”的人都可以租用其他人的基礎(chǔ)設(shè)施,以降低成本。
當(dāng)你將這四種趨勢 — 更快的芯片、大量數(shù)據(jù)、云計算以及最重要的優(yōu)秀思想 — 放在一起時,用人工智能解決實際問題的需求和能力就會出現(xiàn)爆炸式增長。