AI這個詞是在1955年由達特茅斯大學的數(shù)學教授John McCarthy提出的,他在次年組織了這個主題的開創(chuàng)性會議。從那以后,或許是由于這個令人回味名字的原因,這個領域的發(fā)展遠遠超過了人們的想象。1957年,經濟學家 Herbert Simon 預言計算機將在10年內擊敗人類(實際上花了40年)。1967年,認知科學家Marvin Minsky說,“在一代人的時間內,人工智能的問題將得到極大的解決?!?Simon和Minsky都是智力巨人,但顯然他們都錯了。
我們先來看看AI已經在做什么,以及這個領域的進展有多快。最大的進展來自于兩大領域:感知(perception)和認知(cognition)。在前一類中,最前沿的進展大部分是和語音相關的。語音識別還沒有達到完美,但現(xiàn)在有數(shù)百萬人已經在使用它們了——想想Siri、Alexa和Google Assistant。你現(xiàn)在正在閱讀的這篇文章最初是由我們口述給計算機的,已經比我們自己打字更快了。斯坦福大學計算機科學家James Landay和他的同事進行的一項研究發(fā)現(xiàn),語音識別的速度大約是手機上打字速度的三倍。語音識別的錯誤率已經從過去的8.5%,下降到4.9%了。令人驚訝的是,這種實質性的進步并非在過去10年,而是從2016年夏天開始。
圖像識別領域的進展也讓人驚嘆。你可能已經注意到,F(xiàn)acebook和其他app現(xiàn)在已經能從你上傳的圖片中識別出你的朋友,并提示你用他們的名字來標記他們。在你的智能手機上運行的app可以識別任何野生鳥類。圖像識別甚至取代了公司門禁卡。自動駕駛汽車中所使用的視覺系統(tǒng),在識別一個行人的時候,通常會在30幀中出現(xiàn)一次錯誤(在這些系統(tǒng)中,相機記錄大約每秒30幀);而現(xiàn)在,它們的錯誤頻率要少于1千萬幀。ImageNet這個大型數(shù)據庫中識別圖像的錯誤率,已經從2010年的30%下降到了2016年的4%。
近年來,隨著大規(guī)模深度神經網絡的使用,AI領域的進展日新月異。當然,目前基于機器學習的視覺系統(tǒng)還遠遠沒有完美無缺——但即使是人也不是無所不能的嘛。
AI領域第二類的主要進步是集中在認知和問題解決方向。機器已經打敗了最優(yōu)秀的(人類)撲克玩家和圍棋選手——雖然原來專家們預測至少還要再過十年。谷歌的DeepMind團隊使用了機器學習系統(tǒng)來提高數(shù)據中心的冷卻效率提升了15%。像Paypal這樣注重網絡安全的公司也正在用AI來檢測惡意軟件。由IBM技術支撐的系統(tǒng)使得新加坡一家保險公司的索賠過程進入了自動化。數(shù)十家公司正在使用機器學習來幫助進行金融交易決策,而且越來越多的信貸決定是在AI幫助下做出的。亞馬遜采用機器學習來優(yōu)化庫存,并提升給客戶的產品推薦。Infinite Analytics公司開發(fā)了一個機器學習系統(tǒng)來預測用戶是否會點擊某個特定的廣告,為一家全球消費包裝產品公司的在線廣告位置進行了優(yōu)化。另一個開發(fā)的系統(tǒng)幫助巴西的一家在線零售商改進客戶的搜索和發(fā)現(xiàn)過程。第一個系統(tǒng)將廣告的ROI提升了三倍,而第二個系統(tǒng)使得年收入增加了1.25億美元。
機器學習系統(tǒng)不僅在許多應用中取代了舊有的算法,而且在許多曾經被人類做得最好的任務上也占盡先機。盡管這些系統(tǒng)并不完美,但它們的錯誤率已經表現(xiàn)比人類更好了。語音識別,即使在嘈雜的環(huán)境中,現(xiàn)在也幾乎等同于人類的表現(xiàn)。這為改變人們的工作和經濟帶來了巨大的新可能性。一旦基于AI的系統(tǒng)在給定的任務中超過人類的表現(xiàn),它們就更有可能迅速傳播。例如,Aptonomy和Sanbot,這兩家分別是無人機和機器人的制造商,他們正在使用改進的視覺系統(tǒng)來自動化大部分保安人員的工作。軟件公司Affectiva使用它們來識別諸如快樂、驚訝和焦點小組的憤怒等情緒。Enlitic是幾家利用AI來識別醫(yī)療影像,進而幫助診斷癌癥的深度學習的初創(chuàng)公司之一。
這些成果都令人印象深刻,但是基于AI的系統(tǒng)的適用性仍然相當狹窄。例如,既然AI在擁有數(shù)百萬圖片的ImageNet數(shù)據庫上表現(xiàn)出色,也并不總能在現(xiàn)實環(huán)境中取得同樣的成功。因為在現(xiàn)實世界里,光線條件、角度、圖像分辨率和背景可能會非常不同。更重要的是,如果人類完成了一項任務,我們會很自然地假設此人在相關任務中具有一定的能力。但是,機器學習系統(tǒng)是被訓練來完成特定的任務,因此通常他們的知識不會泛化。我們離那些能在不同領域展現(xiàn)通用智力的機器還非常遙遠。