不久前,蘋果公司宣布下一代iPhone將啟用一項新的語音識別系統:Siri。關于它的簡介和部分發布會演示照片請參看果迷網之前的《Siri智能語音識別,iPhone 4S能夠聽懂你的話》一文。Cult of Mac則對Siri進行了一番深入的解析,看過此文或許能讓你更有理由相信,人工智能已經走進我們的生活。
說道Siri,這是一道硬菜。可在Android上,這個功能一年前就有了,蘋果不過是想在這方面“不輸他人”,而且其功能也并非如此強大。對吧?
錯。除了它確實是一道硬菜以外,其他的都錯。
其實,Siri是十年內移動平臺上最重要的事件之一。
對Siri持否定看法的人一般會分成兩個陣營:一邊會說它沒什么了不起的;另一邊會說Android上之前已經有了。這兩方的說法都不正確。
Siri的意義相當重大
我們不妨先從Siri的血統說起。Siri直接發端于史上最大的人工智能項目:五角大樓的CALO項目。CALO是“Cognitive Assistant that Learns and Organizes”的縮寫(會學習和組織的認知助理),這個項目匯聚了全球人工智能方面的頂尖科研人員。
整個CALO計劃的帶頭人名叫Adam Cheyer,他現在也是蘋果iPhone團隊的工程總監。
在《麻省理工技術評論》的采訪中,Cheyer說CALO早已開始探索如何把“對話、自然語言理解、視覺、演說、機器學習、制定計劃、理性思考、服務代表全部融合到一個??模仿人類的助理中,幫助人們完成不同的事情。”
他形容說Siri計劃就是尋求在一件消費產品中做同樣的事情。其實,在過去的四年里,Cheyer和他的團隊一直在鉆研如何優化CALO,使其能夠在一臺強大的移動電話中發揮效用,每天都能被成千上萬的用戶使用。在過去一年半中,他們把主要精力放在Siri技術和iOS及其應用程序的整合上。
它不是單純的“聲音識別”。它是人工智能。當人工智能進入了你的手機,難道意義還不夠重大?
Siri和Voice Actions是兩碼事
Android系統的Voice Actions也是一項偉大的技術,并已經被許多Android用戶所熟知和使用。但說真的,它和Siri不是同一個層面的產品。
Voice Actions提供了非常堅實可靠的聲音識別引擎,它的高識別度把曾經一度流行的語音識別工具都比了下去。
不過,和過去的所有語音命令系統一樣,它要求你說的話嚴格符合一系列特定的語法,否則它就無法理解。
Siri和以前公眾使用過的所有產品都不相同。你說的話可以和你想表達的意思在字面上毫不相干,從嚴格的技術上看也似乎是文不對題,但Siri會根據上下文、人類歷史以及能夠理解一般人類語言的人工智能去分析,并在多數情況下領會你的意思。
打個比方,你想小睡一會,并準備上個鬧鐘,只需要說“20分鐘后叫醒我”。如果你想查閱后面的日程安排,你可以說:“我今天接下來都有什么事?”
這些語句中既不包括會用到的應用程序名稱,也不包括所需數據的名稱。Siri仍然能夠理解。
對人類而言,這些句子再平常不過了。但要讓機器去理解這些變化多端的棘手詞匯,就是人工智能的圣杯了。
而更加人性化的特點是,一旦你開始和Siri進入一段對話,它甚至能理解許多含義模糊或者引申的語義。比如,你可以問它:“步行范圍內有沒有什么頂尖的意大利餐館?”如果Siri查詢后回答“沒有”的話,你可以說:“那墨西哥的呢?”Siri會將你的這個問題連同上文的“頂尖的餐館”和“步行范圍”一道進行理解。
Android的Voice Actions做不到這樣的事情,因為它是一個聲控命令軟件,而并非人工智能。
Siri有時會為你顯示網頁搜索的結果,有時能替你執行一些操作,有時能夠直接控制iPhone里的應用程序。
而且Siri同樣能夠回答問題,這要歸功于它整合的Wolfram-Alpha。你可以隨機提問:“30英里是多少公里?”,“巴黎現在幾點?”,“鋼琴上有多少個八度?”,或者“天空為何是藍色的?”Siri能夠直接回答這些問題。不是唰地顯示一個網頁。就是回答你的問題。
關于Siri,重中之重是什么?
從歷史和文明的角度來看,關于Siri,最偉大的事情并非人工智能本身。而是蘋果通過Siri把人工智能帶進了現實生活中。
理由就是:蘋果將Siri做成了iPhone的一個核心組成部分,并且讓它作為手機使用的主流,讓每個用戶都覺得除了使用很方便之外,更想時時刻刻都嘗試使用它。
提到“主流”,我指的是撿起那些被人類文明邊緣化了的東西,并使其成為大量人群每日生活的一部分。現在,Google出品的Voice Actions不得不面臨被邊緣化的境地。一般人甚至都沒聽說過它。
Siri會成為主流的。人們會逐漸熟知它,甚至包括非iPhone用戶。
愛迪生并不是發明燈泡的人。他是通過產品設計和市場營銷,將燈泡變為主流的人。
福特并不是發明汽車的人。他是通過控制成本和市場營銷,將汽車變為主流的人。
我們總是記住那些將事物變成主流的人,因為正是這些人和公司讓科學技術真正融入每個人每天的生活。于是,說道燈泡,它就溯源于愛迪生;說道汽車,它就溯源于福特。
Google的Voice Actions并非人工智能,雖說它確實讓用戶省去了打字輸入、觸摸操作的工序,只需要使用聲音去控制機器就可以完成一系列事情。但是,Voice Actions最終沒有讓聲控成為主流。或許一些極客們會學著使用它吧。
然而,媽媽們會選擇Siri。
And One More Thing(還有一件事)
iPhone 4S也許會成為第一款支持藍牙4.0的手機,這項技術可以降低能耗,同時可以做到一件非常特別的事:喚醒設備。
如果把Siri和這項無線技術結合起來,其使用范圍就更加廣泛了。例如,可以想象你戴著一款“超長待機”手表,它會一直睡眠,你觸摸它才會顯示時間,或者在iPhone收到短信時,手表會被Siri喚醒。你如果要和Siri交談,只需要對著手表說話就可以了,甚至連手機都不用掏出來。
同樣,可以試想一下,有這么一款桌面麥克風,當你說話時會喚醒iPhone,就像《星際迷航》里那樣不用按任何按鈕直接說話,并從企業號,呃我是說iPhone的人工智能,得到回應。
那么讓我們來總結一下Siri對于人類而言意味著什么。Siri是人機交互新紀元的黎明,是大眾進入真正的人工智能時代的開端。
當然,目前它尚未達到完美,蘋果目前將其定位在“beta”階段。并且,它也還不是你在科幻電影里看到的那種無限高能的人工智能。
但它的步伐遠未停止。iPhone 4S里的Siri只是一個開端。相信以后會有更加復雜的版本出現。
Google、微軟和其他公司也終會拿出自己的人工智能產品的(并且我預言就是按照這個排序)。
所以,一旦你最終和Siri搭上話了,請善待它。Siri具有非常非常重大的現實意義,和以往任何產品都不同。它能夠代表計算機發展的一個新紀元。當然,它會讓每個人都“說”起來的。
推薦閱讀
民警立即逐一對手機進行檢查,結果發現其中一部手機中還存有這樣一條短信,“你偷了我的手機,要不立即還給我,我就報警>>>詳細閱讀
本文標題:揭秘iPhone4S語音識別系統
地址:http://www.brh9h.cn/a/01/20121229/106065.html