隨著今年Google的Android Wear以及Apple的Watchkit相繼發布,智能手表的話題越來越火。在所有關于智能手表的爭論中,一個問題顯得尤為重要:最適合智能手表的交互方式是什么?
智能手表的自我修養:自由、安全感、活在當下

一塊合格的智能手表,除了可以耍帥看時間外,還應該能夠讓用戶獲得生理和心理上的自由:即使雙手不接觸設備,也能方便地啟動設備和發布指令;即使視線并不鎖定在屏幕上,也能用眼角的余光快速獲得最重要的信息。
同時,智能手表還應能及時推送最相關的資訊,過濾垃圾信息和噪音,給予用戶隨時在線的安全感,以便用戶專注于最重要的事情。
簡而言之,智能手表不應該是戴在手腕上的縮小版智能手機、另一個信息干擾源,而應幫助用戶更好地活在當下,享受生命的真實和美好。
語音交互為何強:簡單、直接、零學習成本
智能手表的天然限制(小屏幕、運動行進中的晃動場景)對其人機交互也提出了更高的要求:無論是用戶輸入還是最終的結果展現,都要簡單快速、自然直接。
在這樣的約束下,沒有語音而只有觸控的“智能”手表必將會是一場災難。智能手表的小屏幕決定了其不適合精確的鍵盤輸入及觸控手勢,試想一下,在那塊伸出兩根纖細的手指就能幾乎遮擋整個表盤的狹小屏幕上,要求用戶用指尖去進行小心翼翼的精確點擊輸入,那將會是多么尷尬;當行走在寒風中,雙手提著大包小包的購物袋時,你不太可能騰出雙手去觸摸手表;另一些場景下,不合理的交互方式甚至會危及生命安全。
比如在駕駛汽車的時候,用戶需要的是精神目光集中在路面,雙手隨時緊握方向盤和換擋機構。這時候用手去操作智能設備,哪怕是多一秒種的分心,都可能換來生命的代價…… 在這種情況下,如何減少觸摸操作,解放雙手,與機器進行自然直接的交互便顯得尤為重要。
日常生活中,語言是人與人交流的最常用和直接方式。在電影《星際穿越》中男主角馬大少與機器人TARS 對話式的交互令人印象深刻。即使身陷五維空間,馬大少依然可以用自然語言向TARS咨詢信息和下達自然語音指令。電影雖然虛構,但這樣的交互著實令人神往。自然語言對話式的交互,即使是老人和小孩也無需學習。用戶可以“無感”地喚醒設備,“無縫”地獲取信息、給予指令,毫無生澀和違和感,這才是最好的智能設備交互方式。
從科幻回到現實,目前的智能手表大多仍以觸控交互為主,盡管Android Wear和Apple Watch都在有意簡化觸控并引導用戶更多地使用語音交互,但功能仍未盡善盡美,尤其在國內Google Now和Siri的中文識別體驗更是不盡如人意。谷歌蘋果尚且如此,更不用說其它一些備受用戶“神吐槽”的各種語音交互軟硬件了。
那么問題來了,既然語音是最簡單直接的交互方式,為何現在難以成為主流,甚至仍被用戶詬病呢?
真正的癥結在于目前的語音交互技術尚不能達到人類的預期。由于環境噪音、網絡不穩定等先天因素,使得很多時候系統并不能很好地接收用戶的語音輸入。即使系統聽到了用戶的語音并成功將其轉化為準確的文本(語音識別),目前的算法也不能完全理解用戶的真實本意(即語義識別),更不用說后續的準確搜索執行和結果呈現了。
目前市面上很多所謂的人工智能語音,大部分還是要求用戶按照預置命令模板進行交互,用戶需要付出較大的學習成本來適應機器。比如在某些所謂的“智能”車載設備上,用戶必須說先說“導航”啟動導航界面,然后說“北京”、“某區某街道”, 機器才能一步步識別找到目的地。如果用戶直接說 “我要去某地”,機器是無法識別你的意圖的。甚至有時用戶已經按照預制模板來進行交互了,卻仍然得不到想要的結果。太多時候,機器聽不清楚,也聽不懂用戶在說什么。這樣的人工偽智能,本身技術不成熟,營銷宣傳的時候又盲目夸大,導致了用戶對語音交互產品的進一步失望。
漸進式革命:短期“觸控+初級語音”,長期“全智能語音”

顯然,生硬的預制語音命令肯定無法滿足用戶的需求。真正的人工智能語音交互,應該讓機器來學習和適應人,而不是讓人去適應機器。比如,機器應該可以在識別當下地點和時間的基礎上,基于用戶歷史操作數據,進行用戶喜好學習,深入地理解用戶的語音輸入,給出最佳的答案。用戶無需多說,機器便可以準確判斷用戶意圖并高效地執行。這樣的交互,才是“心有靈犀,說到做到”,才能算真正的智能語音交互。
短期來看,智能手表交互采取的方式將是傳統的觸控交互與初級的智能語音交互的結合。觸控操作仍將應用于絕大多數場景,但在一些特定場合簡單的任務下,語音交互可以讓用戶更加快捷、方便、優雅的實現操作目的。第一代智能手表的領軍產品,可以沒有復雜成熟的語音交互,但至少需要有初級的語音系統,可以做到與觸控操作并存互補。而長期來看,智能語音交互必將逐步取代觸摸等傳統交互方式, 實現人與人對話式的自然語言交互。
其實,讓用戶使用語音與機器系統交互并不存在習慣問題,因為自然語言交互本身的學習成本幾乎為零。關鍵在于語音交互是否真正可為用戶帶來便利,因為人的“懶惰”天性永遠會趨向選擇最小投入,最大產出的操作路徑。這種例子其實已經不在少數:一旦你習慣了iPhone上的TouchID指紋解鎖、Macbook上的多點手勢操作,便會覺得“輸密碼”和“點鼠標”是種非常“反人性”的交互;一旦你習慣了攝像頭“掃一掃” 二維碼,便不會再喜歡“ Ctrl C + Ctrl V”的粘貼復制網站地址;一旦你習慣了手機支付寶上簡單快捷的支付,就會開始厭煩用銀行卡或者現金進行繁瑣的交易... … 未來,一旦你習慣了一抬手問“明天會下雪嗎?”,還會愿意回到手機上從無數的App中打開天氣程序去查看天氣嗎?
什么時候是語音技術的奇點?
能否盡快的實現真正的智能全語音交互,在根本上還是取決于技術的進步和產品的完善。用戶看似簡短的一個個語音指令輸入的背后涉及到了整合優化語音識別、自然語言處理、機器學習、大數據、精準搜索等諸多技術難點,難度可想而知。令人鼓舞的是,過去的幾年內,人工智能語言技術已經有了長足的發展。現在的語音識別技術在大多數時候已經能夠比較準確的識別用戶的語言文字。隨著技術和產品的高速成熟和發展,全智能語音時代的到來絕不會太久。智能語音技術“奇點爆發”之時,便是傳統觸摸操作和繁瑣的App交互的終結之日。
總之,智能手表作為語音交互的最合適應用場景之一,從誕生的第一天起,就注定離不開智能語音技術。作為狂熱的極客和理性的用戶,我們允許一塊智能手表目前暫時沒有真正的“智能語音”,但我們絕不接受因噎廢食,退而求其次的妥協。因此,沒有語音交互,別跟我談智能手表。
推薦閱讀
騰訊數碼訊(趙陽)近日,卡西歐了推出旗下電波太陽能手表OCEANUS系列旗艦新品OCW-G1000。該款OCW-G1000擁有GPS衛星信號接收和六局電波接收兩種不同的時間校正模式>>>詳細閱讀
本文標題:沒有語音交互,不談智能手表
地址:http://www.brh9h.cn/n/shoubiao/243.html
1/2 1