按:本文作者孫鵬,小米生態鏈總監。

Amazon的Echo意外獲得了成功之后,現在大家都在跟風,就連大廠Google也在前幾天發布了自己的Google Home,其實就是一個Echo的翻版。其實這兩個產品的最大的特色并不是語音對話,而是更自然的交互,也就是遠場的語音識別。
語音對話從Apple的Siri開始,那是很久以前的事了,那一年喬布斯還在世。現在在智能手機里面已經是標配了,我個人覺著國外Google做的好一點,Microsoft和Apple也還可以,Amazon倒是后起之秀;國內訊飛和百度差不多,騰訊和阿里都在自己研發類似技術,還有一些小公司也在做。除了語音助手,智能電視遙控器里面也很普及,比如按住小米電視遙控器的Home鍵,然后就可以說要看什么電視劇或者電影,系統就會幫你找到。
但是不論是手機上的語音助手還是電視等設備的遙控器,用戶對于語音的接受度并不高,只有百分之幾的使用率。
我覺著原因第一是體驗不夠好,尤其是在國內,對話的體驗很差,經常上句不接下句,做個Demo還可以,日常用經常要罵娘。
第二是有可以替代的體驗,手機上可以觸摸,電視上可以上下左右選擇,還都有很好的屏幕的視覺反饋,語音并不是必須的。
那為啥同樣的技術放在智能家居里面大家就覺著這個體驗好了呢,我猜有兩個原因:
一是智能家居用戶基數少,以能折騰的玩家為主,對于語音的接受度高,用戶的學習能力也強,就算是體驗不好用戶也能自我糾正。
二是遠場語音識別的體驗已經可用了,而音箱這樣的設備并沒有別的輸入輸出形式,只能用語音,沒有比較也就沒有互相傷害。
遠場語音識別主要靠的是硬件,靈敏度更好的麥克風陣列,可以定向識別語音,強大的噪聲消除算法,可以在有環境噪音的時候分辨出人聲。這類硬件成本目前還在人民幣一百元以上,而普通的一個麥克風也就幾塊錢成本,這也就是為什么帶遠場語音識別的設備都比較貴了。即使是有了好的硬件,也要做一些體驗的優化,比如喚醒詞,音節越多對比越大越好,Amazon的Echo的喚醒詞是“Alexia”,Google Home的喚醒詞是“OK Google”,這樣才能保證高的準確率和低的誤識別率。
插播廣告,小米生態鏈企業上海創米做了一個高端的攝像頭,名字叫小白。設計的時候也有語音識別功能,放了兩個麥克風,用的是訊飛的語音識別算法,已經是國內最好得了。實際測試的時候發現,只能在一米以內才能把提體驗做好。喚醒詞最早的時候是“小白”,實測發現誤識別率很高,后來改成了“小白小白”,好了一些。鑒于它是一個攝像頭,最終改成了“小白看過來”,它聽到后會把頭轉過來,還是很萌的,有這款產品的可以試試。研發團隊正在研發二代,估計會加入遠場語音識別,價格也會高一兩百塊錢。
廣告結束,說一下我的一點淺見。
這類語音對話設備只是一個開始,將來也未必是音箱這種形態,關鍵是技術成熟,成本用戶可以接受。這樣你可以對著空調說話,對著燈說話,它們都會聽你的,仿佛這些設備都有了生命。而用戶也很自然的接受這些設備是可以對話的,那個時候才是語音對話設備的爆發期。
用戶對于這類體驗的向往已經有了上千年,也體現在很多文學作品里面。比如《白雪公主》,里面的女王有一個魔鏡,那就是一個非常典型的語音識別設備,喚醒詞是“魔鏡、魔鏡告訴我”,可能當時的技術還不太成熟,要這么多音節才能喚醒。魔鏡背后是強大的搜索能力,比如“誰是世界上最美麗的女人”,現在Google已經有那么個意思了,強大的深度學習能力,回答這個問題是小菜一碟。除了搜索,還有其它服務的整合,比如百度還能給你送外賣。
推薦閱讀
智能家居開始流行于上世紀七十年代的美國,并且在歐洲有很大的應用。如今,智能家居產品在國外有些國家已經像普通商品一樣被擺在超市里銷售。很多人最先了解"智能家居>>>詳細閱讀
本文標題:OK Google,我們來談談那些智能家居里的語音對話設備
地址:http://www.brh9h.cn/n/jiaju/1352.html
1/2 1