近些年我們在高談闊論顯示技術(shù)和內(nèi)容供應(yīng)時,似乎越來越淡化了另一個直觀問題:在電視上的人機交互。直到前些天蘋果2015年秋季新品發(fā)布會上,演示Apple TV中Siri強大語的音識別和檢索能力時,人們才嘆為觀止,原來語音操控也可以如此智能和流暢。這也讓Apple TV成為了媒體筆下本屆蘋果新品發(fā)布會的一匹黑馬。
QQ截圖20151207100737.png (216.31 KB, 下載次數(shù): 2)
下載附件
保存到相冊
2015-12-7 10:07 上傳
五味雜陳的電視語音交互
語音交互早不是什么新鮮事了,可以追溯到十幾年前的功能機時代。它最初的形態(tài)是以語音撥號來實現(xiàn)交互,后來進一步發(fā)展到語音打開應(yīng)用、發(fā)短信等。今天的語音技術(shù)可以實現(xiàn)的功能越來越豐富了,人機交互的浪潮一再涌起。但是,功能雖然豐富,體驗卻一直不盡人意。有時候沖著電視遙控器重復(fù)說了半天,它回復(fù)給你的依然是“驢唇不對馬嘴”,這個時候你肯定再也沒有使用它的欲望了。 -我想看綜藝節(jié)目
-抱歉,我沒聽清楚您講話
-上網(wǎng)聽歌
-即將為您打開本地音樂應(yīng)用
-昨晚的電影沒看完,我要接著看。
-抱歉,…………( 簡直雞同鴨講)
6962116_3_thumb.jpg (58.67 KB, 下載次數(shù): 4)
下載附件
保存到相冊
2015-12-7 10:16 上傳
三段對話展示了目前大部分電視語音交互三大雞肋:識別率低、語意分析差、太“低能”。無論是電視廠商自主研發(fā)的語音助手,還是應(yīng)用市場一撈一大把的第三方應(yīng)用,筆者都禁不住要吐槽一下,如此糟糕的智能算法、如此貧乏的數(shù)據(jù)匹配、都不用聯(lián)網(wǎng)也敢做的語音助手。這樣的語音交互更像是設(shè)定好的一個對話和指令,完全談不上智能。
6962116_apple-tv-siri_thumb.png (206.81 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2015-12-7 10:16 上傳
當然現(xiàn)在還是有一些語音交互做的不錯的,如蘋果的Siri、微軟的Cortana。蘋果發(fā)布會上演示Apple TV時,它強大的Siri似乎在炫耀,我也可以和電視盒子配合得天衣無縫。當試用者說出“Show me funny tv shows”時,Apple TV立馬檢索到了所有的喜劇并列出;如果你在觀影過程中有一句沒有聽清楚便可詢問它,這時Siri會回放之前的內(nèi)容,并智能的添加上字幕;如果你在觀影過程中想了解昨天的球賽結(jié)果如何,你就可以直接詢問Siri,它能在不中斷當前播放的情況下在屏幕下方顯示出昨天那場錯過了的比賽的勝負情況。整個操作反應(yīng)的過程一氣呵成。
在昨天更新的iOS9正式版中,蘋果還進一步優(yōu)化了Siri,可以“嘿Siri”培訓(xùn)它,讓它更好的識別主人的聲音。
6962116_cortana__thumb.jpg (33.08 KB, 下載次數(shù): 4)
下載附件
保存到相冊
2015-12-7 10:16 上傳
而Cortana則更像是大數(shù)據(jù)時代,微軟的一次人工智能方面的嘗試。用戶與小娜的智能交互,不是簡單地基于存儲式的問答,而是對話。它會記錄用戶的行為和使用習(xí)慣,利用云計算、搜索引擎和“非結(jié)構(gòu)化數(shù)據(jù)”分析,讀取和“學(xué)習(xí)”包括智能設(shè)備中的文本文件、電子郵件、圖片、視頻等數(shù)據(jù),來理解用戶的語義和語境,從而實現(xiàn)人機交互。網(wǎng)絡(luò)上也曾一度流傳各種調(diào)侃微軟小娜和小冰的段子,其強大的語義分析和靈活的回答方式是目前智能語音當之無愧的王者。 2智能電視為什么要語音交互
智能電視為什么要語音交互 現(xiàn)階段大部分智能電視的語音交互提升的空間都還很大,那有人要問了,我為什么一定要語音助理呢?我用遙控其一樣很爽呀,而且現(xiàn)在大部分遙控都有方便的快捷鍵以及豐富的體感操控,沒必要對著遙控器說話。很榮幸的告訴你提出這種質(zhì)疑說明你還不夠“懶”,沒有懶得不愿意動彈就想看到自己喜歡的電視內(nèi)容。但是又很遺憾的告訴你,大多數(shù)的黑科技都是為“懶人”盛裝準備的。
6962116_35769351692483564_thumb.jpg (40.93 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2015-12-7 10:16 上傳
究其根本,語音功能只是電視介入互聯(lián)網(wǎng)搜索的方式之一,不過它對人工智能的要求非常高,語言是人類獨有的文明傳播方式,要讓電腦理解它浩大的語境語義,難度非常之高。但是如果換一個角度想,將語音當作用戶使用習(xí)慣的收集工具,將大數(shù)據(jù)統(tǒng)計處理,然后反哺到語音功能的體驗上,那么智能語音的發(fā)展會不會既完善又迅速呢?
6962116_538-131121104605414_thumb.jpg (34.58 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2015-12-7 10:16 上傳
非智能電視時代當我們打開電視時,看到的就只是電視,不會出現(xiàn)一個主頁面,也不會有那么多圖標點來點去,我們只在乎我們打開電視馬上就能看到什么。我希望智能電視也是這樣,把所有軟件都放在另外一個界面里。當你累了一整天不愿意動彈,回家就想看點自己喜歡的節(jié)目打發(fā)時間,如果只需要對著電視說“開機”他就能自動跳轉(zhuǎn)到你喜歡的電視節(jié)目中,那該是多么愜意。
6962116_343d2aa446a9d5b83a45a31548c1c568_thumb.jpg (32.59 KB, 下載次數(shù): 4)
下載附件
保存到相冊
2015-12-7 10:16 上傳
如果你不希望語音助理替你思考,那么你需要做得事情是通過語音助手來搜索,而且它能很迅速的找到你想要的內(nèi)容,把那些需要特定服務(wù)、特定地址、糟糕畫質(zhì)的電視節(jié)目統(tǒng)統(tǒng)排除掉,為你提供最優(yōu)的選擇,就像精準的搜索引擎一樣。
6962116_41_thumb.jpg (63.75 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2015-12-7 10:16 上傳
語音交互帶來的是繼搜索引擎、瀏覽器、智能手機OS之后,第四代的入口。智能電視的語音交互能讓你迅速的回到電視的根本,打開電視看電視節(jié)目,就這樣而已。
總結(jié):自從智能設(shè)備問世依賴,你有沒有發(fā)現(xiàn)自己對它們的依賴越來越嚴重?與它們的交互越來越頻繁?而且開始覺得現(xiàn)在的操控方式復(fù)雜、效率低下,迫切的需要一種更為簡單的操作方式。語音交互就是智能交互的一個重要的基礎(chǔ),隨著人工算法實現(xiàn)功能上的智能化、大數(shù)據(jù)形成大量的語言模型。智能電視端的語音交互將會突破“聽”,實現(xiàn)“懂”,真正成為你的智能助理。
本文轉(zhuǎn)自PCONLINE
|