無(wú)論是傳統(tǒng)電視還是 智能電視,要解決的問(wèn)題都是一樣的,即“如何讓用戶(hù)方便地獲取內(nèi)容”。這里有兩個(gè)關(guān)鍵點(diǎn):“方便”和“內(nèi)容”。在方便性上,傳統(tǒng)電視和 互聯(lián)網(wǎng)電視差不多,都是基于遙控器進(jìn)行人機(jī)交互;“內(nèi)容”是傳統(tǒng)電視和互聯(lián)網(wǎng)電視最大的不同點(diǎn),這個(gè)無(wú)需贅述。而人工智能技術(shù)的長(zhǎng)足發(fā)展,正在這兩個(gè)關(guān)鍵點(diǎn)上都大大提升了用戶(hù)使用體驗(yàn)。
關(guān)鍵詞:人工智能 人機(jī)交互 深度學(xué)習(xí) 遠(yuǎn)場(chǎng)語(yǔ)音 NLP 自然語(yǔ)言處理 ASR 語(yǔ)音識(shí)別
“人工智能(AI)”的概念 1956年就已經(jīng)出現(xiàn)了,但是受限于當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算能力和算法理論,并沒(méi)有應(yīng)用于實(shí)際生活,了解的人自然不多。隨著 GPU 能力和深度學(xué)習(xí)理論的發(fā)展,人工智能技術(shù)終于從實(shí)驗(yàn)室理論進(jìn)入到產(chǎn)品化階段,在各個(gè)領(lǐng)域開(kāi)始突飛猛進(jìn)。互聯(lián)網(wǎng)電視就是其中之一。
在討論電視應(yīng)用人工智能技術(shù)之前,需要理清一些基本概念:所謂人工智能是指人造機(jī)器表現(xiàn)出來(lái)的智能。 這種智能可能模擬人的思考,也可能完全異于人,目前階段研究的核心主要還是“像人一樣自我學(xué)習(xí)”。機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支,深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的一個(gè)分支。完全異于人思考方式的研究,還是個(gè)天馬行空的哲學(xué)問(wèn)題。
無(wú)論是傳統(tǒng)電視還是互聯(lián)網(wǎng)電視,要解決的問(wèn)題都是一樣的,即“如何讓用戶(hù)方便地獲取內(nèi)容”。這里有兩個(gè)關(guān)鍵點(diǎn):“方便”和“內(nèi)容”。在方便這點(diǎn)上,傳統(tǒng)電視和互聯(lián)網(wǎng)電視差不多,都是基于遙控器人機(jī)交互;“內(nèi)容”是傳統(tǒng)電視和互聯(lián)網(wǎng)電視最大的不同點(diǎn),這個(gè)無(wú)需贅述。而人工智能技術(shù)的長(zhǎng)足發(fā)展,在這兩個(gè)關(guān)鍵點(diǎn)上都大大提升了用戶(hù)體驗(yàn)。
先說(shuō)方便,由于人工智能技術(shù)在自然語(yǔ)言處理(NLP)領(lǐng)域已經(jīng)能夠達(dá)到 90% 的意圖識(shí)別率,所以直接使用自然語(yǔ)言控制電視獲取內(nèi)容成為可能。這里要強(qiáng)調(diào)的是“自然語(yǔ)言”,類(lèi)似“給我來(lái)點(diǎn)跟《教父》一樣水準(zhǔn)的歐洲黑幫電影”這樣的語(yǔ)言才是自然語(yǔ)言,而不是某些品牌廠商經(jīng)常使用的“音量增加百分之二十”這樣的“機(jī)器語(yǔ)言”。對(duì)自然語(yǔ)言的理解和反饋是衡量一臺(tái)電視機(jī)人工智能水平的關(guān)鍵指標(biāo)之一。
前幾年用語(yǔ)音遙控的電視并不能叫做 人工智能電視,最主要的原因就是只能識(shí)別固定的指令,而人工智能電視不僅能夠理解自然語(yǔ)言,而且能夠聯(lián)機(jī)自我學(xué)習(xí),舉一反三理解更多用戶(hù)的意圖,越用越準(zhǔn)確。
人類(lèi)在對(duì)話(huà)過(guò)程中,會(huì)自動(dòng)帶著上下文。比如用戶(hù)在第一次對(duì)話(huà)中問(wèn):“有什么好看的電影”,接下來(lái)他可能會(huì)問(wèn)“不要好萊塢的”或者“只看今年的”,這種對(duì)話(huà)方式都是基于上下文的對(duì)話(huà),我們叫做多輪對(duì)話(huà)。是否支持多輪對(duì)話(huà)也是衡量一臺(tái)電視人工智能水平的關(guān)鍵指標(biāo)。
除了語(yǔ)義理解,方便性還體現(xiàn)在遠(yuǎn)場(chǎng)收聲能力。它可以讓用戶(hù)不再需要拿著遙控器“按住說(shuō)話(huà)”,而是在客廳的任意位置呼喚電視和它對(duì)話(huà)。典型的場(chǎng)景是:“ 暴風(fēng)大耳朵,最近有什么好看的片子推薦?”、“魚(yú)香肉絲怎么做?”、“明早七點(diǎn)提醒我去機(jī)場(chǎng)”。
47F59476D4B96C6E7B9ED75372C5DD6351C82B4C_size188_w690_h379.png (191.61 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2017-11-28 21:03 上傳
遠(yuǎn)場(chǎng)收聲是通過(guò)麥克風(fēng)陣列實(shí)現(xiàn)的,麥克風(fēng)陣列以前一直是實(shí)驗(yàn)室的研究對(duì)象,直到亞馬遜推出 Echo 智能音箱,終于實(shí)現(xiàn)了規(guī)模產(chǎn)品化。麥克風(fēng)陣列最少需要兩顆麥克風(fēng),目前市面上有 4Mic、6Mic 甚至 8Mic 方案。陣列可以從背景噪音中感知用戶(hù)說(shuō)話(huà)的特殊波形,通過(guò)波束成形技術(shù)準(zhǔn)確地向用戶(hù)所在位置的方向定向收聲,忽略其他方向的雜音。廠商會(huì)根據(jù)設(shè)備的特性選擇不同的麥克風(fēng)陣列,一般來(lái)說(shuō)電視用的是線(xiàn)性麥克風(fēng),智能音箱采用的是環(huán)形麥克風(fēng)。
B9CBC07302F2C73F002E1CC30487A1A8ACC2F620_size189_w692_h339.png (190.58 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2017-11-28 21:03 上傳
筆者一直關(guān)注亞馬遜 Echo 的發(fā)展,在實(shí)際體驗(yàn)過(guò)程中發(fā)現(xiàn),純粹的語(yǔ)音交互目前還存在比較大的缺陷,反而是把遠(yuǎn)場(chǎng)語(yǔ)音應(yīng)用于電視后體驗(yàn)會(huì)更好。舉個(gè)例子,用戶(hù)面對(duì)一個(gè)完全沒(méi)有顯示的智能音箱,基本上不知道該怎么說(shuō)才能操作;而面對(duì)有大屏的電視,用戶(hù)的緊張感會(huì)減輕很多,因?yàn)槠聊粫r(shí)時(shí)刻刻在提醒用戶(hù)當(dāng)前可以說(shuō)什么樣的話(huà)來(lái)操作電視。谷歌把這種交互方式叫做“視覺(jué)反饋”,并把這種反饋交互模式應(yīng)用于今年十月份剛發(fā)布的最新的“Google Assistant for Android TV”系統(tǒng),目前暴風(fēng) AI 電視的交互也是類(lèi)似的模式。
6BB371170150A0D5B54611DA48F98E219020D02F_size169_w663_h413.png (181.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2017-11-28 21:03 上傳
與此同時(shí),亞馬遜也意識(shí)到這個(gè)問(wèn)題,并很快推出了帶有屏幕的“Echo Show”作為補(bǔ)充。
目前最新的技術(shù)已經(jīng)不僅能夠識(shí)別人聲,而且能夠區(qū)分不同人的聲紋,實(shí)現(xiàn)更加高級(jí)的操作,比如購(gòu)物、支付和個(gè)性化推薦。國(guó)外的亞馬遜和谷歌,國(guó)內(nèi)的訊飛、若琪都擁有該項(xiàng)技術(shù)。
自然語(yǔ)言理解能力和遠(yuǎn)場(chǎng)語(yǔ)音處理能力最終會(huì)讓電視機(jī)用戶(hù)擺脫遙控器,在人機(jī)交互上產(chǎn)生巨大的飛躍,這種飛躍不亞于當(dāng)年蘋(píng)果推出沒(méi)有鍵盤(pán)只有觸摸屏的 iPhone 手機(jī)。
再說(shuō)內(nèi)容,除了自然語(yǔ)言理解,人工智能在個(gè)性化內(nèi)容推薦上的應(yīng)用其實(shí)更廣泛。 AI 可以從大量用戶(hù)對(duì)話(huà)和用戶(hù)行為中抽象整理出用戶(hù)的“話(huà)外音”,了解用戶(hù)的喜好習(xí)慣,然后根據(jù)這些特征主動(dòng)推薦用戶(hù)可能喜歡的內(nèi)容給他。
有時(shí)候,系統(tǒng)會(huì)推薦給某個(gè)用戶(hù)從來(lái)沒(méi)有接觸過(guò)的內(nèi)容類(lèi)型,用戶(hù)會(huì)驚呼“原來(lái)這個(gè)這么好看”,他可能自己都沒(méi)有意識(shí)到這種內(nèi)容會(huì)對(duì)自己的胃口。這種智能推薦已經(jīng)在互聯(lián)網(wǎng)產(chǎn)品中大量應(yīng)用,典型的就是今日頭條。
傳統(tǒng)的個(gè)性化內(nèi)容推薦主要是基于標(biāo)簽體系。首先運(yùn)營(yíng)人員要對(duì)所有的內(nèi)容“打標(biāo)簽”,比如“恐怖”、“熱血”、“二次元”、“都市”等等,工作量極其巨大,而且準(zhǔn)確與否完全依賴(lài)于運(yùn)營(yíng)人員的水平;然后系統(tǒng)再根據(jù)用戶(hù)行為對(duì)用戶(hù)進(jìn)行畫(huà)像,抽取標(biāo)簽進(jìn)行匹配。這個(gè)過(guò)程中誕生了各種專(zhuān)業(yè)的推薦算法,技術(shù)人員隨時(shí)調(diào)整各項(xiàng)參數(shù)優(yōu)化算法,提高打開(kāi)率。
基于 AI 的個(gè)性化推薦系統(tǒng)和傳統(tǒng)推薦系統(tǒng)有區(qū)別也有聯(lián)系,區(qū)別最大的地方就是標(biāo)簽體系。AI 推薦系統(tǒng)里的“標(biāo)簽”實(shí)際上是系統(tǒng)自動(dòng)從內(nèi)容和行為日志等記錄里自動(dòng)提取的,不需要運(yùn)營(yíng)人員的參與。例如從電影的元數(shù)據(jù)(主演導(dǎo)演簡(jiǎn)介等)里分詞提取屬性標(biāo)簽,從用戶(hù)的微博、豆瓣評(píng)論里分詞提取用戶(hù)的屬性標(biāo)簽,然后依托 GPU 芯片進(jìn)行大規(guī)模的矩陣運(yùn)算,把高維度的向量數(shù)據(jù)逐步降維,最后簡(jiǎn)化到三維空間,根據(jù)三維空間里的聚集情況給出推薦。原理類(lèi)似于傳統(tǒng)推薦系統(tǒng)里的“協(xié)同過(guò)濾”。簡(jiǎn)單講,就是假設(shè)一個(gè)人喜歡某個(gè)電影,那么他的好朋友也有可能喜歡那個(gè)電影。
“千人千面”的個(gè)性化推薦反過(guò)來(lái)又推進(jìn)了電視界面的變化。 傳統(tǒng)電視用“節(jié)目排播表”概念來(lái)編制頻道,用戶(hù)愛(ài)看不看錯(cuò)過(guò)了就等下次;互聯(lián)網(wǎng)電視則完全基于點(diǎn)播模式,海量?jī)?nèi)容給你隨便看自己找不到別怪我;基于AI 的智能電視則是把傳統(tǒng)的“人找內(nèi)容”變成了“內(nèi)容找人”,AI 把你可能喜歡的菜端到你面前,先嘗后買(mǎi)。
“嘗”就是給用戶(hù)預(yù)覽完整影片中的精彩橋段,用短片引導(dǎo)用戶(hù)看長(zhǎng)片,降低了用戶(hù)的選擇難度節(jié)省了用戶(hù)的時(shí)間。
3E1BB5E81202B05FF1851E54FACBB577DB9F3FDA_size575_w1145_h650.png (652.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2017-11-28 21:03 上傳
請(qǐng)注意,精彩橋段可不僅僅是電影的宣傳 VCR,如何挑選橋段也是一門(mén)學(xué)問(wèn),可以另起一篇了。
更大的可能性
人工智能在電視應(yīng)用的場(chǎng)景不僅僅是人機(jī)交互和影視內(nèi)容推薦,它可以用來(lái)做任何內(nèi)容服務(wù)的推薦。前面講到使用遠(yuǎn)場(chǎng)語(yǔ)音改變了電視的人機(jī)交互模式,所以電視界面不再受傳統(tǒng)電視的樹(shù)狀菜單結(jié)構(gòu)束縛,可以容納更多的內(nèi)容服務(wù),并且用戶(hù)可以直達(dá)服務(wù)。
具備人工智能特點(diǎn)的電視,典型的使用方法是這樣的:
●“幫我找個(gè)八十年代的經(jīng)典文藝片看看”; ●“隨便放點(diǎn)周杰倫的歌”; ●“再買(mǎi)點(diǎn)上次買(mǎi)過(guò)的那種三元牛奶”,“對(duì)”,“再買(mǎi)兩盒”; ●“去大鴨梨怎么走”,“對(duì),就是最近的那家”; ●“半小時(shí)后提醒我關(guān)火”; ●“晚安(關(guān)閉家里的智能電器設(shè)備,并且讓電視機(jī)休眠)”。
可以看到,應(yīng)用人工智能技術(shù)的電視機(jī)已經(jīng)大大超越了傳統(tǒng)電視機(jī)的使用方法和使用范圍。電視機(jī)可以幫用戶(hù)挑選內(nèi)容,挑選服務(wù),幫用戶(hù)控制智能家電,提醒用戶(hù)備忘,甚至幫用戶(hù)下單購(gòu)買(mǎi)日常用品等等。上述這些不是設(shè)想的場(chǎng)景,而是已經(jīng)成為現(xiàn)實(shí)的場(chǎng)景。
電視還是電視,但電視機(jī)已經(jīng)早已不是電視機(jī),它已成為家庭助手的一個(gè)大屏終端。而這個(gè)“家庭助手”的大腦,就是人工智能。
智能電視的未來(lái)發(fā)展將會(huì)超出我們的想象, 智能電視網(wǎng)會(huì)持續(xù)關(guān)注,想了解更多內(nèi)容可以搜索關(guān)鍵詞查詢(xún)。
|