一,視頻推薦簡(jiǎn)介 根據(jù)艾瑞咨詢(xún)數(shù)據(jù) [1],2013第二季度中國(guó)在線視頻行業(yè)市場(chǎng)規(guī)模達(dá)28.5億元,同比增長(zhǎng)43.0%,環(huán)比增長(zhǎng)30.6%。隨著網(wǎng)絡(luò)帶寬的增大、智能電視及智能終端的普及,在線視頻行業(yè)增速將繼續(xù)保持。在視頻網(wǎng)站發(fā)展伊始,視頻推薦就應(yīng)運(yùn)而生。視頻推薦根據(jù)當(dāng)前熱門(mén)視頻及用戶(hù)的個(gè)性化數(shù)據(jù),為用戶(hù)提供個(gè)性化的視頻推薦,從而增加用戶(hù)黏度,提高網(wǎng)站流量,是各大視頻網(wǎng)站極為重視的功能之一。 2006年的Netflix大賽是視頻推薦領(lǐng)域的標(biāo)志性事件,該比賽懸賞100萬(wàn)美元,希望研究人員能夠?qū)?/font>Netflix的推薦算法的預(yù)測(cè)準(zhǔn)確度提高到10%,比賽舉辦三年后,由AT&T的研究人員將大獎(jiǎng)捧走。這場(chǎng)比賽吸引了眾多隊(duì)伍參加,并將協(xié)同過(guò)濾(collaborative filtering),關(guān)聯(lián)規(guī)則(association rules),奇異值分解(SVD)等眾多推薦方法應(yīng)用于視頻推薦領(lǐng)域,獲得非常好的推薦效果。這一事件反映出視頻網(wǎng)站對(duì)推薦系統(tǒng)的重視程度,同時(shí)YouTube等公司也在視頻推薦領(lǐng)域進(jìn)行專(zhuān)門(mén)研究[2][5],可見(jiàn)推薦系統(tǒng)在視頻網(wǎng)站中的重要地位。 1.1重要視頻網(wǎng)站推薦系統(tǒng)簡(jiǎn)介 目前幾乎所有的重要在線視頻網(wǎng)站均有視頻推薦功能,本小節(jié)對(duì)主要視頻網(wǎng)站推薦模塊進(jìn)行簡(jiǎn)要介紹。 1) YouTube YouTube是在線視頻行業(yè)的領(lǐng)袖企業(yè),在其網(wǎng)站上線不久就推出簡(jiǎn)單的視頻推薦功能,經(jīng)過(guò)不斷發(fā)展,已經(jīng)發(fā)展為相對(duì)成熟的視頻推薦系統(tǒng)。 根據(jù)YouTube發(fā)布的論文[2]顯示,到2010年,YouTube主要使用基于關(guān)聯(lián)規(guī)則(association rules)的推薦方式進(jìn)行Top-N的視頻推薦。通過(guò)21天的實(shí)驗(yàn)結(jié)果顯示,[2]中的系統(tǒng)比之前按照點(diǎn)擊率進(jìn)行的推薦,效果好上1倍。 2) Netflix Netflix從其舉辦的Netflix Prize[3][4]中獲利頗豐,這項(xiàng)比賽使得其推薦準(zhǔn)確率提高了10%以上,為其帶來(lái)巨大收益。 在Netflix Prize比賽開(kāi)始之初,協(xié)同過(guò)濾(collaborative filtering,CF)表現(xiàn)優(yōu)異,但是隨著比賽的進(jìn)行,對(duì)CF的各種改進(jìn)版本及其他算法不斷應(yīng)用進(jìn)來(lái),推薦效果逐漸提升。 3) Youku 目前查詢(xún)不到有關(guān)Youku視頻推薦系統(tǒng)的資料與文獻(xiàn),但是可以通過(guò)Youku推薦質(zhì)量對(duì)其進(jìn)行分析。 用戶(hù)賬號(hào)為筆者去年注冊(cè)的賬號(hào),已觀看視頻與推薦視頻如圖1、圖2所示。
095155cixkiv8abvfx8pdf.png (404.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
2014-4-12 22:36 上傳
圖1:Youku觀看記錄
0952511clqlkwtkkawcxq3.png (324.72 KB, 下載次數(shù): 9)
下載附件
保存到相冊(cè)
2014-4-12 22:36 上傳
圖2:Youku推薦效果
對(duì)于推薦結(jié)果中,大部分推薦結(jié)果和我收看記錄中的視頻具有較高相似度(收看記錄只列出最近收看記錄),這種推薦效果可以通過(guò)Content-based方法實(shí)現(xiàn)。 但是與已看記錄有一定重合度,視頻推薦泛化性能相對(duì)較差。
二,對(duì)樂(lè)視網(wǎng)視頻推薦的建議
2.1樂(lè)視網(wǎng)目前推薦現(xiàn)狀 樂(lè)視網(wǎng)目前已經(jīng)具有視頻推薦功能,但該功能只在用戶(hù)個(gè)人中心中可見(jiàn),首頁(yè)位置沒(méi)有相關(guān)推薦板塊,對(duì)推薦功能重視程度不足。 下圖是基于賬號(hào)lycan785(已經(jīng)綁定新浪微博hzau_unlearning)的收看記錄與“猜你喜歡”的結(jié)果。
0954326et6blkis1tklja3.png (42.82 KB, 下載次數(shù): 6)
下載附件
保存到相冊(cè)
2014-4-12 22:36 上傳
圖3:賬號(hào)lycan785的播放記錄
095522sosluu11vi1su1b9.png (459.09 KB, 下載次數(shù): 8)
下載附件
保存到相冊(cè)
2014-4-12 22:36 上傳
圖4:對(duì)lycan785賬號(hào)的推薦視頻
該賬號(hào)于2013年10月20日晚注冊(cè),推薦視頻列表是10月21日上午的結(jié)果。其中播放記錄主要選擇“美劇”、“體育”兩個(gè)頻道,并加上了一些噪音數(shù)據(jù)(最先觀看的兩個(gè)視頻),而推薦結(jié)果基本是當(dāng)前熱門(mén)視頻,既和觀看記錄無(wú)關(guān),又和該賬戶(hù)綁定的微博賬戶(hù)興趣無(wú)關(guān),無(wú)法抓住用戶(hù)興趣,可見(jiàn)推薦系統(tǒng)有待提高。
2.2對(duì)樂(lè)視網(wǎng)的建議
基于以上分析,特為樂(lè)視網(wǎng)提出以下建議:
1)重視數(shù)據(jù)采集推薦系統(tǒng)對(duì)數(shù)據(jù)的依賴(lài)性較大,一般來(lái)說(shuō),越完整的數(shù)據(jù)可以產(chǎn)生更加有效的推薦,因此建議樂(lè)視網(wǎng)加大對(duì)數(shù)據(jù)的整合力度。需要重視的數(shù)據(jù)主要有:賬戶(hù)活躍時(shí)間,賬戶(hù)觀看記錄,不同時(shí)長(zhǎng)影片觀看時(shí)間比(觀看時(shí)間占整個(gè)影片時(shí)間的比例),付費(fèi)記錄,賬戶(hù)點(diǎn)評(píng)記錄,賬戶(hù)個(gè)人信息、視頻元數(shù)據(jù)等。
2)賬戶(hù)興趣挖掘了解賬戶(hù)興趣是進(jìn)行推薦的基礎(chǔ),賬戶(hù)興趣可以利用協(xié)同過(guò)濾(CF)等方法從觀看記錄中獲取,同時(shí)可以利用用戶(hù)綁定分享賬戶(hù)獲得用戶(hù)興趣。通過(guò)用戶(hù)觀看記錄,可以在??匆曨l頻道、類(lèi)型、劇集方面挖掘用戶(hù)興趣,這部分工作相對(duì)簡(jiǎn)單,已經(jīng)有CF、關(guān)聯(lián)規(guī)則等成熟技術(shù)。對(duì)于新注冊(cè)用戶(hù)的冷啟動(dòng)現(xiàn)象,可以利用其綁定的微博、豆瓣(目前無(wú)此功能)來(lái)收集用戶(hù)興趣,例如微博文本話題挖掘,豆瓣關(guān)于電影的討論等。
3) 基于情景的推薦任何推薦都需要放在具體的情景之下,不同視頻具有不同特點(diǎn),更需要基于情境的推薦。對(duì)于音樂(lè)、電視劇推薦,可以依照目前的播放器下方、側(cè)欄推薦方式進(jìn)行,即推薦目前觀看劇集的下一集或者同一歌手的歌曲。對(duì)于電影推薦適合采用“協(xié)同過(guò)濾”、“用戶(hù)個(gè)性化”、“當(dāng)前電影相關(guān)”的推薦方式進(jìn)行個(gè)性化推薦,對(duì)于 新聞、體育的推薦適合采用類(lèi)似新聞或者相關(guān)新聞的推薦。總之,對(duì)于不同頻道、類(lèi)型的推薦需要采用不同的推薦策略。
|