繭房:內容的智能推薦,真的會讓用戶陷入“信息繭房”無法自拔嗎?

有人說內容的智能推薦算法會造成“信息繭房”繭房 。這是對算法最大的誤解 。

繭房:內容的智能推薦,真的會讓用戶陷入“信息繭房”無法自拔嗎?

文章插圖
“信息繭房”概念,來自于哈佛大學法學院教授凱斯·桑斯坦 。他在《信息烏托邦——眾人如何生產知識》一書中指出,在信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏于像蠶繭一般的“繭房”中 。
繭房:內容的智能推薦,真的會讓用戶陷入“信息繭房”無法自拔嗎?

文章插圖
為什么我說智能推薦算法不會制造“信息繭房”?
首先,算法在推薦時,除了用戶現有的個人興趣,還會基于使用環境、內容熱度、其他用戶的興趣,來給用戶推薦信息 。這些因素能夠讓推薦內容更加豐富,避免了內容越來越窄 。
其次,算法本身還包括興趣探索 。
一般人對算法的認識:喜歡什么,就推什么 。可人生是漫長的,人的興趣不但是各種各樣的,也不斷變化的 。比如,我是英超球隊阿森納的鐵桿球迷,可最近幾年阿森納每況愈下,實在心生疲憊;在體育內容上,最近一年我就更關心乒乓球,尤其是“日本選手張本智和和伊藤美誠多大程度上可以挑戰中國乒乓球運動員”,就比“阿森納能不能排名英超前四”更讓我關注了 。
算法如何做這樣的興趣探索呢?
我了解到,算法最有效的能力,是識別出你最感興趣的內容和最不感興趣的內容 。在二者之間,還存在一大塊“你可能感興趣的內容”,這些內容絕對不會被工程師和產品經理們放棄 。事實上,每個人的成長也是不斷地將“可能感興趣的事情”,固化為“確定感興趣的事情”和“確定不感興趣的事情”的過程 。
對于算法如何識別人們“最不感興趣的內容”,算法推薦里專門有個名詞叫“協同過濾”,英文術語叫collaborative filtering 。“過濾”是“推薦”的反義詞,也是“同一個事情的兩個方面” 。算法有很強的能力,過濾掉那些你明顯不感興趣,跟你一點關系都沒有的東西 。比如我根本不關注美妝、口紅方面的內容,算法沒必要推薦這些內容給我 。
那么,算法如何去探索那些人們“可能感興趣的內容”呢?
用戶興趣泛化和窄化,其實是推薦系統中的經典問題,學界和業界一直很重視 。這個問題叫EE(Exploitation Exploration):Exploitation是利用,通過已知的比較確定的用戶興趣,推薦相關的內容 。Exploratio是探索,除了推薦給用戶已知的感興趣的內容,還需要不斷探索用戶的其他興趣,避免推薦結果一成不變 。
算法追求的是,盡可能地滿足用戶獲取有價值信息的需求,并且讓用戶獲取信息的價值最大化 。
就像開寶箱一樣,算法需要通過探索來發現用戶的興趣
興趣探索在短期內會減損用戶使用時長,因為用戶會在信息流里刷到不那么感興趣的內容,覺得信息流很亂 。但是如果不做興趣探索,短期內可以提升點擊率,但這個提升效果會迅速衰減,因此從長期看收益是負向的 。
所以,興趣探索并非算法的“錦上添花”,而是“必不可少” 。
這下你可以理解,“算法就是喜歡什么就推什么”是一個多么“天真”的誤解了吧 。
重點強調:人是萬物的尺度,也是算法的尺度當然,任何事物都不是完美的,算法也有一定的局限性 。所以,需要一些其他手段,來幫助信息更好地流動 。
【繭房:內容的智能推薦,真的會讓用戶陷入“信息繭房”無法自拔嗎?】今日頭條的內容運營方面,主要做兩個事情:一是幫助頭條獲取更多優質來源;二是確保優質內容在頭條上獲得合理的閱讀比例 。
算法再精準,興趣探索再成功,如果內容池的內容不夠優質、豐富,那推薦做得再好,也不會讓用戶感受好 。所以,從一開始,今日頭條就非常重視優質內容 。2015年,頭條率先推出“千人萬元計劃”,對1000個優質作者,給予每個月1萬元的保底補貼 。2019年又推出了“創作者收益計劃”,希望幫助1萬位創作者月薪過萬,讓優質創作者獲得更多收益 。
公平并非一視同仁,一篇公司調查和一篇娛樂八卦,前者付出的心血多,而流量往往低于娛樂內容,而平臺這時候,就該勇于去“拉偏架” 。“拉偏架”不但體現在資金扶持,也體現在流量扶持上 。
有些優質內容,它們不一定能引起所有用戶的興趣,也不能單純從用戶行為習慣來判斷,無法被推薦系統直接有效地衡量 。這個時候就需要人介入 。
一方面,今日頭條調整機器推薦權重,比如給優質來源的優質內容更多推薦權重;另一方面,今日頭條優化產品機制,提供雙標題、雙封面,幫助創作者提升推薦效果 。此外,今日頭條還投入專門的人力,想辦法幫助優質內容獲得更好的分發和閱讀體驗 。今日頭條專門有一個團隊就叫“作者體驗” 。
舉個例子 。2017年10月,今日頭條和《三聯生活周刊》達成戰略合作后,為《三聯》量身打造了封面專題的分發方式 。封面專題是《三聯》的特色,一個專題往往由四到六篇文章組成 。在手機信息流中,專題的閱讀效果其實不如單篇文章,但是,如果這些文章被拆開、打散,作為一個專題的閱讀價值就會降低 。后來,今日頭條想辦法讓《三聯》專題在頭條信息流里,同時擁有兩種分發方式,既可以被單條推薦,也可以以專題的方式被推薦 。用戶把每個專題收藏起來,就可以看三聯周刊的所有封面報道 。最新一期的封面報道《老友記》最近上線了,在今日頭條內搜索“三聯生活周刊”就能找到 。
三聯生活周刊的封面報道,在今日頭條內會打包成專題推薦,也在搜索中做了優化,幫助用戶快速獲取 。
我們始終相信人對于優質來源和優質內容的鑒別力 。人的判斷不同于機器,但同樣值得被重視 。技術更快,面對海量的信息,分發效率尤其重要;但人更準,特別是進入模棱兩可的地帶,人的同理心和想象力能夠發揮重要作用 。
無論是人還是技術,其實都只是一種手段,都是希望最優質的信息,能又好又快地觸達到需要的用戶手里,讓人找到信息,讓信息找到人,消除用戶“早知道就好了”的遺憾 。
不久前,有同事發給我一個腦科學專家的言論 。大意是說,要打敗推薦算法,需要兩個因素:1. 你需要有追求高品質內容的需求 。2. 你需要隨機取樣人類各個領域的知識 。
其實,算法追求的,和這位專家追求的,一點也不沖突 。因為,說到底,算法的目標是由人設定的,算法的內核,和優質內容、多樣性并不對立 。這也是今日頭條一直以來努力的方向 。
而這位專家所需要的“因素”,在作為通用信息平臺上的今日頭條上都有 。
如果只有算法,絕不會有頭條尋人;如果只有算法,今日頭條也不會長期保持成長 。
“讓上帝的歸上帝,凱撒的歸凱撒 。”人類其實沒必要打敗算法 。一定要和算法分個勝負,大概是人的虛榮心和傲慢在作祟 。比如在圍棋領域,我們沒有必要一定要追求打敗阿法爾狗 。
算法在效率方面確實勝過人,而人的同理心和想象力高于算法 。我們應該做的是,和算法相互學習,做好分工 。畢竟,參差多態,乃幸福之源 。