熱搜新聞將我們“裹挾”?人工智能專家這樣說
今年伊始,娛樂圈某明星出軌的消息席卷新聞熱搜,甚至從不關(guān)心娛樂新聞的讀者也被裹挾其中,聯(lián)想到日前微博熱搜榜、熱門話題榜等被下線,不禁讓人思考:我們?yōu)槭裁磿痪砣霟狳c話題的漩渦?這是我們主動的選擇、潛意識的興趣,還是被系統(tǒng)后臺操控的身不由己?
日前,電子科技大學(xué)成都研究院大數(shù)據(jù)室研究人員、成都鏈科云科技技術(shù)合伙人熊文軒,為科技日報記者解答了這些問題。
被算法套路的熱搜推送
這不是簡單的‘貼標簽’,庫卡機器人驅(qū)動器維修,而是組合‘套路’。熊文軒說,新聞聚合平臺、社交平臺推送的新聞、信息使用的大數(shù)據(jù)算法大體分兩類:基于內(nèi)容推薦規(guī)則和協(xié)同過濾推薦規(guī)則。
前者是根據(jù)個人行為習(xí)慣將瀏覽的新聞、信息等對象進行特征提取、內(nèi)容分類后,進行關(guān)聯(lián)內(nèi)容推送,但其最大弊端是推薦內(nèi)容單一。舉個簡單例子,某天你的手機被女友拿去看了絲襪產(chǎn)品,那么接下來幾天你都會被推薦絲襪。
于是協(xié)同過濾規(guī)則出現(xiàn)了,這是根據(jù)網(wǎng)絡(luò)用戶相互的交叉體驗,尋找相同愛好的群體,推薦相同瀏覽記錄或行為。系統(tǒng)找了一群與你志同道合的‘小伙伴’在背后‘支招’。他們跟你同樣關(guān)注體育、旅游新聞,但他們同時也閱讀了氣象新聞,那么算法會將你之前未關(guān)注的氣象新聞推送給你。熊文軒說,這可以避免特征分類單一,實現(xiàn)動態(tài)推薦,即根據(jù)個人興趣愛好的變化作調(diào)整。
目前,多數(shù)聚合類新聞平臺都會采取融合式算法,即將上述多種算法綜合運用或開發(fā)出一些更復(fù)雜的算法,但原理大致類似。熊文軒說。
沒有瀏覽記錄的萌新能否逃出套路?他說,注冊時平臺會推薦標簽性分類,如電影、美食等引導(dǎo)用戶第一波使用,隨后用戶開始篩選、點擊、留存,這便實現(xiàn)了數(shù)據(jù)冷啟動。冷啟動后數(shù)據(jù)產(chǎn)生,系統(tǒng)便按預(yù)設(shè)的算法進行推薦。他說,一些基于新聞學(xué)、傳播學(xué)特點的規(guī)則設(shè)定也會推波助瀾,如內(nèi)容置頂、套紅、延伸閱讀鏈接等。
基于人工智能形成的內(nèi)容漩渦
在趨于碎片化閱讀的當前,KUKA機器人維修,讀者自我訴求不明確、隨機性強,容易被后臺系統(tǒng)引導(dǎo)。熊文軒說,一些聚合類平臺、社交媒體負責(zé)內(nèi)容推薦的是基于算法的人工智能,而非編輯人員,這更容易形成內(nèi)容漩渦:系統(tǒng)按規(guī)則推薦熱點話題,讀者點擊率、閱讀量不斷提升,系統(tǒng)再次循環(huán)推薦,越來越多的讀者卷入其中。其實你仔細看會發(fā)現(xiàn),某熱點話題的閱讀內(nèi)容可能翻來覆去就是那么幾十條。
這種基于算法的人工智能內(nèi)容推薦可控嗎?熊文軒表示肯定。他說,用戶被海量重復(fù)信息包圍,源于內(nèi)容把控沒有人為過濾。算法邏輯不會產(chǎn)生特別精準的推薦,而是大體方向或嘗試性推薦,這就需要大量內(nèi)容填充,而無法對內(nèi)容進行強制管理。他說,可以嘗試用算法初選+人工引導(dǎo)的方式,避免被同類內(nèi)容、低俗內(nèi)容不斷刷屏。
從內(nèi)容來源進行控制,也是熊文軒團隊正嘗試的工作之一。他所在的企業(yè)能夠?qū)崿F(xiàn)讓科技政策、雙創(chuàng)信息通過大數(shù)據(jù)+人工智能的方式主動找到企業(yè)更有效地發(fā)揮作用。在內(nèi)容源頭,我們會選取政府網(wǎng)站、主流媒體等專業(yè)平臺,這樣內(nèi)容推送范圍是限定的,可以有準確性、真實性、客觀性。他說。
最后,通過算法自身規(guī)則設(shè)定也能夠?qū)崿F(xiàn)內(nèi)容管控。他說,最簡單的方式就是設(shè)定不同內(nèi)容的權(quán)重值,如將娛樂新聞類權(quán)重設(shè)定為0.5、社會新聞類設(shè)為1.5,那么同樣由人工智能從網(wǎng)絡(luò)中爬取的100條內(nèi)容中,娛樂類就會僅推送50條,社會類就會推送150條,從側(cè)面引導(dǎo)讀者關(guān)注熱點。內(nèi)容推薦算法的根本是分類和篩選,最終目的是幫助讀者在海量的信息中,www.twshmhelmet.com,精準找到需要關(guān)注的內(nèi)容,而不是被淹沒其中。熊文軒說。