把算法從世界上刪掉 生活會(huì)不會(huì)變好
去年,把算不會(huì)變好差評(píng)君刷到個(gè)視頻,世界上刪視頻中有位鄂倫春族奶奶正唱著一種叫贊達(dá)仁的掉生歌。贊達(dá)仁,把算不會(huì)變好是世界上刪鄂倫春族的傳統(tǒng)民歌。歌曲歌詞有些是掉生即興編創(chuàng),有些僅用 “ 那耶希那耶 ” 等虛詞。把算不會(huì)變好
奶奶的世界上刪歌聲清澈空靈,有一種大自然的掉生寧靜。
有人說一聽到奶奶的把算不會(huì)變好歌聲,就仿佛逃離了紛擾世界;有人說雖然聽不懂,世界上刪但腦海里有了遠(yuǎn)山草原的掉生畫面;
在網(wǎng)友們熱情地點(diǎn)贊、收藏、把算不會(huì)變好轉(zhuǎn)發(fā)下,世界上刪奶奶的掉生歌聲被推送到了更多人的首頁,前后有 4000 萬人都聽到了這首贊達(dá)仁。奶奶很開心,因?yàn)檫^去她的觀眾只有窗外的大山和家里的白墻。
看完這個(gè)故事,你應(yīng)該和差評(píng)君一樣,覺得心里暖暖的,像是做了一個(gè)心靈大保健。但你可能不知道,大興安嶺深處的鄂倫春族,其實(shí)才不到一萬人。奶奶唱的那首贊達(dá)仁,能即興演唱的人更不足 5 人。
如果事情發(fā)生在 15 年前,奶奶的歌聲即便傳到網(wǎng)上,也許都走不出東北。但這些年,互聯(lián)網(wǎng)出現(xiàn)了算法推薦系統(tǒng)。正是有了算法,奶奶的歌聲才被推送給全國(guó)各地潛在的興趣觀眾,讓更多人的人認(rèn)識(shí)到了鄂倫春族文化。
說起來,互聯(lián)網(wǎng)上對(duì)于算法的討論一直眾說紛紜。有人認(rèn)為算法是偉大的發(fā)明,也有人覺得算法是把雙刃劍。其實(shí)這種情況在歷史上并非少見。報(bào)紙開啟了大眾傳媒時(shí)代,但當(dāng)時(shí)不少學(xué)者都批評(píng)報(bào)紙只追求傳播速度,拋棄了內(nèi)容深度。
電視在普及之初,評(píng)論家們也擔(dān)心電子媒介會(huì)損害人類的思維模式。當(dāng)然不管你怎么看,有一個(gè)不爭(zhēng)的事實(shí)是,我們其實(shí)早活在算法的世界了。從聽歌到看視頻,從購(gòu)物到點(diǎn)外賣,你在電子世界里的衣食住行,都被算法承包了。
之前還有一波網(wǎng)友嘗試關(guān)閉過短視頻 App 里 “ 個(gè)性化推薦 ” ,結(jié)果發(fā)現(xiàn) App 幾乎沒法用了,只能作罷。
現(xiàn)在,反而更多人選擇主動(dòng)調(diào)教算法,積極搜索、點(diǎn)贊、收藏,讓算法更清楚自己想要什么。
看到這,你可能會(huì)納悶:為什么算法變得無處不在了?它有這么重要嗎?去年 10 月國(guó)際數(shù)據(jù)公司 IDC 發(fā)布一則數(shù)據(jù)報(bào)告,預(yù)測(cè) 2025 年全球數(shù)據(jù)量將達(dá)到 175 ZB 。
如果你對(duì)這個(gè)數(shù)據(jù)沒啥概念,那我換一句。2023 年每過一秒,全球就產(chǎn)生了 4.2 PB 的數(shù)據(jù),相當(dāng)于 8 萬部沒有壓縮過的藍(lán)光電影。
在信息過載的時(shí)代,咱們已經(jīng)沒辦法看完所有內(nèi)容了。
這時(shí)就需要一個(gè)信息漏斗,把它雕刻你喜歡的形狀。通過它篩選的內(nèi)容,才是你想要的。而算法,就是那個(gè)漏斗。并且算法還是目前唯一的辦法,你總不能靠人工給每個(gè)人挑揀有用的信息吧。
那算法是怎么猜到你喜歡什么的?主要有三類辦法。第一種大家很熟,就是內(nèi)容推薦。根據(jù)你對(duì)作品點(diǎn)贊、收藏等反饋行為,給你推薦屬性相似的作品。
第二種是協(xié)同過濾。人以群分嘛,相似的用戶往往有相似的愛好。比如差評(píng)君點(diǎn)贊過《 復(fù)仇者聯(lián)盟 》《 鋼鐵俠 》《 美隊(duì) 》,而火鍋點(diǎn)贊過《 復(fù)仇者聯(lián)盟 》《 鋼鐵俠 》,那么算法就會(huì)推測(cè)火鍋也喜歡《 美隊(duì) 》。
最后一種叫混合推薦。比如你的互動(dòng)記錄比較少,沒有展示太多興趣愛好,那平臺(tái)就會(huì)融合( 加權(quán)、切換、混雜、特征組合 )多類技術(shù),給你引入一些歷史行為中未曾出現(xiàn)的內(nèi)容,幫你發(fā)現(xiàn)潛在的興趣愛好。
也許有差友好奇了:這算法猜我的愛好,我理解。。。但幫我開發(fā)新愛好是為啥?誒,就是為了推送更多的未知內(nèi)容,讓你在 App 里瀏覽、探索。打個(gè)比方啊。如果你喜歡玩 Dota ,讓你在短視頻平臺(tái)看一整天 Dota 視頻,興許還能接受??扇绻徽?,平臺(tái)都只讓你看 Dota 視頻呢——
你一定想卸了這個(gè)平臺(tái)。其實(shí)大部分人都這樣,前段時(shí)間一篇發(fā)表在 AI 技術(shù)頂會(huì) KDD 的論文就發(fā)現(xiàn):如果視頻 App 推送的內(nèi)容足夠多樣化,那用戶平均活躍天數(shù)和活躍時(shí)長(zhǎng)就會(huì)顯著提升。
也就是平臺(tái)推給用戶的視頻越多樣,那用戶看得越滿意。畢竟就算是喜歡的東西,天天看,誰都會(huì)膩嘛。
所以為了獲得用戶認(rèn)可,實(shí)現(xiàn)長(zhǎng)期留存,平臺(tái)工程師在設(shè)計(jì)算法時(shí),就一定想會(huì)讓他們看到更多元的內(nèi)容。當(dāng)然,這些多元化內(nèi)容理論上也是盡可能基于你的個(gè)人特征和興趣范式推薦的。天天給你推薦爺爺奶奶喜歡看的視頻,那你也頂不住啊。
一個(gè)月前,暨南大學(xué)在新聞學(xué)頂刊《 Digital Journalism 》發(fā)表一篇論文,他們用一系列實(shí)驗(yàn)探討了 “ 算法 ” 與 “ 用戶行為交互 ” 對(duì)新聞多樣性的影響,一共有三種測(cè)試組:
a.無個(gè)性化推薦,純隨機(jī)曝光;
b.算法推薦,用戶躺平任算法推薦;
c.算法推薦,但用戶可以干預(yù)。最后結(jié)果發(fā)現(xiàn), b 看到的新聞多樣性大于 c 大于 a ,也就是算法有助于用戶接觸到更多元的新聞。
雖然從行業(yè)角度出發(fā),算法是為了提高平臺(tái)的用戶留存。但從用戶本身的角度看,算法也同樣有不可忽略的價(jià)值。因?yàn)樗惴ɑ趦?nèi)容推薦,它能提高整個(gè)平臺(tái),不同類目信息的分發(fā)、獲取效率,節(jié)省時(shí)間成本。
比如差評(píng)君之前收藏了一個(gè) “ 孩子哭鬧 ” 視頻后,就被推薦了如何制作幼兒輔食,濕疹處理等教學(xué)。算法的去中心化特性,還讓每一個(gè)普通創(chuàng)作者都有機(jī)會(huì)被大眾看到,激勵(lì)創(chuàng)作者制作優(yōu)秀的內(nèi)容。
2018 年,一位叫沈丹的年輕母親在抖音發(fā)了女兒在田間抓魚的視頻。就是這段隨手一拍,沒有任何修飾的視頻,勾起了無數(shù)網(wǎng)友的兒時(shí)回憶,獲得了 15 萬點(diǎn)贊。
可能誰都想不明白,為什么一位普通媽媽隨手分享的視頻會(huì)這么火?因?yàn)樗惴ò阉扑]給了那些懷念淳樸、自由田園生活的網(wǎng)友。
還有不識(shí)字的彝族女性通過短視頻,第一次看到了大涼山外的世界;在江西的廢棄村落,有阿姨每天拍攝記錄村里的人和事,再分享出去;42 年前陜西一位被拐賣的孩子,在算法的推薦下,去年成功和親生父母團(tuán)聚。
當(dāng)然,我們剛也說了:算法還會(huì)依據(jù)你的其他特征去開發(fā)新愛好,給你推薦大量未曾涉足過,卻又感興趣的內(nèi)容。大部分人刷視頻,應(yīng)該不會(huì)主動(dòng)去搜 “ 甲骨文 ” 這些詞吧?
但這兩年在算法推送下,有幾千萬人看到了李右溪的甲骨文視頻,他們和我一樣看完才發(fā)現(xiàn):原來甲骨文這么有意思。為啥甲骨文的 “ 光 ” 字是 “ 人 ” 頂著一團(tuán) “ 火 ” ?為啥甲骨文時(shí)期,我們就有了萬這個(gè)單位?
甚至差評(píng)君也才了解,破譯甲骨文,最高能拿到 10 萬懸賞金。是不是有點(diǎn)心動(dòng)了?
別急,簡(jiǎn)單的早就被前人破譯出來了,近些年唯一破譯成功的就是 “ 蠢 ” 這個(gè)字。原來那會(huì)就頭頂尖尖的 ▼
這兩年來,李右溪一共漲了近 100 萬粉絲,視頻被點(diǎn)贊了 800 萬次。怎么說呢,如果不是算法,像甲骨文這種普通人夢(mèng)都?jí)舨坏降男”娭R(shí),也許真的會(huì)一直雪藏下去,不被大眾發(fā)現(xiàn)。而這一百萬粉絲,也很難有機(jī)會(huì)接觸到這些有趣但冷門的故事。
算法的多樣性推薦,并沒有因?yàn)橛脩?nbsp;“ 沒表現(xiàn)出對(duì)甲骨文的興趣 ” ,就決定不推薦甲骨文了,而是通過復(fù)雜的推算,最后決定向潛在用戶提供一個(gè)學(xué)習(xí)新知識(shí)、發(fā)現(xiàn)新樂趣的可能。
你看,奶奶唱的贊達(dá)仁火了之后,千萬人看到了深藏在大興安嶺的鄂倫春文化。無數(shù)生活在內(nèi)陸的人,也是看了漁小仙的趕海視頻,才知道原來可以過這樣的人生。一本 40 年前的《 畫魂 》,在 4 條解讀視頻火了之后,被搶購(gòu)一空,還加印了 5 次。
為什么說算法對(duì)用戶有價(jià)值?因?yàn)樗拇_幫用戶提升了眼界,讓他們看到了更多元的知識(shí)、更多樣的內(nèi)容。綜上呢,差評(píng)君再回答一下開頭的問題。
算法之所以變得這么重要,就是因?yàn)樵谛畔⑦^載的時(shí)代,對(duì)平臺(tái)、對(duì)創(chuàng)作者、對(duì)用戶,它都是一套優(yōu)雅的解決方案,一個(gè)當(dāng)下最優(yōu)解的系統(tǒng)。與報(bào)紙重塑信息獲取、電視改變視聽體驗(yàn)、電動(dòng)汽車革新出行方式相似,算法也在重構(gòu)人類與信息的交互模式。
雖然歷史上很多新技術(shù)、新媒介的誕生,都引發(fā)過人類擔(dān)憂和恐慌,比如蘇格拉底認(rèn)為文字這種媒介讓人類變得愚蠢,因?yàn)槲淖譀]有思考,只是重復(fù)。但只要?dú)v經(jīng)時(shí)代的選擇,新媒介終究成為主流,被大眾接受。
如今的算法,讓每個(gè)單位各取所需,提高整個(gè)社會(huì)信息流動(dòng)的效率。而在我們看不到的背后,算法也早就成了科技企業(yè)們的核心生產(chǎn)力,應(yīng)用在內(nèi)容資訊、招聘交友、出行旅游等領(lǐng)域。算法、算力、數(shù)據(jù),是人工智能三要素。
DeepSeek 的出現(xiàn),打破了 “ 算力壟斷 ” 敘事,讓更多人把目光投向了算法技術(shù)和工程能力,算法的含金量還在上升。
雖然現(xiàn)在的算法技術(shù)還稱不上完美,但正是這套系統(tǒng)的存在,才讓更多有用、美好的信息、知識(shí)、文化,被更多的人看見。
如今,我們要做的不僅是要學(xué)會(huì)與算法共存,或許還要知道要如何使用算法、駕馭算法,去更有效率地接收信息、獲取知識(shí)。