原標題:今日頭條,走好
文| L
今年春節可能是張一鳴過得最不開心的一年。
當各大互聯網公司豪擲千金在各大春晚上怒刷一波存在感時,本來也準備大干一場的今日頭條旗下兩款產品——“火山小視頻”、“抖音”,卻遭遇了春晚冠名被多家衛視臨時撤下的尷尬窘境,最后不得不用剛剛收購的自拍相機App激萌救場。
至于冠名被撤的原因,據鈦媒體報道,大概率上是因為李天佑,這個中國喊麥第一人因歌詞含有違法性質而被央視《焦點訪談》點名批評,隨后遭到全網封殺。而火山小視頻正是李天佑直播的平臺。
把時間往前推2個月。
2017年12月29日,因傳播色情低俗信息,存在嚴重導向問題,對網上輿論生態造成惡劣影響。今日頭條手機客戶端“推薦”、“熱點”、“社會”、“圖片”、“問答”、“財經”等6個頻道被暫停更新24小時。
短短兩個月時間內,這家被媒體捧為“TMD”三小巨頭之一的明星公司,旗下多款產品遭遇了不同程度的危機,而這很難說不是在為其信奉的“算法沒有價值觀”的“價值觀”買單。
眾所周知,今日頭條以新聞聚合閱讀起家,利用個性化推薦技術,打造出一款千人千面的資訊App,正是由于其對用戶資訊需求和閱讀喜好的準確把握,短短幾年時間內橫掃國內新聞閱讀市場,甚至開始威脅到百度在內容分發領域的地位。
然而即使今日頭條強大如斯,其頭上卻始終懸著一把達摩克斯之劍——版權與灰色內容,這也是算法短時間內難以克服的阿喀琉斯之踵。
算法的瓶頸
人工智能時代,算法確實代表著更為先進的生產力,但算法并不是萬能的。
去年9月,人民網曾連發3篇評論文章,批評以今日頭條為代表的,單純依靠算法推薦的平臺價值觀缺失、制造信息繭房以及走向媚俗化,并過度追求“眼球新聞”。
事實上這也是今日頭條目前所面臨的算法瓶頸。
作為對外界批評的回應,今日頭條在2018年1月對外公布了算法原理。
圖片來源于網絡
根據其公布的文章來看,今日頭條采用的典型推薦算法有協同過濾、邏輯回歸、DNN、因子分解機(Factorization Machine, FM)和梯度提升決策樹(GBDT)。
雖然目前業界普遍采用的是混合推薦來綜合各個推薦算法的優點,但算法的弱點仍然沒有被真正避免和彌補。
首先,算法嚴重依賴于數據的優劣。訓練數據的優劣則直接關系到算法模型的優劣。
算法背后實質上是機器所做的枯燥乏味的,冷冰冰的數學計算,計算結果基本上就是后續內容推薦的依據。
雖然點擊率、閱讀時長、點贊、評論、轉發都是推薦模型里可以量化的指標,但各大推薦平臺卻不得不承認點擊率在推薦模型里仍然占有很高的權重。
利用人性弱點攫取用戶注意力的內容,在點擊率這個指標上面的表現天然好于一般內容甚至是優質內容。
而用戶的點擊閱讀行為數據反過來又會成為訓練模型的數據,成為給用戶推薦內容的依據,如此循環往復,最終畸形的數據造就畸形的模型,畸形的模型組合成畸形的系統,畸形的系統推薦出畸形的內容。
其次是數據有效性問題。
用戶的需求變幻莫測,但系統卻難以捕捉需求背后用戶的真實意圖,再加上閱讀場景的不同,用戶之間的個體差異,看似需求中暗含著某些規律,實際上可能是“技術的幻想”。
最后,目前世界上還沒有任何算法膽敢保證其推薦內容的質量。
媒體習慣于夸大其詞,比如過于強調人工智能的“智能”,而選擇性忽略人工智能技術實際的進展和應用情況。
事實上目前的個性化推薦系統還遠沒智能到讀懂文章的內容,更沒法從本質上分析內容有沒有價值,而只能從外部的數據來衡量文章的質量。
從這個角度看算法確實沒有“價值觀”。
因為它還不知道價值為何物。如果沒有編輯干預,個性化推薦系統會推薦什么樣的內容難以想象。
而作為國內最大的個性化推薦平臺之一,今日頭條顯然對這些問題有著深切的感觸。
了解人工智能的人都知道,數學里的極限理論在人工智能領域有著廣泛的應用,雖然完全去捕捉用戶的需求和意圖不可能,但通過獲取更多維度的數據,交叉驗證數據的有效性或許可以去無限逼近用戶的真實需求和意圖。
與用戶行為數據和歷史閱讀數據相比,更有效的數據莫過于社交數據。
根據GWI2017年的報告顯示,平均每個網絡用戶每天在社交媒體和在線通訊平臺上花費2個小時15分鐘時間,而這一數字在2016年還是1小時49分鐘。該報告還顯示98%的網絡用戶至少使用了一個社交網絡。平均每個網絡用戶擁有7.6個網絡賬戶。
圖片來源于網絡
無疑社交網絡成為了數據挖掘的富礦,也能很好的模擬現實社會。
但作為一款資訊產品,今日頭條的社交化之路并非坦途。
社交化苦旅
國內嘗試做社交產品的互聯網巨頭并不在少數,甚至說個個都有社交夢,大到阿里、百度,小到網易,搜狐均在社交領域有過鍥而不舍的嘗試,但鮮有成功的案例。
在QQ及微信的陰影之下,再加上微博、陌陌環伺,要從強敵面前趟出一條血路,難度著實不小。
但對于國內的頂級流量玩咖來說,今日頭條客戶的用戶及流量增長已經放緩,把海量的流量導出去,發力社交,提高用戶粘性,并利用社交數據反哺推薦系統,提高競爭壁壘形成護城河是其不得不做的事。
于是也才有了今日頭條不惜和早期投資方新浪微博撕破臉也要做類微博產品的故事。
雖然新浪微博早在今日頭條2016年年末的融資中已經出售股份退出,不過隨后的幾個月里兩家公司還是相安無事。
直到去年9月,今日頭條為了推廣微頭條業務,允許用戶將微博上的內容同步到頭條,這引起了微博的強烈不滿,直接導致微博關閉了微頭條產品的數據接口,并禁止微博內容自動同步到微頭條平臺。
此后兩家公司你來我往交戰數回合,但微博顯然已無力阻止今日頭條一心要做社交的心。
正如諾貝爾經濟學獎獲得者詹姆斯·托賓所說:“不要把你所有的雞蛋都放在一個籃子里,但也不要放在太多的籃子里”。
張一鳴深諳此理,推出微頭條只是今日頭條布局社交的一環,今日頭條還通過孵化,收購和投資等各種手段擁有了抖音、悟空問答、火山小視頻、musical.ly、Face U激萌、Live.me等多達6款社交或具有社交屬性的產品矩陣。
放眼整個中國互聯網,擁有如此之多社交產品的也僅此一家,怕是騰訊都自愧不如。
但如此激進的布局也折射出了今日頭條在社交化探索方面的焦慮。
能否將這么多產品真正的整合起來形成合力尚且不論,單是每款產品的運營支出就是一筆巨大的開銷,至少就目前來看,這些產品都還處于燒錢階段,并未見有產品已經盈利的公開報道,此是其一。
其二,以上產品均屬于弱社交產品,用戶間的社交行為很難映射到現實社會。
不同于微信這樣的強社交產品,弱社交產品往往需要持續不斷的高質量UGC內容才能維持用戶的活躍度,需要一個活躍的,不斷有活水流入的社區才能保持較高的用戶留存率,這不僅需要強大的運營能力,更需要社區有自生產IP的能力,但就目前來看,道阻且長。
火山小視頻花重金從其他平臺挖來的天佑還被封殺了,甚至還影響到了平臺本身的推廣節奏。
其三,通過這幾年的野蠻擴張,今日頭條樹敵無數。
除了和新浪微博已經撕破臉,悟空問答挖角知乎的行為難免不讓周源耿耿于懷。而作為國內的社交巨頭騰訊是否會采取防御措施也未可知。
最值得一提的是,今日頭條之所以能夠如此激進的布局社交,是在于今日頭條App強悍的吸金能力。
數據顯示,2016年,今日頭條靠信息流廣告收入達60億元;2017年,增長至150億元;2018年的目標則是300億~500億元。
這也是為什么今年1月底,百度和今日頭條有了一輪正面交鋒,百度顯然不愿意看到自己的廣告市場被活生生的蠶食,“百頭大戰”恐怕在所難免。
當一艘航母孤零零的在海上航行,護航艦艇卻還在造船廠沒下水,一旦遇到強敵的猛攻,場面可以想象。
然而不幸的是,張一鳴的社交夢卻依托于今日頭條這艘“資訊航母”的平穩航行。
定時炸彈
六大頻道被暫停更新“24”小時,和百度爆發口水戰,兩款產品冠名被撤……這一連串的事件正將今日頭條一步步推向輿論風口。
如果說此前六年都是媒體在褒獎一個小巨頭的誕生,那么2018年,或許今日頭條將面臨更多理性的審視。
當一家企業開始被推向輿論的暴風眼時,總有一些事不可控,比如現在的樂視。
除了前文已經詳述的算法問題,四面樹敵以及社交化的激進布局,埋在今日頭條成長路上的另一個定時炸彈則是版權問題。
可以說版權問題自今日頭條誕生起就如影隨形。
只要在搜索引擎中鍵入“今日頭條侵權”關鍵詞,就能輕松找到多家媒體的最新報道。
幾個有代表性例子,2017年5月,南方日報社發布反侵權公告,稱2016年至今,“今日頭條”客戶端未經許可擅自轉載其版權作品近2000條。
在此之前的4月26日,騰訊和搜狐以涉嫌侵犯其所屬作品的信息網絡傳播權為由,將今日頭條訴至海淀法院。
更早之前,包括新京報網、《廣州日報》、《長沙晚報》、《楚天都市報》等各類媒體都曾因版權侵權和今日頭條發生過版權糾紛。
而在短視頻領域,優米網創始人王利芬的一條怒批頭條侵權的微博則最具代表性,王利芬在微博指出,今日頭條旗下西瓜視頻毫無版權概念,取材只依據用戶喜歡,找到內容第一時間推送并打上臺標。
圖片來源于網絡
此外,在今日頭條旗下的短視頻平臺西瓜視頻上,存在著以影視劇片斷的形式批量傳播的大量短視頻,不過此類視頻因系用戶上傳,平臺能借“避風港”規則作“擋箭牌”,然而侵權風險卻始終存在。
一旦今日頭條未來計劃登錄資本市場,遲早要掃清版權障礙,規范化運營。
只不過正如人民網在三評“算法推薦”的評論文章中所說的那樣:智能平臺的身上也應流淌“道德的血液”,不能為只為眼前的流量而放棄了長遠。
同樣借名為知乎作者王科的話:“推薦系統有其邊界,一切技術均有其邊界,局限于當前技術成熟度,局限于數據,局限于現實世界與技術世界的距離。”
最后,祝愿今日頭條,走好。
作者:L,關注前沿科技領域,報道有趣的、有商業價值的公司、產品以及相關的人和事。郵箱:lili.li@cyzone.cn
- END -