原標(biāo)題:群眾的眼睛是雪亮的嗎?當(dāng)真相掌握在少數(shù)人手中
?圖片來源:Pixaby.com
撰文| 孫夢(mèng)逸
一百多年前,現(xiàn)代統(tǒng)計(jì)學(xué)奠基人之一,弗朗西斯·高爾頓(Francis Galton)爵士,在Nature上發(fā)表了一篇標(biāo)題為“群眾之聲”(Vox populi)的短文。短文的故事非常簡單:在英國普利茅斯市的一個(gè)家畜展覽會(huì)上,人們競猜一頭肥牛被宰殺后的重量,猜的最準(zhǔn)的人將會(huì)獲得一定的獎(jiǎng)勵(lì)。唯一被允許的猜測(cè)手段是目測(cè)。可以想見,大家猜測(cè)的結(jié)果會(huì)十分粗糙。結(jié)果的確如此:大多數(shù)人的猜測(cè)和正確的重量相差都在幾十磅左右。讓人驚訝的是,群體的中值離正確的答案只差了9磅,遠(yuǎn)比大多數(shù)人的表現(xiàn)為佳。自那之后,“群智”的理念就流傳開來:群體做出的決策,往往能夠比個(gè)體的決策更為精確。“群眾的眼睛是雪亮的”,即使群眾中的每一個(gè)個(gè)體視力可能都不怎么好。
網(wǎng)絡(luò)時(shí)代讓收集群眾意見更為容易,群體在公共決策方面可能發(fā)揮的作用也讓人們寄予厚望。
群智的理論基礎(chǔ),大致來說是每一個(gè)人對(duì)特定的問題有相互獨(dú)立的判斷或信息,因此,盡管每一個(gè)個(gè)體都會(huì)出錯(cuò),但是大家錯(cuò)的方向會(huì)不一樣,錯(cuò)處相互抵消。這種情況下,公認(rèn)的選項(xiàng),或是權(quán)衡各方意見得出的折中的方案,最有可能是最合適的方案。
但是,通過群智得到最合適的方案,仰賴于解決問題所需要的信息和思考模型在人群中的分布相對(duì)獨(dú)立,或是問題非常簡單,大多數(shù)人都能通過常識(shí)做出正確判斷。實(shí)際上,群智并不是在任何情況下都會(huì)獲得好的效果。對(duì)于很多公共議題,以上的假設(shè)都不一定成立。
其中一類群智可能很容易栽跟頭的問題,是當(dāng)解決問題的關(guān)鍵信息并不為大眾所知的時(shí)候。舉一個(gè)簡單的例子:假設(shè)你是一個(gè)對(duì)美國地理絲毫不了解的人,面對(duì)這樣一個(gè)問題:費(fèi)城是賓夕法尼亞的首府嗎?為了解決這個(gè)問題,你求助于大眾,希望借助群眾的力量解決問題。于是你發(fā)放了一個(gè)問卷,問卷上有是和否兩個(gè)選項(xiàng)。稍有常識(shí)的人都會(huì)知道,費(fèi)城是賓夕法尼亞的一個(gè)重要的大城市,而按照常理,首府應(yīng)該是比較重要的城市吧。于是大多數(shù)人都會(huì)選擇是。不幸的是,賓夕法尼亞的首府是名不見經(jīng)傳的哈里斯堡,不是費(fèi)城。
這個(gè)例子并非信口開河:麻省理工學(xué)院和普林斯頓大學(xué)的科學(xué)家們就親自做了這樣一個(gè)問卷調(diào)查。如圖一a所示,確實(shí)大多數(shù)的人都選擇了錯(cuò)誤的答案:
?圖一(來源:參考文獻(xiàn)[3])
這樣的問題并不鮮見,而且很多問題并非無關(guān)痛癢:一個(gè)很熟悉的例子,就是轉(zhuǎn)基因作物是否應(yīng)該大規(guī)模應(yīng)用。決策所需要的信息包括轉(zhuǎn)基因的利與弊,這樣的信息往往存在于需要一定閱讀門檻的學(xué)術(shù)文獻(xiàn)中,并不能夠?yàn)槠匠4蟊娸p易接觸到。因此,如何在此類情況下做出正確合理的決策就尤為重要。
人們?cè)瓦@些問題提出過許多解決手段,其中一種是在問卷調(diào)查的同時(shí),詢問人們對(duì)自己答案的信心,根據(jù)其自信程度給予其答案相應(yīng)的權(quán)重。其基本的思路是,能夠做出正確判斷的人通常對(duì)自己的答案更為自信。這個(gè)思路在一定程度上確實(shí)能夠增加調(diào)查的準(zhǔn)確度。
然而,這一方法大部分情況下并不十分有效,原因是人們往往對(duì)自己的判斷過于自信。這一現(xiàn)象也可以在圖一c中看到:人們就算錯(cuò)也錯(cuò)得非常自信。做出這個(gè)問卷調(diào)查的科學(xué)家,John McCoy, Drazen Prelec和Sebastian Seung另辟蹊徑,想了一個(gè)獨(dú)特的解決辦法。這里順帶插一句,Sebastian Seung 教授算是著名網(wǎng)紅,是科普書《連接組》(Connectome)的作者,主攻方向是計(jì)算神經(jīng)科學(xué)。
幾位科學(xué)家在問卷調(diào)查之外,問了一個(gè)簡單的問題:請(qǐng)問你覺得人群中有多少人的答案和你的的答案一樣?如圖一e所示,對(duì)這一問題的答案,兩組人給出了截然不同的結(jié)論:在給出錯(cuò)誤答案的人群中,人們傾向于覺得大家和自己的答案是一致的,而給出正確答案的人群中,人們傾向于認(rèn)為大多數(shù)人和自己的答案并不一致。
這底下的道理,說穿了并不難理解:知道費(fèi)城不是賓夕法尼亞首府的人,大概率是知道哈里斯堡才是賓夕法尼亞首府的,而且他們很可能也知道這個(gè)信息不為大眾所知。因此,他們會(huì)做出大多數(shù)人和自己選擇并不一致的推斷。而選擇錯(cuò)誤的人則不會(huì)做出類似的推斷——他們依據(jù)的是大眾都知道的信息,因此他們會(huì)預(yù)計(jì)大多數(shù)人和自己的答案會(huì)一致。根據(jù)這種預(yù)測(cè)的不對(duì)稱性,幾位科學(xué)家設(shè)計(jì)了兩種方案來從調(diào)查結(jié)果推斷最有可能的正確答案:
第一種方案是評(píng)估答案的“意外流行程度”(surprisingly popular)。其理論依據(jù)是,得出錯(cuò)誤答案的人,很有可能會(huì)低估正確答案的流行程度:畢竟他們并不知道得出正確答案所需要的稀少信息,很有可能會(huì)假設(shè)大多數(shù)(甚至所有)人和自己的答案是一樣的。而得出正確答案的人,也不大可能高估正確答案的流行程度:畢竟他們很可能會(huì)知道大多數(shù)人會(huì)猜錯(cuò)。那么綜合所有人的預(yù)測(cè),人群總體應(yīng)該會(huì)低估正確答案的流行程度。把人群的預(yù)測(cè)答案分布和真實(shí)的答案分布做比較,比預(yù)測(cè)的答案更流行的答案,就更有可能是正確的答案。
為了評(píng)估這一方案的有效性,幾位科學(xué)家進(jìn)行了四類問卷調(diào)查:第一類是上文提到的首府問題;第二類是細(xì)節(jié)問答:問題的范圍涵蓋了歷史、人文、科學(xué)地理等;第三類問題是考驗(yàn)醫(yī)生對(duì)皮膚癌的診斷;最后一類問題是對(duì)藝術(shù)作品進(jìn)行估價(jià)。如圖二所示(圖中綠色條形柱代表新設(shè)計(jì)的“意外流行程度”方法),新設(shè)計(jì)的“意外流行程度”方案的表現(xiàn)是現(xiàn)存所有常用的統(tǒng)計(jì)手段中最好的。
?圖二(來源:參考文獻(xiàn)[3])
四類問題涵蓋范圍廣闊,也從一定程度上證明了這種新方法的適用廣泛性。
另外一種方案較為復(fù)雜,叫做“最不驚訝”(Least surprised by the truth)原則。大致意思是計(jì)算給出不同答案的人群中,對(duì)正確答案感到意外的程度。最不吃驚的人,給出的答案更有可能是正確答案。道理說起來好像很好理解:知道正確答案的人當(dāng)然不會(huì)對(duì)正確答案感到驚訝。問題是做群體意見征集的時(shí)候,正確答案往往并不預(yù)先知道(畢竟預(yù)先知道還做啥群體意見征集),因此,所謂最不驚訝程度是需要根據(jù)貝葉斯原理從當(dāng)前的答案分布和預(yù)測(cè)分布往回倒推的,并不十分簡單,這里不做具體介紹,有興趣的可參看文末附帶的參考文獻(xiàn)[4]。這一研究現(xiàn)在仍在進(jìn)行中,適用范圍和有效度皆有待驗(yàn)證。
這一研究對(duì)當(dāng)今社會(huì)的公共決策有著重要的啟示。可以預(yù)計(jì),如何設(shè)計(jì)合理的算法通過群眾調(diào)查作出合理的決策,很長一段時(shí)間內(nèi)都是社會(huì)科學(xué)值得認(rèn)真思考的問題。值得注意的是,以上的統(tǒng)計(jì)方法雖然新穎獨(dú)到,依舊依賴于對(duì)信息在人群中的分布結(jié)構(gòu)有特定的假設(shè),因此,并非所有問題都能夠適用。事實(shí)上,當(dāng)今大部分群智算法都依賴于信息和思考模式在人群的某種特定的分布,并不存在一勞永逸的普適算法。因此,對(duì)解決各類社會(huì)議題可能需要的信息分布的研究,也許才是以后研究的重點(diǎn)。
另外需要強(qiáng)調(diào)的一點(diǎn)是,以上的算法針對(duì)的問題往往是價(jià)值中立的,只是對(duì)事實(shí)的判斷。而現(xiàn)今的民主決策,往往面對(duì)的問題在價(jià)值上并不中立(沒有絕對(duì)正確的答案,需要做的是對(duì)各方利益的平衡)。對(duì)于這類問題,以上的算法也將不再適用。但是,這并不意味著科學(xué)在這類價(jià)值判斷的問題就無法插足:經(jīng)濟(jì)機(jī)制設(shè)計(jì)的大家,諾貝爾獎(jiǎng)得主Eric Maskin就在Scientific American上發(fā)過一篇小文,對(duì)民主投票的設(shè)計(jì)有精彩的闡述,大家若有興趣可以參看(參考文獻(xiàn)[5])。
大家可以看到,原來科學(xué)的觸角比我們想象的要廣泛得多。一些我們平常認(rèn)為無法在科學(xué)的框架上加以討論的社會(huì)人文的問題,其實(shí)是有可能從科學(xué)的角度進(jìn)行分析的。在這個(gè)價(jià)值碰撞激烈,民粹問題橫行的世界,更需科學(xué)家們采用科學(xué)的視角幫助解決各類復(fù)雜的議題。畢竟每一位科學(xué)家,都同時(shí)是一個(gè)社會(huì)人。
參考文獻(xiàn):
[1] Galton, Francis. "Vox populi (The wisdom of crowds)." Nature 75.7 (1907):450-451.
[2] Page, Scott E. The difference: How the power of diversity creates better groups, firms, schools, and societies. Princeton University Press, 2008.
[3] Prelec, Dra?en, H. Sebastian Seung, and John McCoy. "A solution to thesingle-question crowd wisdom problem." Nature 541.7638 (2017): 532.
[4] Prelec,Drazen, H. Sebastian Seung, and John McCoy. Finding truth even if the crowd is wrong. Working paper, MIT, 2013.
[5] Dasgupta,Partha, and Eric Maskin. "The fairest vote of all." Scientific American 290.3 (2004): 92-97.
孫夢(mèng)逸
密歇根大學(xué)演化生態(tài)系博士生,主攻演化系統(tǒng)生物學(xué),閑時(shí)喜歡閱讀。