今天早上四年一度的美國大選又如火如荼地開始了

雖然事不關己,但是作為一名合格的吃瓜群眾,想必不少人都時不時刷新著美國的大選結果,畢竟猜M國總統可比刷段子有趣多了

一邊是人稱建國、號稱沒有人比自己更懂xx的懂王川普,另一邊是做了幾年副總統平平無奇、被懷疑老年痴呆的睡王拜登,這兩個人放在一起競選美國總統就已經足夠具有戲劇性了,而讓這場大選變得更加有趣的,則是從未遲到的

「打臉」與「反轉」

大數據與民調

其實早在這場大選開始之前,賭場、民調、經濟學家、分析師、大數據公司等就已經開始預測了,而今年的情景,似乎與四年前川普大戰希拉蕊頗為相似:

所有的媒體、民調機構和大數據預測結果都顯示,2016年大選將毫無疑問地由希拉蕊勝出,希拉蕊將成為美國歷史上第一位女總統

然而最終的結果卻讓人大跌眼鏡,起初絲毫不被看好的川普,竟然一口氣拿下6個搖擺州,絕境反擊,

成功上演絲血反殺的好戲

而結果就是,大數據系統和民調頓時被罵的狗血噴頭,世界的吃瓜群眾都表示很受欺騙

恰逢今年,美國經歷了黑人運動、新冠疫情、移民風波等等數場混亂不堪的事件

川普的支持率因此一路走低,美國著名媒體TheEconomist甚至預測,大選時拜登的獲勝率將超過97%

而大數據系統和民調機構也表示印度威而鋼|印度威而鋼代購| 印度威而鋼哪裡買|威而鋼100mg| ,今年的預測算法已經進行了修正,預測結果可靠率將高達80%以上,不會出現上次的烏龍事件

那麼今年大選前,民調大數據系統給出的預測結果是什麼呢?

拜登將在大選中獲勝,成功當選新一屆美國總統,川普將遭遇滑鐵盧

民調大數據的依據似乎也十分科學,各種民調機構將定期對不同地區的民眾進行調查,然而結合美國大選的規則、民主共和兩黨的區域劃分、基於往年的大選規律、結合大數據預測算法,最終得出一個較為合理的結果

這麼看,似乎民調大數據的結果會是十分合理的

一如既往地打臉

事實上也似乎如此,因為大選開始前,拜登基本上確定已經手握210張選票,距離美國憲法規定的「270張即可獲選總統」的規定數額,僅僅差之毫厘

而川普的情況就悲慘很多了,6個搖擺州中只要有一個沒有拿到,就非常有可能敗選

而川普要想贏,就

必須拿下從德克薩斯到賓夕法尼亞的所有搖擺州

,難度難以想像

而其中最重要的關鍵票倉——俄州、德州、賓州、佛州,拜登的民調情況又占優,可以說拜登幾乎是具有極大優勢的

而拜登則只需要贏下賓夕法尼亞就能鎖定勝局,這場大選似乎已經提前板上釘釘了

然而,誰也沒有料到,今天的美國大選竟然會如此驚心動魄,且富有戲劇性

大選剛剛開始,拜登與川普的爭奪的確非常激烈,拜登的優勢發力很猛,不少搖擺州都開始出現淺藍,說明拜登的支持率較高

連關鍵票倉德克薩斯都翻藍了,估計沒人會懷疑民調的準確性了

然而,僅僅一個上午過去了,廣大吃瓜群眾卻發現,那些翻藍的搖擺州竟然開始變成淺紅,最後竟然

全都翻紅

了!

川普再次在搖擺州中獲得了完全的勝利,截止到發文時,川普已經基本拿下了搖擺州中的關鍵選票

雖然拜登明面上還有著12票的優勢,但是明眼人都能看出來,後面的票倉中拜登能拿到的選票寥寥無幾

得搖擺州者得勝利,這是美國大選規則下不變的真理

這場「鬧劇」,十有八九是川普以成功者的姿態收場

哪怕最終出現了一些不可抗的事件,讓拜登以微弱的優勢獲勝,這次大選也足夠讓美國的民調大數據系統,臉面盡失了!

美國保羅v8| 美國保羅v8正品| 保羅v8| 保羅v8正品大數據沒用了嗎

連續兩次的失誤,讓民調大數據的可信度迅速低到了令人髮指的地步,甚至成了過街老鼠,人人喊打

按理說,美國的民調大數據系統應該是相當科學的,但是為什麼會出現這麼多

烏龍事件

呢?

其實,很多人都會有一種誤解,認為大數據系統的結果真實性,來自於算法與實際情況的高度擬合性和契合性

但我們在做數據分析、數據挖掘或者其他與數據相關的工作時,首先都要保證

數據來源的真實性與可靠性

就拿這一次美國大選來說,民調大數據系統所依賴的數據源,是來自於各個州的民調情況,以及該州往年的數據情況,比如哪些州一直都是民主黨的票倉,哪些州一直都是共和黨的鐵桿

但是這種數據源的真實性卻十分值得考究:

比如,會不會出現口頭上支撐拜登,暗地裡卻給川普投票的情況?

當然有,而且這種情況或許非常多,因為川普的激進支持者有多爛,大家都懂得

比如,會不會出現倖存者誤差的情況?

當然有,川普的支持者中有很大一部分是農民、農場主,分布地區多為偏遠的山區等,大數據系統難以保證這個人群在民調當中的有效占比

比如,各州的歷史數據會不會產生誤差?

當然會,尤其是近幾年美國各州之間的移民情況相當頻繁,就以德克薩斯州為例,德州一直都是共和黨的老窩,然而今年德州票倉的爭奪卻異常激烈

原因就在於很多人受不了加利福尼亞州的高稅環境,有錢人和流浪漢同時湧入了德克薩斯州中,導致了民主黨選民的迅速膨脹,這就是歷史數據的偏差

當然還有非常多的其他情況會導致數據產生偏差,都是在於數據源的處理上,是否真的具有強說服力,是我們做數據分析中最苦難、也是最重要的工作

這些工作,遠遠不是那些民調大數據機構改改權重係數就可以解決的,反而讓這次的預測更加的離譜

所以,這次的美國大選,打的不光是媒體的臉,更是狠狠打了那些坐吃等死的民調大數據機構的臉,本末倒置,失信於人,自作自受!