歡迎光臨
每天分享高質量文章

七夕特輯 :大資料分析看如何成為美人

這篇文章探討的是女性吸引力,但沒有通常看到的照片分析之類的東西。相反,我們採用過去的女人圖片,分析她在男同胞們頭腦里產生的反應。 我們將展示以下顯著的現象:


  • 男人們作為一個群體對女性長相越有分歧,最後喜歡她的人越多。

  • 男人們通常會忽視掉那些僅僅可愛的女生。

  • 事實上,有些男人認為她長得醜,這反而會幫到這個女人。


公 正性警告:我們將把女性作為客觀物件來討論,不惜筆墨。本文的目的是分析OkCupid網站的資料,沒有一點點客觀物件化是不可能的。不久會輪到把男性作 為客觀物件來分析展示給大家。按照慣例,本文中沒有任何分析(名人的例子除外)是我個人的觀點。所有資料均是從實際用戶活動中收集的。


1. 咱們從頭開始。

所 有的人,尤其是男人們花費大量精力搜索、瀏覽和聯繫我們最熱門的用戶。正如以前提到的,受歡迎女性收到的交友信息大約是相貌平平女性的4倍(備註:原文用 4X表示),是醜女收到的25倍(備註:原文用25X表示)。深陷信息中會把網站用戶,尤其是女性嚇跑。因此,我們必須分析和重新指導這個趨勢,以免 OkCupid成為sausageparty那樣的網站。


幾乎每隔一段時間,我們都會運行下麵這樣的分析圖,顯示以5000名女性為例,按吸引力排序,在上一個月中能收到多少信息。


這 些圖按種族、位置、年齡、檔案完整程度、登錄活躍程度等做了調整——這些人之間唯一有意義的不同點是她們的長相。運行許多這樣的圖之後,我們開始問自己: 還有什麼原因導致X廣泛分佈,尤其是占了圖中一半數量的“長相高於平均水平”人收到的信息量有多有少。難道僅僅是隨機現象?


下麵是這個女性的分析:


她得到的關註比下麵的女性要高:


儘管根據我們的用戶反饋,她們都是美人。


2. 美麗(7分)並不相同

為瞭解釋這種現象,第一步就是用數學方法來區分吸引力的程度。 比如,採用經典的10點分來作為“長相”的滿分,如果一個人的評分為7,這可能是因為每個看到她的人都會這樣想:她非常可愛。


但是極有可能出現的卻是下麵這種情況:


如果我們只知道她的評分為7,是沒法看出她屬於上面哪一類的。也許對於有些人來說假設的滿分美女是不同凡響、引領潮流的,而其他人認為美女是享樂主義的。誰知道呢? 事實證明,這種分佈的觀點非常重要。


3. 名人照片:拋磚引玉 和 說明

讓我們來看看一些著名人物的評分的分佈情況是什麼樣的。我猜想,比如說女演員克裡斯汀.貝爾的長相評分大致是這樣的:


貝爾小姐被大眾認為是美女,但她的分數看上去並不像是一個超級名模或者什麼頂尖人物。她可能在“非常美”的評分範圍只能得到幾票,大多數的票數在“非常有吸引力”左右,沒人把她的票投在圖表左端的“不吸引人”上。


相比較而言,梅根·福克斯可能得到這樣的評分:


圖表最右邊,可能有很多的帥哥覺得她是最性感的。在最左邊,少數人看過她的電影。


與貝爾小姐不同,福克斯女士讓人們產生了強烈的反應,即使有時這種反應不是正面的。


4. 現實生活的人們

現在讓我們回頭再來看前面的兩個真實用戶,這一次用她們的圖表。 OkCupid網站按從1到5星級評價長相,所以其它討論都以此為根據。本文展示的所有用戶都是慷慨的女性,她們有足夠信心允許我們在網站上做分析,感謝她們。好了,這裡有:


正如你看到的,儘管上面這兩名女性的吸引力評分非常接近,她們收到的投票 樣式卻有所不同。左邊的評分顯示人們有所共識,右邊的評分顯示了意見分歧。


再細緻一點說來就是:

  • 左邊的女士,在絕對意義上,認為稍微更有吸引力

  • 右邊的女士,相對多達142%的人們給了她最低分

  • 然而,右邊女士收到的交友信息是左邊女士的3倍。


當我們開始用其他”長相和側臉相似,但收到的交友信息數不同”的人來配對時,這種樣式一次又一次呈現。收到訊息少的女性通常被認為有一貫的吸引力,而收到訊息多的女性往往在男人看來吸引力有分歧。下麵再舉幾個例子:


男人對女性長相越有分歧,就有越多的人喜歡她。 我 們感覺似乎能發現什麼,所以,作為數學書獃子,穿上運動褲。然後做了一些分析。 我們的第一個結論是:對女性評分數和她收到的交友信息數量做標準差比較,發現,男人們對女性長相評價的分歧越多,就有越多人喜歡她。對此繪製的喜好偏差與 收到的交友信息的關係曲線如下,再舉一些例子。


圖中沿曲線標識的女性在吸引力排名中大約為前80%。


這得用一點算術,而且很難用簡單的折線圖來解釋。基本原理是:根據女性得到的投票數,用一個公式來預測女性能得到多少關註量,關註量的計算是基於曲線上的投票數。用這個公式,我們可以把“男人認為女性長得怎麼樣”翻譯成“她能得到多少關註”。

我們得出的公式看上去不透明,但是用它計算,就會看到人們有趣的觀點,以及男人們會向哪些女性示好。


如果你對代數感興趣

我們以43000名女性的資料作為樣本用回歸法分析。 為保證前提一致,所有這些女人是異性戀, 年齡介於20和27歲之間,而且住在同一個城市。本文中給出的公式是降低m3,使其p值非常接近1後,第二次回歸得到的最佳結果 。


Msgs是觀察期內女性收到訊息數量。常數k反映了她在整個網站的活動水平。對於這個方程, R2 = .28, 這在實驗或問題研究中並不是一個大數字,但應用在真實的社會環境中非常好。

需要搞明白,最重要的是ms代表男人對她長相評價的投票,以此算出她收到的交友信息數曲線,譬如:


那些前面帶正號的投票數(ms):表示男人會發信息給女性,前面帶負號的:說明要減去信息數量。這個公式告訴我們的有以下信息: 認為你火辣(hot)的男人越多,你收到的信息就越多。 

我們怎麼知道此原理的——m5前面的0.9是最大的正數,也就是說,認為你很迷人(投票給你一個滿分’5′)的家伙們是給你發信息最多的貢獻者。這當然是個預測結果,提示給我們:公式是能講得通的。 覺得你可愛(cute)的男人,實際上應從你收到的信息中減掉。 我們怎麼知道此原理的——因為m4前面的繫數0.1是負數。這就說明,給你投票為’4′ 的人,認為你長相高於平均水平的那些人,實際上應從你收到的信息中剔除。非常令人驚訝。事實上,當你把它和m1前面的正數一起看,我們的公式從統計上看能說得通:


如果有人認為你不火辣(hot),那麼最好接下來他們認為:你醜。


這是一個非常瘋狂的結論,但我們每次計算——通過變換約束值,嘗試不同的資料樣本等,這個理論都會顯現生效。


5. 我們的想法是怎麼回事

所以這便是我們的悖論:當有些人認為你醜時,其他人更有可能發訊息給你。而當有些男人覺得你很可愛時,其他男人對你倒是缺乏興趣。為什麼會出現這種情況?也許得用點博弈論來解釋:


假設你是個男人,並真地對某人感興趣。如果你懷疑其他男人都不感興趣,就意味著更少人來競爭。因此,此想法會激勵你給她發送訊息。你可能會想:也許她很孤單……也許她恰好在等待一個欣賞她的人……至少我不會埋沒在人群里……也許這些小心思,加上事實上你真地覺得她漂亮,會促使你行動。發給她你精心考慮過的完美的開場詞。


“最近好嗎”


另一方面,’4′票占多數的女人,通常被認為可愛,但並不火辣,看上去的情形可能比實際上更受歡迎。一般男人會這樣考慮:她的魅力明顯足以吸引其他人和她交往。但不足以使男人不顧一切地給她發交往信息。這就是可愛的矛盾之處。
整個情形看起來是這樣:


6. 最後:這對你意味著什麼?

我不認為每個女人都關心是否其他人關註她。但是如果你關心的話,上面的分析有什麼實際意義呢? 好吧,從根本上,改變你的整體吸引力很難(也就是開篇我們討論的長相評分)。但是你創造出來的差別是掌控在自己手中的,很簡單,即:把差別最大化:


採用任何你認為有些人不喜歡的方式,突出展示出來。

正如你可能已經註意到的,帶紋身和穿孔的女性似乎憑直覺把握了這個原則。她們炫耀自己與眾不同之處,才不管人家喜不喜歡呢。而且她們得到很多人的關註。


但我們的建議可以適用於任何人。瀏覽OkCupid網站時,我發現眾多照片顯然在盡可能減少一些不具吸引力的特征——一個可能超重的人從生活照中剪切出來的頭像就是典型的例子。我們有些演算法表明:消減你的“瑕疵” 達到的效果會是相反的。如果你有點小胖,展示出來。如果你有一個大鼻子,展示出來。如果你有一個奇怪的暴牙,展示出來:從統計學上來說,不喜歡它的男人只會幫到你,那些喜歡它的人會更興奮。

轉自:IT大佬;

版權宣告:本號內容部分來自互聯網,轉載請註明原文鏈接和作者,如有侵權或出處有誤請和我們聯繫。

關聯閱讀

原創系列文章:

1:從0開始搭建自己的資料運營指標體系(概括篇)

2 :從0開始搭建自己的資料運營指標體系(定位篇)

3 :從0開始搭建自己的資料運營體系(業務理解篇)

4 :資料指標的構建流程與邏輯

5 :系列 :從資料指標到資料運營指標體系

6:   實戰 :為自己的公號搭建一個資料運營指標體系

7:  從0開始搭建自己的資料運營指標體系(運營活動分析)

資料運營 關聯文章閱讀:  

運營入門,從0到1搭建資料分析知識體系    

推薦 :資料分析師與運營協作的9個好習慣

乾貨 :手把手教你搭建資料化用戶運營體系

推薦 :最用心的運營資料指標解讀

乾貨 : 如何構建資料運營指標體系

從零開始,構建資料化運營體系

乾貨 :解讀產品、運營和資料三個基友關係

乾貨 :從0到1搭建資料運營體系

資料分析、資料產品 關聯文章閱讀:

乾貨 :資料分析團隊的搭建和思考

關於用戶畫像那些事,看這一文章就夠了

資料分析師必需具備的10種分析思維。

如何構建大資料層級體系,看這一文章就夠了

乾貨 : 聚焦於用戶行為分析的資料產品

如何構建大資料層級體系,看這一文章就夠了

80%的運營註定了打雜?因為你沒有搭建出一套有效的用戶運營體系

從底層到應用,那些資料人的必備技能

讀懂用戶運營體系:用戶分層和分群

做運營必須掌握的資料分析思維,你還敢說不會做資料分析

合作請加qq:365242293  


更多相關知識請回覆:“ 月光寶盒 ”;

資料分析(ID : ecshujufenxi )互聯網科技與資料圈自己的微信,也是WeMedia自媒體聯盟成員之一,WeMedia聯盟改寫5000萬人群。

赞(0)

分享創造快樂