歡迎光臨
每天分享高質量文章

第一張黑洞照片的背後 :資料科學與開放式科研

相信大家還記得不久前,北京時間4月10日晚9時許,全球觀眾都激動的守在屏幕前,等待人類史上第一張黑洞的“真容”。照片顯示的是位於星系M87中心的黑洞,距離地球約5500萬光年。儘管它有太陽的400萬倍,但它的距離是如此之遠以致於極難觀測,在地球上觀測這個黑洞,相當於站在紐約去測量一個位於洛杉磯的高爾夫球洞。  

 

現在,熱度和興奮過去了,我們是時候談談這張人類有史以來第一張黑洞照片的背後,資料科學和開放式科研到底起到了什麼樣重要的作用。

 

EHT是一個專門用於獲取黑洞影像的實驗專案,通過聯合全球多地的8組天文望遠鏡,構建一個口徑等同於地球直徑的“虛擬”望遠鏡,從而收集海量資料,並勾勒出黑洞的模樣。

這個科研專案的背後,還藏著另一支神秘的資料團隊

 

黑洞照片和普通拍照不同,為了獲取這張照片,需要分佈在全球各地的許多天文望遠鏡在同一時間“按下快門”,收集宇宙中傳來的各種無線電資料,包括關於黑洞的資料信息。

 

本來,根據射電望遠鏡資料還原天體圖像需要人類天文學家完成。然而面對如此大量稀疏、嘈雜的資料,想靠傳統的人力方法從中找出圖像太難了,但天文學家們自身並沒有演算法建模和機器學習的能力。於是,他們找到了Katie Bouman所在的演算法團隊,將裝著大量資料的硬碟交給他們,通過機器學習,把資料過濾、篩選並拼到一起,重建出圖像。以自己的專業資料知識,為成像演算法找到正確的方向。

 

Katie Bouman 今年29歲,當時她是一名MIT在讀的博士,Katie來自計算機科學專業,當時的她對於天文方面一竅不通。即使這樣,她還是帶領了這隻演算法團隊,成功構建出了這張黑洞照片,也成了第一批“看到”黑洞的人類之一。

 

開放式資料科學團隊合作,滲入各領域科研

黑洞照片的成功洗出,很大程度上得益於資料科學和機器學習技術的發展,但資料科學不僅僅為天文科學提供機會,它為各領域的科研都提供了更大可能。

 

2017年,就讀與University of North Texas 的一名生物學博士Sheela,研究不同治療方法對生育的影響,她用了好幾年的時間,終於採集到了104 個樣本,每個樣本包括29 個特征變數。但是當她試圖採用回歸和方差分析的手段,來構造模型時,卻發現結果和和原因一點兒顯著關係都沒有,這幾年的心血就要付之東流。

 

於是Sheela找到了他們學校的一個資料分析團隊,叫做DSA資料科學與分析部門(Data Science and Analysis),DSA中的成員對資料進行了整體的分析和,得出了基於決策樹的監督學習+遺傳演算法,然後採用BIC 做模型選擇。在得到的圖中,幾種不同療法,在不同的條件下,對應的效果差別一目瞭然,還給出了決策樹模型。最後,Sheela 不僅順利畢業,而且還把論文發在了一份很好的期刊上面。

 

提升科研效率的秘訣,引入外部資料科學力量

Sleena面對的問題,也是是大多數科研人員面臨的問題,因為他們已經把自己的全部精力用在了不斷追趕自身領域前沿上,並沒有餘力去提高自己的資料分析技能。

 

資料科學是專業領域,所以如果能引入科研團隊外部專業資料科學家的力量推進自己的科研中的資料分析環節,無疑是科研為科研之路的極大助力,可以讓更多人應用資料科學的門檻大幅降低。更可寶貴的,是這種一站式咨詢與合作方式,不僅可以幫助有困難的科研團隊解決燃眉之急,更有助於形成良性互動迴圈,使得科研專案做大做強。

資料科學協同研發平臺,獲得專屬的資料科學解決方案

隨著資料科學的需求水漲船高,在國外已經誕生了不少資料科學或科研服務眾包平臺,例如Gigster、Crowdicity、Presants、Numar.AI、Science Exchange等平臺,國內有heywhale和鯨社區,上面彙集了一大批資料科學家和資料科學專案。這些平臺以眾包方式解決科研中資料共享、協同創新等問題,在國外這已經是常態化的方式,國內雖然起步較晚,但也已經被越來越多的高校、科研機構、企業所接受。許多科研團隊和企業將自身專案中需要資料科學解決的問題發佈在平臺上,吸引各領域的專業資料人才,通過協同研發的方式提供解決方案。

 

中國的資料科學平臺和資料科學社區目前還正在快速發展期,HeyWhale和鯨科技是目前國內最大的第三方資料科學協同創新平臺,其社區擁有5萬多資料科學家用戶。今年和鯨社區開放了協同研發版塊,致力於幫助人才不足的團隊與企業解決資料問題。和鯨協同研發基於高質量的資料AI團隊、精細的過程管理規劃和強大的演算法分析研發工具Kescilab,三大基石為客戶服務提供了全面支持,並使用多重手段確保資料安全。

 

和鯨協作研發業務發佈流程非常簡潔,首先提出問題及需求,其次準備解決好對應問題的資料集,最後在和鯨社區主頁任務上發佈即可。和鯨會根據企業的具體需求給出實施方案;待任務發佈後,通過演算法匹配和多重篩選機制,找到合適人才;精細管理讓各團隊同時推進,及時知曉進度;交付驗收時,基於科學的評測機制,以賽馬機製成果選優方案。

 

 

在開放協同眾包服務後,清華大學的一個歷史科研團隊將自己的資料分析專案發佈在和鯨平臺上,短時間內便有數支擅長資料分析的隊伍參與,為該提供了資料分析方案,迅速推進了科研專案進度。目前,和鯨協同研發已經服務了來自清華大學、上海交通大學等頂級高校的科研團隊。

 

當技術發展到今天,協同創新平臺在科研中扮演越來越重要的作用。在像和鯨這樣的平臺上,科研工作者一方面可以繼續在“孤單”中埋頭苦幹、精耕細作;另一方面也可以和全球的同行聯合開展研究專案,共同推動科研成果與市場的對接。

 

在社交網絡的叢林中,科研社交與眾包平臺就像一塊遠離喧囂的寶地,聚集著來自全球的科研人員,交流學術成果、協作科學研究,並共同與市場建立起更緊密的聯繫。科學研究是一項具有鮮明雙重屬性的活動:一方面,科研工作者需要高度專註、耐得住寂寞與孤單,哪怕一輩子只發現了一種化學元素,一輩子只解答了一個科學猜想;另一方面,即使有保密和競爭需要,科研工作者仍然離不開跨國界、跨科學的交流。高質量的碰撞、溝通與協同,會產生更美麗的火花,甚至跨時代的發現與發明。

    已同步到看一看
    赞(0)

    分享創造快樂