歡迎光臨
每天分享高質量文章

大數據

站在風口上的大資料,究竟被什麼拖了後腿?-知識星球

站在風口上的大資料,究竟被什麼拖了後腿?

cycadmin阅读(6)赞(0)

導讀:當大資料帶給世界更多比特,這些實時產生的海量資料成為了一座開采難度巨大的礦山。大家都知道通過這些碎片化的資料能夠挖掘出更多價值,但是就目前的整體發展來看,大資料的應用遠沒有達到預期的效果,其原因有如下幾個。    ...

什麼是正態分佈?為何如此重要?終於有人講明白了-知識星球

什麼是正態分佈?為何如此重要?終於有人講明白了

cycadmin阅读(10)赞(0)

導讀:為什麼正態分佈如此特殊?為什麼大量資料科學和機器學習的文章都圍繞正態分佈進行討論?我決定寫一篇文章,用一種簡單易懂的方式來介紹正態分佈。 在機器學習的世界中,以概率分佈為核心的研究大都聚焦於正態分佈。本文將闡述正態分佈的概率,並解釋它...

​一文看懂資料清洗:缺失值、異常值和重覆值的處理-知識星球

​一文看懂資料清洗:缺失值、異常值和重覆值的處理

cycadmin阅读(11)赞(0)

  導讀:在資料清洗過程中,主要處理的是缺失值、異常值和重覆值。所謂清洗,是對資料集通過丟棄、填充、替換、去重等操作,達到去除異常、糾正錯誤、補足缺失的目的。     作者:宋天龍 如需轉載請聯繫大資料(ID:...

推薦 :菜鳥級機器學習入門(附代碼實體)-知識星球

推薦 :菜鳥級機器學習入門(附代碼實體)

cycadmin阅读(12)赞(0)

作者:Ben Sanders;翻譯:吳慧聰;校對:鄭滋 本文約2400字,建議閱讀10分鐘。 本文將簡要介紹什麼是機器學習,其運作原理,以及兩個主要的機器學習的演算法。 簡介 本文中,資料科學創業公司Yhat的前聯合創始人,現任Waldo的...

推薦 :如何改善你的訓練資料集?(附案例)-知識星球

推薦 :如何改善你的訓練資料集?(附案例)

cycadmin阅读(22)赞(0)

作者:Pete Warden;翻譯:申利彬; 本文約6800字,建議閱讀10分鐘。 本文作者基於自身專案經驗闡述訓練資料的重要性並分享了一些改進的實用技巧。 Lisha Li 攝   這張幻燈片是Andrej Karpathy 在Train...

手把手教你學Python:一文看懂字串基本操作-知識星球

手把手教你學Python:一文看懂字串基本操作

cycadmin阅读(16)赞(0)

導讀:很多程式員處理文本而不是數字。文本包含字符:字母、數字、標點符號、空格等。字串是一系列字符。例如,字串”Hello”是一個包含5個字符的序列。     作者:凱·霍斯特曼(Cay Horst...

谷歌發佈NLP最先進預訓練模型:開源BERT-知識星球

谷歌發佈NLP最先進預訓練模型:開源BERT

cycadmin阅读(25)赞(0)

作者:Jacob Devlin and Ming-Wei Chang, Research Scientists, Google AI Language;翻譯:佟海寧;校對:吳金笛 本文約2000字,建議閱讀9分鐘。 本文為你介紹谷歌最新發佈...

分享創造快樂