歡迎光臨
每天分享高質量文章

趕緊收藏 : 從15000個Python開源專案中精選的Top30

本文轉自:AI科技大本營(ID:rgznai100);

本文由AI科技大本營 翻譯,參與 | SuiSui;  獲授權;

繼推出2017年機器學習開源專案Top 30榜單後,Mybridge AI又推出了一個Python開源專案Top 30榜單,包括開源Python庫、工具等。該榜單基於專案質量、用戶參與度以及其他幾個方面進行了評估,從大約15000個開源專案中挑選了Top 30,差不多都是在2017年1-12月發佈。這些專案在Github上的平均star為3707。

No 1:Home-assistant (v0.6+)

基於Python 3的開源家庭自動化平臺[Github 11357 stars,由Paulus Schoutsen提供]

https://github.com/home-assistant/home-assistant

No 2:Pytorch

PyTorch是使用GPU和CPU優化的深度學習張量庫,基於Python語言編寫。[Github 11019 stars,由PyTorch團隊的Adam Paszke和其他人提供]

https://github.com/pytorch/pytorch

No 3:Grumpy

Grumpy是一個Python to Go的原始碼翻譯編譯器和運行時,旨在取代CPython 2.7。關鍵區別在於,Grumpy是將Python原始碼編譯為Go原始碼,然後將其編譯為native code,而不是bytecode。這也就意味著Grumpy沒有虛擬機(VM)。編譯好的Go原始碼是對Grumpy運行時的一系列呼叫,一個Go庫服務於具有相似目的的Python C API。 [Github 8367 stars,由Google的Dylan Trotter及其他工作人員提供]。

https://github.com/google/grumpy

No 4:Sanic

該專案是一個類 Flask 的 Python 3.5+ 網頁服務器,專為加速而設計。Sanic支持異步請求處理,意味著你可以使用Python 3.5中一些async/await語法。。[Github 8028 stars,由Channel Cat和Eli Uriegas提供]

https://github.com/channelcat/sanic

No 5:Python-fire

一個可以從任何Python物件自動生成命令列界面(CLI)的庫。 [Github 7775 stars,來自Google Brain 的 David Bieber]

https://github.com/channelcat/sanic


No 6:spaCy(v2.0)

該專案是一個使用Python和Cython的進行高級自然語言處理(NLP)的開源庫 [Github 7633 stars,由Matthew Honnibal提供]

https://github.com/explosion/spaCy

No 7:Pipenv

Python.org官方推薦的Python打包工具。它會自動為專案創建和管理virtualenv,併在安裝/卸載軟體包時從Pipfile中添加/刪除軟體包。 [Github 7273 stars,由Kenneth Reitz提供]

https://github.com/pypa/pipenv

No 8:MicroPython

一個脫胎於Python且非常高效的Python實現,主要是為了能在嵌入式硬體上(這裡特指微控制器級別)更簡單地實現對底層的操作。[Github 5728 stars]

https://github.com/micropython/micropython

No 9:Prophet

該工具是Facebook開源的一款用於為多周期性的線性或非線性時間序列資料生成高質量預測的工具。[Github 4369 stars,由Facebook提供]

https://github.com/facebook/prophet

No 10:Serpent AI

該專案是一個Python寫的游戲代理框架,簡單而強大,可幫助開發者創建游戲代理。可將任何視頻游戲變成一個Python寫成的成熟沙箱環境。該框架的目的是為機器學習和AI研究提供一個有價值的工具,不過對於愛好者來說也是非常有趣的。[Github 3411 stars,由Nicholas Brochu提供]

https://github.com/SerpentAI/SerpentAI

No 11:Dash

Dash是一個純Python寫成的框架,無需JavaScript即可構建交互式的分析類web應用程式。[Github 3281 stars,由Chris P提供]

https://github.com/plotly/dash

No 12:InstaPy

Instagram機器人,喜歡/評論/Follow 自動化腳本。[Github 3179 stars,由TimG提供]。

https://github.com/timgrossmann/InstaPy

No 13:Apistar

專為Python 3定製的Web API框架[Github 3024 stars,Tom Christie提供]。

https://github.com/encode/apistar

No 14:Faiss

用於密集向量的高效相似性搜索庫和聚類的庫 [GitHub 2717 stars,貢獻者Facebook Research]

https://github.com/facebookresearch/faiss

No 15:MechanicalSoup

一個與網站自動交互的Python庫,自動儲存和發送cookies,支持重定向,並可以跟蹤鏈接和提交表格。[Github 2244 stars]

https://github.com/MechanicalSoup/MechanicalSoup


No 16:Better-exceptions

該專案以更友好的形式展示Python中的異常信息。[Github 2121 stars,貢獻者Qix]

https://github.com/Qix-/better-exceptions

No 17:Flashtext

該專案基於FlashText演算法,用以高效搜索句子中的關鍵詞併進行替代。[Github 2019 stars,由Vikash Singh提供]。

https://github.com/vi3k6i5/flashtext


No 18:Maya

在不同系統上的不同語言環境中,Python對日期時間的處理非常不暢,Maya主要就是為瞭解決解析網站時間資料問題。[Github 1828 stars,Kenneth Reitz提供]

https://github.com/kennethreitz/maya

No 19:Mimesis

是一個快速易用的Python庫,可以用不同語言為基於不同的目的生成合成資料。這些資料在軟體開發和測試階段非常有用。[Github 1732 stars,由LíkieGeimfari提供]

https://github.com/lk-geimfari/mimesis

No 20:Open-paperless

該專案是一個一個檔案管理系統,可掃描、索引和歸檔所有紙張文件。[Github 1717 stars,由Tina Zhou提供]

https://github.com/zhoubear/open-paperless

No 21:Fsociety

黑客工具包,滲透測試框架。[Github 1585 stars,Manis Manisso提供]

No 22:LivePython

Python代碼實時可視化跟蹤。[Github 1577 stars,由Anastasis Germanidis提供]

https://github.com/agermanidis/livepython

No 23:Hatch

一個Python專案、包以及虛擬環境的管理工具。[Github 1537 stars,由Ofek Lev提供]

https://github.com/ofek/hatch


No 24:Tangent

該專案是谷歌開源的一個用於自動微分的源到源純Python庫。[Github 1433 stars,來自Google Brain的Alex Wiltschko以及其他人]。

https://github.com/google/tangent

No 25:Clairvoyant

一個Python程式,用於識別和監控短期庫存移動的歷史線索[Github 1159 stars,由Anthony Federico提供]。

https://github.com/anfederico/Clairvoyant

No 26:MonkeyType

該專案是Instagram開源的一款適用於Python的工具,通過收集運行時型別來生成靜態型別註釋。[Github 1137 stars,由Instagram工程師Carl Meyer提供]。

https://github.com/Instagram/MonkeyType

No 27:Eel

該專案是一個小型Python庫,用於製作簡單的類似 Electron的離線HTML/JS GUI應用程式,當前僅支持Python3。 [Github 1137 stars]

https://github.com/ChrisKnott/Eel

No 28:Surprise v1.0

用於構建和分析推薦系統的Python scikit  [Github 1103 stars]

https://github.com/NicolasHug/Surprise

No 29:Gain

Web爬蟲框架。[Github 1009 stars,由高久力提供]

https://github.com/gaojiuli/gain

No 30:PDFTabExtract

一組用於從PDF檔案中提取表格的工具,有助於在掃描的文件上進行資料挖掘。 [Github 722 stars]

https://github.com/WZBSocialScienceCenter/pdftabextract


原文地址:https://medium.mybridge.co/30-amazing-python-projects-for-the-past-year-v-2018-9c310b04cdb3

關聯閱讀

原創系列文章:

1:從0開始搭建自己的資料運營指標體系(概括篇)

2 :從0開始搭建自己的資料運營指標體系(定位篇)

3 :從0開始搭建自己的資料運營體系(業務理解篇)

4 :資料指標的構建流程與邏輯

5 :系列 :從資料指標到資料運營指標體系

6:   實戰 :為自己的公號搭建一個資料運營指標體系

7:  從0開始搭建自己的資料運營指標體系(運營活動分析)

資料運營 關聯文章閱讀:  

運營入門,從0到1搭建資料分析知識體系    

推薦 :資料分析師與運營協作的9個好習慣

乾貨 :手把手教你搭建資料化用戶運營體系

推薦 :最用心的運營資料指標解讀

乾貨 : 如何構建資料運營指標體系

從零開始,構建資料化運營體系

乾貨 :解讀產品、運營和資料三個基友關係

乾貨 :從0到1搭建資料運營體系

資料分析、資料產品 關聯文章閱讀:

乾貨 :資料分析團隊的搭建和思考

關於用戶畫像那些事,看這一文章就夠了

資料分析師必需具備的10種分析思維。

如何構建大資料層級體系,看這一文章就夠了

乾貨 : 聚焦於用戶行為分析的資料產品

如何構建大資料層級體系,看這一文章就夠了

80%的運營註定了打雜?因為你沒有搭建出一套有效的用戶運營體系

從底層到應用,那些資料人的必備技能

讀懂用戶運營體系:用戶分層和分群

做運營必須掌握的資料分析思維,你還敢說不會做資料分析

赞(0)

分享創造快樂