歡迎光臨
每天分享高質量文章

Python解決資料科學問題的書籍

資料人才公眾號發佈的一系列工作機會,發現編寫Python代碼和使用Python解決資料科學問題,已是一項重要的技能。

資料挖掘工程師職位

風險策略分析師職位

高級資料挖掘工程師職位

本文給大家推薦3本利用Python解決資料科學問題的書籍。

1 Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

這本書是由Pandas庫的作者 Wes McKinney所寫。利用Python做資料分析,pandas庫我們必須要學,並且要熟練和靈活使用。你若是剛使用Python的資料分析師,或者你是想瞭解和學習資料分析或者資料科學的Python程式員,強烈推薦你認真地閱讀這本書,並且結合書本的配套原始碼做編碼練習和實際應用。你可以使用pandas庫有效地完成資料的加載,清洗,轉換,合併和重塑等任務。

原始碼的github鏈接:https://github.com/wesm/pydata-book
原始碼下載

1git clone https://github.com/wesm/pydata-book.git

2 Python Data Science Handbook: Essential Tools for Working with Data

熟悉Python代碼編寫的資料工作人員會發現,這本書非常適合日常處理實際問題:操作、轉換和清洗資料,可視化不同型別的資料,並利用資料構建統計或者機器學習模型。通過本書,你可以學習到這些內容。
IPython and Jupyter:一個為資料工作者使用Python提供的計算科學環境
Numpy:一個用於Python高效儲存和操作密集資料的n維陣列
Pandas:一個Python做資料分析的庫,可以結合第一本書的內容更深入地學習和更靈活地應用。
Matplotlib:一個強大的資料可視化庫。
Scikit-Learn:一個Python做機器學習的庫,可以完成機器學習裡面許多任務,例如:特征工程,分類,回歸,聚類,降維等。

原始碼的github鏈接:https://github.com/jakevdp/PythonDataScienceHandbook
原始碼下載

1git clone https://github.com/jakevdp/PythonDataScienceHandbook.git

3 Python machine learning

這本書詳細而系統地介紹了Python,Scikit-learn和tensorflow做機器學習和深度學習的事情,裡面涉及一系列機器學習演算法,比方說:傳統機器學習演算法,深度學習演算法,集成演算法等。

原始碼的github鏈接:

https://github.com/rasbt/python-machine-learning-book-2nd-edition
原始碼下載

1git clone https://github.com/rasbt/python-machine-learning-book-2nd-edition.git

赞(0)

分享創造快樂