Python及數(shù)據(jù)分析培訓(xùn)大綱
1.Python概覽
1.1為什么使用Python
1.2重要的Python庫
NumPy
Pandas
SciPy
Matplotlib
1.3IPython
1.4 Python IDE的下載與安裝
2.Python語言快速入門
2.1Python解釋器
2.2語言設(shè)計(jì)特點(diǎn)
2.3對(duì)象的調(diào)用和屬性
2.4import引入
2.5數(shù)據(jù)類型
2.6控制流
2.7數(shù)據(jù)結(jié)構(gòu)和序列
2.8函數(shù)
2.9 文件和操作系統(tǒng)
3.IPython使用
3.1啟動(dòng)和運(yùn)行
3.2對(duì)象內(nèi)省
3.3異常和跟蹤
3.4與操作系統(tǒng)交互
3.5測試代碼執(zhí)行時(shí)間
3.6IPython HTML Notebook
3.7利用IPython提高代碼效率的幾點(diǎn)提示
4.NumPy 4.1ndarray多維數(shù)組對(duì)象處理與運(yùn)算
4.2元素級(jí)數(shù)組函數(shù)
4.3利用數(shù)組進(jìn)行數(shù)據(jù)處理
4.4利用數(shù)組進(jìn)行輸入和輸出
4.5線性代數(shù)
4.6隨機(jī)數(shù)生成
5.Pandas 5.1Pandas數(shù)據(jù)結(jié)構(gòu)介紹
5.2基本功能
5.3匯總和計(jì)算描述統(tǒng)計(jì)
5.4處理缺失數(shù)據(jù)
6.Pandas數(shù)據(jù)加載和存儲(chǔ)
6.1讀寫結(jié)構(gòu)化數(shù)據(jù)
6.2讀寫非結(jié)構(gòu)化數(shù)據(jù)
6.3使用HTML和Web API
6.4使用數(shù)據(jù)庫
7.Pandas數(shù)據(jù)預(yù)處理
7.1合并數(shù)據(jù)集(以merge和append為主)
7.2重塑和軸向旋轉(zhuǎn)
7.3數(shù)據(jù)清洗
7.4字符串操作
8.Pandas數(shù)據(jù)聚合與分組運(yùn)算 8.1GroupBy技術(shù)
8.2數(shù)據(jù)聚合
8.3分組運(yùn)算和轉(zhuǎn)換
8.4透視表和交叉表
9.繪圖與可視化 9.1Matplotlib基本操作
9.2Pandas中的繪圖函數(shù)
10.時(shí)間序列
10.1日期和時(shí)間數(shù)據(jù)類型及工具
10.2 時(shí)間數(shù)據(jù)處理
10.3 時(shí)期及其算術(shù)運(yùn)算
10.4 時(shí)間序列繪圖
10.5 移動(dòng)窗口函數(shù)
11.Python在金融數(shù)據(jù)中的應(yīng)用
11.1常見的金融數(shù)據(jù)處理與分析
11.2 Pyfolio資產(chǎn)組合表現(xiàn)與風(fēng)險(xiǎn)分析
11.3 Zipline歷史數(shù)據(jù)回溯分析
12.大數(shù)據(jù)平臺(tái)的搭建和應(yīng)用
12.1Hadoop和MapReduce
12.2 Spark
12.3 PySpark及MLlib
12.4【案例與演示】
13.Scikit-Learn機(jī)器學(xué)習(xí)
13.1數(shù)據(jù)預(yù)處理
13.2 變量升維和降維
13.3 模型訓(xùn)練
13.4模型選擇和調(diào)參
13.5 模型評(píng)估指標(biāo) |