教學優(yōu)勢
曙海教育的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系。曙海教育的課程在業(yè)內(nèi)有著響亮的知名度。
本課程,秉承20年積累的教學品質(zhì),以項目實現(xiàn)為導向,老師將會與您分享設(shè)計的全流程以及工具的綜合使用經(jīng)驗、技巧。
l?掌握數(shù)據(jù)分析的流程
l?掌握python數(shù)據(jù)分析核心庫的使用,如numpy、pandas、matplotlib
l?了解常用數(shù)據(jù)分析(挖掘)算法的原理,熟悉機器學習的各個環(huán)節(jié),并能利用相應(yīng)的算法建模
l?熟練使用sk-learn進行數(shù)據(jù)挖掘
?
章節(jié) |
主要授課內(nèi)容 |
? | |
? |
? 第1章 Python數(shù)據(jù)分析概述 |
1.數(shù)據(jù)分析的概念、流程、應(yīng)用場景 2.數(shù)據(jù)分析常用的工具、python數(shù)據(jù)分析的優(yōu)勢、常用類庫的介紹 3.Jupyter Notebook的安裝及使用 |
|
? |
? ? 第2章 Numpy數(shù)值計算基礎(chǔ) |
1.ndarray的創(chuàng)建、訪問、常用屬性 2.矩陣的創(chuàng)建 3.通用函數(shù)ufunc 4.廣播機制 5.數(shù)學知識 6.簡單統(tǒng)計分析,讀寫文件、排序、去重、常用統(tǒng)計函數(shù) |
|
? ? 第3章 Pandas統(tǒng)計分析基礎(chǔ) |
1.Series常用操作 2.DataFrame常用操作 3.讀寫不同數(shù)據(jù)源 4.數(shù)據(jù)過濾與轉(zhuǎn)換 5.時間序列操作 6.分組與聚合 7.透視與交叉表 |
? | |
? ? 第4章 利用pandas進行數(shù)據(jù)預處理 |
1.合并數(shù)據(jù),堆疊合并、主鍵合并、重疊合并 2.清洗數(shù)據(jù),處理重復值、缺失值、異常值的處理 3.標準化數(shù)據(jù),離差標準化、標準差標準化、小數(shù)定標標準化 4.轉(zhuǎn)化數(shù)據(jù) ,類別型特征處理為啞變量,連續(xù)性特征離散化處理 |
? | |
? ? 第5章? 數(shù)據(jù)可視化 |
1.數(shù)據(jù)可視化概述 2.常用圖表,如柱狀圖、餅狀圖、直方圖、箱線圖等的介紹 3.matplotlib繪圖基礎(chǔ),如基礎(chǔ)語法、rc參數(shù)、標簽刻度、子圖等 4.matplotlib繪圖實戰(zhàn) 5.pandas繪圖實戰(zhàn) |
? | |
第6章 機器學習與挖掘建模 |
1.機器學習概述 2.機器學習分類 3.機器學習流程 4.機器學習評估 5.經(jīng)典機器學習算法原理剖析,如 knn、kmeans、樸素貝葉斯、決策樹、線性回歸、邏輯回歸、支持向量機、關(guān)系分析等 6.關(guān)聯(lián)規(guī)則算法 7.時序模式 8.物體推薦算法 9.使用sk-learn建模,包括數(shù)據(jù)集劃分、數(shù)據(jù)預處理、模型訓練、模型評估等 |
? | |
第7章? 數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例 |
? | ? |
?