
CDA大數(shù)據(jù)分析師培訓(xùn)
一
python開(kāi)發(fā)基礎(chǔ)
1、Python概述
(1)計(jì)算機(jī)語(yǔ)言概述 (2)python簡(jiǎn)史 (3)python相關(guān)
2、python語(yǔ)法基礎(chǔ)
(1)Python環(huán)境配置 (2)python基礎(chǔ)語(yǔ)法 (3)變量 (4)數(shù)據(jù)類型
(5)表達(dá)式和運(yùn)算符 (6)分支結(jié)構(gòu) (7)循環(huán)結(jié)構(gòu)
3、函數(shù)
(1)函數(shù)初步 (2)細(xì)說(shuō)參數(shù) (3)變量作用域 (4)遞歸調(diào)用
4、內(nèi)置函數(shù)
(1)字符串相關(guān)-string(2)列表-list(3)元組-tuple(4)集合-set(5)字典-dict
二
python數(shù)據(jù)分析
數(shù)據(jù)科學(xué)和AI概述
數(shù)據(jù)結(jié)構(gòu)和算法
Python 數(shù)據(jù)分析與數(shù)據(jù)挖掘簡(jiǎn)介、環(huán)境搭建
Python數(shù)據(jù)分析工具箱
數(shù)據(jù)加載與存儲(chǔ)
數(shù)據(jù)規(guī)范化和處理
數(shù)據(jù)分析
數(shù)據(jù)挖掘
數(shù)據(jù)可視化
三
Hadoop大數(shù)據(jù)管理實(shí)戰(zhàn)應(yīng)用
1、Hadoop與大數(shù)據(jù)概要
(1)Hadoop生態(tài)系統(tǒng)介紹 (2)Hadoop集群安裝與部署 (3)Hadoop獨(dú)立部署
(4)Hadoop偽分布式安裝部署 (5)Hadoop集群安裝與部署 (6)Hadoop配置參數(shù)詳解
(7)Hadoop配置故障診斷
2、HDFS系統(tǒng)管理
(1)HDFS體系結(jié)構(gòu) (2)HDFS讀寫(xiě)過(guò)程-串行寫(xiě)與并行讀
(3)HDFS 管理接口-HDFS shell && HDFS Web Interface (4)HDFS 新增節(jié)點(diǎn)
(5)HDFS 刪除節(jié)點(diǎn) (6)HDFS 版本升級(jí) (7)HDFS 高可用性方案完全解析
3、Map/Reduce架構(gòu)與原理
(1)Map/Reduce體系結(jié)構(gòu) (2)Map/Reduce任務(wù)調(diào)度策略 (3)Map/Reduce 性能調(diào)優(yōu)
(4)Map/Reduce管理接口-Map/Reduce shell && Map/Reduce Web Interface
(5)Map/Reduce 類SQL工具Hive介紹
4、HBASE架構(gòu)與原理
(1)HBASE體系結(jié)構(gòu)(2)HBASE物理存儲(chǔ)(3)HBASE流程算法(4)HBASE與RDBMS的比較
(5)HBASE管理接口HBase Shell&& HBase Web Interface (6)Zookeeper介紹
5、Hadoop平臺(tái)操作實(shí)踐
(1)Hadoop集群部署(2)Hadoop文件管理(3)Hadoop數(shù)據(jù)管理(4)Hadoop集群監(jiān)控
(5)大數(shù)據(jù)應(yīng)用案例分析