課程目錄:Cloudera數(shù)據(jù)分析師培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

          Cloudera數(shù)據(jù)分析師培訓(xùn)

 

 

 

1.Hadoop基礎(chǔ)知識(shí) ●Hadoop動(dòng)機(jī) ●Hadoop概覽 ●數(shù)據(jù)存儲(chǔ):HDFS ●分布式數(shù)據(jù)處理:
YARN、MapReduce和Spark ●數(shù)據(jù)處理與分析:Pig、Hive和Impala ●數(shù)據(jù)集成:Sqoop ●其它的Hadoop數(shù)據(jù)工具 ●練習(xí)分析場(chǎng)景說(shuō)明
2.Pig簡(jiǎn)介 ●Pig是什么 ●Pig的特點(diǎn) ●Pig使用案例 ●與Pig的交互
3.Pig基本數(shù)據(jù)分 ●PigLatin語(yǔ)法 ●加載數(shù)據(jù) ●簡(jiǎn)單數(shù)據(jù)類(lèi)型 ●字段定義 ●數(shù)據(jù)輸出 ●架構(gòu)查看 ●數(shù)據(jù)篩選和排序 ●常用函數(shù)
4.使用Pig處理復(fù)雜的數(shù)據(jù) ●數(shù)據(jù)存儲(chǔ)格式 ●復(fù)合/嵌套數(shù)據(jù)類(lèi)型 ●數(shù)據(jù)分組 ●復(fù)雜數(shù)據(jù)內(nèi)置函數(shù) ●遍歷分組數(shù)據(jù)
5.Pig多數(shù)據(jù)集操作 ●數(shù)據(jù)集合并技術(shù) ●在Pig中聯(lián)接數(shù)據(jù)集 ●集合運(yùn)算 ●拆分?jǐn)?shù)據(jù)集
6.Pig故障診斷和性能優(yōu)化 ●Pig故障排除 ●日志 ●使用Hadoop的WebUI ●數(shù)據(jù)采樣及調(diào)試 ●性能概述 ●了解執(zhí)行計(jì)劃 ●提高Pig作業(yè)性能的技巧
7.Hive和Impala簡(jiǎn)介 ●什么是Hive ●什么是Impala ●為什么使用Hive和Impala ●架構(gòu)和數(shù)據(jù)存儲(chǔ) ●Hive及Impala與傳統(tǒng)數(shù)據(jù)庫(kù)的比較 ●Hive使用案例
8.使用Hive和Impala進(jìn)行數(shù)據(jù)查詢 ●數(shù)據(jù)庫(kù)和表 ●基本的Hive和Impala查詢語(yǔ)言語(yǔ)法 ●
數(shù)據(jù)類(lèi)型 ●使用Hue來(lái)執(zhí)行查詢 ●使用Beeline(HiveShell) ●使用ImpalaShell
9.Hive及Impala數(shù)據(jù)管理 ●數(shù)據(jù)存儲(chǔ) ●創(chuàng)建數(shù)據(jù)庫(kù)和表 ●加載數(shù)據(jù) ●修改數(shù)據(jù)庫(kù)和表 ●
使用視圖簡(jiǎn)化查詢 ●存儲(chǔ)查詢結(jié)果10.數(shù)據(jù)存儲(chǔ)和性能 ●對(duì)表進(jìn)行分區(qū) ●分區(qū)表的數(shù)據(jù)加載 ●
何時(shí)使用分區(qū) ●文件格式的選取 ●使用Avro及Parquet文件格式
11.使用Hive和Impala進(jìn)行關(guān)系數(shù)據(jù)分析 ●連接數(shù)據(jù)集 ●常見(jiàn)的內(nèi)置函數(shù) ●聚合和窗口函數(shù)
12.復(fù)雜數(shù)據(jù)類(lèi)型 ●在Hive里使用復(fù)雜數(shù)據(jù) ●在Impala里使用復(fù)雜數(shù)據(jù)
13.使用Hive及Impala分析文本數(shù)據(jù) ●在Hive及Impala里使用正則表達(dá)式 ●在Hive里通過(guò)SerDe加載處理文本 ●情感分析及n-gram
14.Hive優(yōu)化 ●了解查詢性能 ●Bucketing(分桶) ●索引數(shù)據(jù) ●HiveonSpark
15.Impala優(yōu)化 ●Impala如何執(zhí)行查詢 ●改善Impala性能
16.擴(kuò)展Hive及Impala ●使用SerDe加載特殊格式文件 ●通過(guò)定制腳本來(lái)轉(zhuǎn)換數(shù)據(jù) ●用戶自定義函數(shù) ●參數(shù)化查詢
17.選擇好工具 ●比較Pig、Hive、Impala和關(guān)系數(shù)據(jù)庫(kù)該選擇哪一個(gè)

主站蜘蛛池模板: 亚洲狠狠ady亚洲精品大秀| 奇米影视7777狠狠狠狠影视| 动漫成年美女黄漫网站国产| 国产日产精品_国产精品毛片 | 女m羞辱调教视频网站| 老司机精品导航| 久久久久黑人强伦姧人妻| 天天综合色天天综合| 粗喘撞吟np文古代| 九九视频九九热| 国产女人18毛片水真多18精品| 月夜直播手机免费视频高清| 亚洲一区二区三区在线网站| 亚洲人成色7777在线观看不卡| 成人毛片免费视频| 精品无码人妻一区二区三区品| 久久精品视频大全| 国产精品嫩草影院在线| 欧美乱大交xxxxx| 一本一本久久aa综合精品| 免费无码一区二区三区| 夜夜揉揉日日人人青青| 欧美日韩国产va另类| a级毛片无码免费真人| 亚洲欧洲自拍拍偷综合| 国产欧美在线观看一区二区| 日本一二线不卡在线观看 | 欧美精品久久久久久久自慰| 田中瞳中文字幕久久精品| 久久人人爽人人爽人人av东京热| 国产激情在线视频| 成人小视频在线观看| 欧美精品久久久久久久影视| 黄色片免费网站| 一级毛片恃级毛片直播| 国产中文欧美日韩在线| 日本免费人成视频播放| 韩国毛片在线观看| 久久人人爽人人爽人人片av高请| 分分操这里只有精品| 好男人在线社区www影视下载|