精品午夜av,av资源一区,av在线私库

課程目錄：Cloudera數(shù)據(jù)分析師培訓(xùn)

4401 人關(guān)注

（78637/99817）

課程大綱

課程大綱：

          Cloudera數(shù)據(jù)分析師培訓(xùn)

1.Hadoop基礎(chǔ)知識(shí)　●Hadoop動(dòng)機(jī)　●Hadoop概覽　●數(shù)據(jù)存儲(chǔ)：HDFS　●分布式數(shù)據(jù)處理：
YARN、MapReduce和Spark　●數(shù)據(jù)處理與分析：Pig、Hive和Impala　●數(shù)據(jù)集成：Sqoop　●其它的Hadoop數(shù)據(jù)工具　●練習(xí)分析場(chǎng)景說(shuō)明
2.Pig簡(jiǎn)介　●Pig是什么　●Pig的特點(diǎn)　●Pig使用案例　●與Pig的交互
3.Pig基本數(shù)據(jù)分　●PigLatin語(yǔ)法　●加載數(shù)據(jù)　●簡(jiǎn)單數(shù)據(jù)類(lèi)型　●字段定義　●數(shù)據(jù)輸出　●架構(gòu)查看　●數(shù)據(jù)篩選和排序　●常用函數(shù)
4.使用Pig處理復(fù)雜的數(shù)據(jù)　●數(shù)據(jù)存儲(chǔ)格式　●復(fù)合/嵌套數(shù)據(jù)類(lèi)型　●數(shù)據(jù)分組　●復(fù)雜數(shù)據(jù)內(nèi)置函數(shù)　●遍歷分組數(shù)據(jù)
5.Pig多數(shù)據(jù)集操作　●數(shù)據(jù)集合并技術(shù)　●在Pig中聯(lián)接數(shù)據(jù)集　●集合運(yùn)算　●拆分?jǐn)?shù)據(jù)集
6.Pig故障診斷和性能優(yōu)化　●Pig故障排除　●日志　●使用Hadoop的WebUI　●數(shù)據(jù)采樣及調(diào)試　●性能概述　●了解執(zhí)行計(jì)劃　●提高Pig作業(yè)性能的技巧
7.Hive和Impala簡(jiǎn)介　●什么是Hive　●什么是Impala　●為什么使用Hive和Impala　●架構(gòu)和數(shù)據(jù)存儲(chǔ)　●Hive及Impala與傳統(tǒng)數(shù)據(jù)庫(kù)的比較　●Hive使用案例
8.使用Hive和Impala進(jìn)行數(shù)據(jù)查詢　●數(shù)據(jù)庫(kù)和表　●基本的Hive和Impala查詢語(yǔ)言語(yǔ)法　●
數(shù)據(jù)類(lèi)型　●使用Hue來(lái)執(zhí)行查詢　●使用Beeline（HiveShell）　●使用ImpalaShell
9.Hive及Impala數(shù)據(jù)管理　●數(shù)據(jù)存儲(chǔ)　●創(chuàng)建數(shù)據(jù)庫(kù)和表　●加載數(shù)據(jù)　●修改數(shù)據(jù)庫(kù)和表　●
使用視圖簡(jiǎn)化查詢　●存儲(chǔ)查詢結(jié)果10.數(shù)據(jù)存儲(chǔ)和性能　●對(duì)表進(jìn)行分區(qū)　●分區(qū)表的數(shù)據(jù)加載　●
何時(shí)使用分區(qū)　●文件格式的選取　●使用Avro及Parquet文件格式
11.使用Hive和Impala進(jìn)行關(guān)系數(shù)據(jù)分析　●連接數(shù)據(jù)集　●常見(jiàn)的內(nèi)置函數(shù)　●聚合和窗口函數(shù)
12.復(fù)雜數(shù)據(jù)類(lèi)型　●在Hive里使用復(fù)雜數(shù)據(jù)　●在Impala里使用復(fù)雜數(shù)據(jù)
13.使用Hive及Impala分析文本數(shù)據(jù)　●在Hive及Impala里使用正則表達(dá)式　●在Hive里通過(guò)SerDe加載處理文本　●情感分析及n-gram
14.Hive優(yōu)化　●了解查詢性能　●Bucketing（分桶）　●索引數(shù)據(jù)　●HiveonSpark
15.Impala優(yōu)化　●Impala如何執(zhí)行查詢　●改善Impala性能
16.擴(kuò)展Hive及Impala　●使用SerDe加載特殊格式文件　●通過(guò)定制腳本來(lái)轉(zhuǎn)換數(shù)據(jù)　●用戶自定義函數(shù)　●參數(shù)化查詢
17.選擇好工具　●比較Pig、Hive、Impala和關(guān)系數(shù)據(jù)庫(kù)該選擇哪一個(gè)

課程教師

曙海專家講師

曙海的講師隊(duì)伍名校博士、碩士學(xué)歷的工程師占絕大多數(shù)，他們大部分為上海貝爾，TI德州儀器，華為，中科院，中興，Xilinx,Intel英特爾,NI公司，Cadence公司,Synopsys，IBM，Altera，Oracle，synopsys，微軟，飛思卡爾等大型公司高級(jí)工程師，項(xiàng)目經(jīng)理，技術(shù)支持專家，他們有著深厚的專業(yè)技能和技術(shù)素養(yǎng)，豐富的項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn)，基本上都有十多年實(shí)際項(xiàng)目經(jīng)驗(yàn)，開(kāi)發(fā)過(guò)多個(gè)大型項(xiàng)目。

?針對(duì)客戶實(shí)際需求，案例教學(xué)，邊講邊練，互動(dòng)式授課，曙海的專家講師以專業(yè)、敬業(yè)的精神，傾囊相授，不辜負(fù)每個(gè)學(xué)員的托付和期望。

進(jìn)階課程

實(shí)用Linux Shell編程 Vim編輯器 Linux命令實(shí)例練習(xí)

課程教師

進(jìn)階課程

開(kāi)始新實(shí)驗(yàn)

開(kāi)始評(píng)估課實(shí)驗(yàn)

開(kāi)始實(shí)驗(yàn)