課程目錄:用Spark和Python通過PySpark處理大數(shù)據(jù)培訓
4401 人關(guān)注
(78637/99817)
課程大綱:

       用Spark和Python通過PySpark處理大數(shù)據(jù)培訓

 

 

 

介紹

了解大數(shù)據(jù)

Spark概述

Python概述

PySpark概述

使用彈性分布式數(shù)據(jù)集框架分發(fā)數(shù)據(jù)
使用Spark API運算符分布計算
設(shè)置Python和Spark

設(shè)置PySpark

針對Spark使用Amazon Web Services(AWS)EC2實例

設(shè)置數(shù)據(jù)塊

設(shè)置AWS EMR集群

學習Python編程的基礎(chǔ)知識

Python入門
使用Jupyter Notebook
使用變量和簡單的數(shù)據(jù)類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環(huán)
實現(xiàn)函數(shù)
使用類
處理文件和異常
處理項目、數(shù)據(jù)、API
學習Spark DataFrame的基礎(chǔ)知識

Spark DataFrames入門
用Spark實現(xiàn)基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習

了解用MLlib進行機器學習

使用MLlib、Spark和Python進行機器學習

了解回歸

學習線性回歸理論
實現(xiàn)回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現(xiàn)一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)

學習樹方法論(Tree Methods Theory)
實現(xiàn)決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類

了解K均值聚類理論
實現(xiàn)K均值聚類代碼
進行群集示例練習
使用推薦系統(tǒng)

實現(xiàn)自然語言處理

理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理

用Spark進行流式處理概述
Spark流數(shù)據(jù)處理(Spark Streaming)示例練習

主站蜘蛛池模板: 狠狠久久永久免费观看| 成人免费看片又大又黄| 亚洲精品第一国产综合野| 亚洲黄色激情网| 天堂资源bt种子在线| 男女爱爱视频网站| yin荡护士揉捏乱p办公室视频| 双手扶在浴缸边迎合着h| 成人毛片18女人毛片免费视频未 | 一区二区三区视频在线播放| 啦啦啦手机完整免费高清观看| 打开腿我想亲亲你下面视频| 蜜桃视频在线观看官网| 中文字幕精品一区二区2021年| 同人本里番h本子全彩本子| 性欧美18~19sex高清播放| 狠狠色丁香婷婷久久综合蜜芽| 91精品国产免费| 亚洲a级片在线观看| 国产三区视频在线观看| 性猛交╳xxx乱大交| 深爱婷婷激情网| chinese麻豆自制国产| 久久久不卡国产精品一区二区| 免费无遮挡无码视频在线观看| 国产精品莉莉欧美自在线线| 日本精品久久久久中文字幕| 精品国产三级a∨在线欧美 | 国产h在线播放| 大学生一级毛片高清版| 最近中文字幕在线中文视频 | 波多野吉衣免费一区| 黄网站色视频免费观看45分钟| 一区二区三区在线看| 亚洲13又紧又嫩又水多| 又大又硬又黄的免费视频| 国产精品久久久久影院免费| 影音先锋在线免费观看| 明星造梦一区二区| 特级毛片全部免费播放a一级| 韩国电影禁止的爱善良的小子hd|