課程目錄:用Spark和Python通過PySpark處理大數據培訓
4401 人關注
(78637/99817)
課程大綱:

       用Spark和Python通過PySpark處理大數據培訓

 

 

 

介紹

了解大數據

Spark概述

Python概述

PySpark概述

使用彈性分布式數據集框架分發數據
使用Spark API運算符分布計算
設置Python和Spark

設置PySpark

針對Spark使用Amazon Web Services(AWS)EC2實例

設置數據塊

設置AWS EMR集群

學習Python編程的基礎知識

Python入門
使用Jupyter Notebook
使用變量和簡單的數據類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環
實現函數
使用類
處理文件和異常
處理項目、數據、API
學習Spark DataFrame的基礎知識

Spark DataFrames入門
用Spark實現基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習

了解用MLlib進行機器學習

使用MLlib、Spark和Python進行機器學習

了解回歸

學習線性回歸理論
實現回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)

學習樹方法論(Tree Methods Theory)
實現決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類

了解K均值聚類理論
實現K均值聚類代碼
進行群集示例練習
使用推薦系統

實現自然語言處理

理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理

用Spark進行流式處理概述
Spark流數據處理(Spark Streaming)示例練習

主站蜘蛛池模板: 成人免费观看一区二区| 三上悠亚中文字幕在线播放| 色偷偷人人澡人人爽人人模| 手机免费在线**| 免费A级毛片无码无遮挡| 97青青草视频| 最近中文字幕在线中文高清版| 国产大学生粉嫩无套流白浆| 中文字幕日韩欧美一区二区三区 | 三个人躁我一个| 波多野结衣电影thepemo| 国产精品国产国产aⅴ| 久久成人免费电影| 精品在线视频免费| 国产香蕉一区二区在线网站 | 日韩一级片免费| 午夜一级做a爰片久久毛片| 99久久亚洲综合精品网站| 有人有看片的资源吗www在线观看 有坂深雪初尝黑人在线观看 | jux662正在播放三浦惠理子| 欧美成人精品高清在线观看| 国产又色又爽又刺激视频| 三上悠亚破解版| 欧美日韩一区二区三区麻豆| 国产国产精品人在线视| √天堂资源地址在线官网| 欧美怡红院免费的全部视频| 国产亚洲美女精品久久久2020| selao久久国产精品| 欧美一区二区影院| 又粗又大又硬又爽的免费视频| 99re66热这里都是精品| 日韩中文字幕在线| 人妻少妇精品专区性色AV| 久久五月激情婷婷日韩| 性asmr视频在线魅魔| 亚洲午夜无码久久| 美女视频黄频a免费观看| 国产精品高清一区二区三区不卡| 久久久久久综合| 欧美综合自拍亚洲综合图片区|