課程目錄:GPU高性能計(jì)算培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

          GPU高性能計(jì)算培訓(xùn)

 

 

 

GPU離性能計(jì)算一
OpenACC編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. OpenACC基礎(chǔ):概念、與CUDA區(qū)別、編譯器、生態(tài);共享存儲(chǔ)結(jié)
2.0penACC開(kāi)發(fā)環(huán)境搭建配置

3.0penACC四步開(kāi)發(fā)流程:判斷并行性、并行化表達(dá)、顯式數(shù)據(jù)傳遂、優(yōu)化

?判斷并行性:Profile工具pgprof

?并行化表達(dá):引導(dǎo)關(guān)鍵字Kernerls和Parallel Loop

?顯式管理數(shù)據(jù)的拷貝:引導(dǎo)關(guān)鍵字Data

?優(yōu)化:統(tǒng)一內(nèi)存管理、線程并行層級(jí)、collapse、tile

OpenACC上機(jī)實(shí)操

? Hellow world ?矢量點(diǎn)乘

GPU高性能計(jì)S—
CUDA編程基礎(chǔ)
與優(yōu)化進(jìn)階

1. CUDA基礎(chǔ):API、數(shù)據(jù)并行、線程模型、存儲(chǔ)播型、控制、同步、并發(fā)和通信、加
速比

2. CUDA幵發(fā)環(huán)境搭建和工具配置

3. CUDA優(yōu)化進(jìn)階:線程組織調(diào)度、分支語(yǔ)句、訪存優(yōu)化、數(shù)據(jù)傳輸、原子操作

4. GPU并行計(jì)算模式及案例分析

分析調(diào)試:parallel nsight、visual profiler、cuda-gdb

5. CUDA生態(tài)系統(tǒng)和相關(guān)專業(yè)領(lǐng)域軟件介紹

GPU高性能計(jì)算一
深度學(xué)習(xí)

1.深度學(xué)習(xí)GPU解決方案:

? 基于GPU的交互式深度學(xué)習(xí)訓(xùn)練平臺(tái):DIGITS
? 深度學(xué)習(xí)框架的GPU加速:TensorFlow、Caffe等
? NVIDIA深度學(xué)習(xí) SDK:cuDNN, TensorRT, NCCL, CUDA-X
? 深度學(xué)習(xí)顯卡選擇

主站蜘蛛池模板: 91视频第一页| 精品国产男人的天堂久久| 中文字幕免费在线播放| 俺来也俺去啦久久综合网| 国产精品亚洲视频| 性色AV一区二区三区夜夜嗨| 男人j桶女人j免费视频| 浮力国产第一页| √天堂中文在线最新版8下载| 久久国产精品一区| 亚洲熟妇无码乱子av电影| 国产亚洲综合视频| 国产精品国语对白露脸在线播放| 成人毛片免费观看视频大全| 日韩色图在线观看| 男人的好在线观看免费视频| 风间由美性色一区二区三区| 2018天天操夜夜操| gaytv.me| 2021国产精品露脸在线| 制服丝袜怡红院| 日本SM极度另类视频| 亚洲第一页在线观看| 西西午夜无码大胆啪啪国模| 天天躁夜夜踩狠狠踩2022| 亚洲AV色香蕉一区二区| 福利网址在线观看| 国产成人久久精品二区三区| www.youjizz.com在线| 日美欧韩一区二去三区| 亚洲欧美日韩综合一区| 老头猛挺进小莹的体内小说全集| 国产精品林美惠子在线播放| 一级毛片私人影院| 日韩精品无码一本二本三本色| 人人妻人人澡人人爽人人dvd| 被男按摩师添的好爽在线直播| 国产精品高清一区二区三区不卡| 上原瑞穗最全番号| 日韩人妻系列无码专区| 亚洲欧美日韩成人网|