書單推薦 新書推薦 |
工程數(shù)值模擬中矩陣GPU并行計算基礎(chǔ)
本書系統(tǒng)闡述了在工程數(shù)值模擬中如何利用GPU并行計算加速大規(guī)模矩陣計算的核心原理與技術(shù)。本書第1-3章主要內(nèi)容為GPU并行計算的環(huán)境搭建和基礎(chǔ)架構(gòu),系統(tǒng)介紹了CPU/GPU架構(gòu)差異和CUDA編程模型、GPU環(huán)境配置及Python接口PyCUDA的搭建,幫助讀者快速入門。第4-5章深入解析核函數(shù)設(shè)計、線程組織與管理(網(wǎng)格、線程塊、線程束),以及GPU多層次存儲體系(全局內(nèi)存、常量內(nèi)存、紋理內(nèi)存、共享內(nèi)存等)的訪問機制與優(yōu)化策略。第6-8章介紹了具體的矩陣計算GPU編程實踐,涵蓋矩陣基本運算(加、乘、轉(zhuǎn)置等)的CPU(C++/Python)與GPU實現(xiàn)方法(CUDA核函數(shù)/cuBLAS庫),介紹了大型稀疏矩陣的壓縮存儲格式(COO/CSR/EL等)原理與編程實現(xiàn)。第9-11章介紹了矩陣計算的高階應(yīng)用與求解GPU編程方法和應(yīng)用,系統(tǒng)講解了矩陣分解(LU/Cholesky/QR/SVD)理論,以及基于cuSolver庫實現(xiàn)稠密/稀疏線性方程組的GPU并行求解方法,基于迭代法(CG法/PCG法)的GPU算法設(shè)計與優(yōu)化技術(shù)。本書旨在幫助讀者掌握利用GPU并行計算技術(shù)加速工程計算的核心方法,為處理現(xiàn)代大規(guī)模復(fù)雜工程問題提供強有力的工具。
你還可能感興趣
我要評論
|