123,123

<pre id="11616"></pre>

<sub id="11616"><legend id="11616"></legend></sub>

歡迎進(jìn)入網(wǎng)上館配會(huì)薦購(gòu)選采服務(wù)平臺(tái) 圖書(shū)館單位會(huì)員注冊(cè) 圖書(shū)館讀者/館員登錄

書(shū)單推薦

·二十四節(jié)氣｜冬至

·二十四節(jié)氣｜白露

·二十四節(jié)氣｜處暑

·二十四節(jié)氣｜立秋

·二十四節(jié)氣｜大暑

·二十四節(jié)氣｜夏至

·科學(xué)出版社精品典藏

·清華大學(xué)出版社—2024年度好

新書(shū)推薦

更多

·《中國(guó)經(jīng)濟(jì)學(xué)(2025年第2輯總

·《行為博弈》

·《神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與應(yīng)用》

·《精準(zhǔn)落實(shí)》

·《新生物學(xué)本質(zhì)主義研究》

·《賞文物話(huà)中醫(yī)》

·《把熱愛(ài)變成事業(yè)》

軟件系統(tǒng)優(yōu)化郭健美黃波劉通宇林曉東趙鵬

軟件系統(tǒng)優(yōu)化郭健美黃波劉通宇林曉東趙鵬

定　　價(jià)：89 元

當(dāng)前圖書(shū)已被 1 所學(xué)校薦購(gòu)過(guò)！

查看明細(xì)

作者：郭健美黃波劉通宇林曉東趙鵬
出版時(shí)間：2024/12/1
ISBN：9787111772248
出版社：機(jī)械工業(yè)出版社

中圖法分類(lèi)：TP311.5
頁(yè)碼：
紙張：膠版紙
版次：
開(kāi)本：16開(kāi)

9

7

7

8

7

7

2

1

2

1

4

1

8

本書(shū)詳細(xì)介紹了軟件系統(tǒng)優(yōu)化的原理、技術(shù)和常用方法。本書(shū)強(qiáng)調(diào)從系統(tǒng)視角進(jìn)行優(yōu)化，提出了數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)優(yōu)化方法，圍繞軟件硬件數(shù)據(jù)三個(gè)方面展開(kāi)講解。本書(shū)共 18 章，分為五個(gè)部分。第1章和第2章從一個(gè)性能優(yōu)化案例引入，概述了軟件系統(tǒng)優(yōu)化的方法論。第二部分包括第 3~6 章，介紹了性能工程的基礎(chǔ)知識(shí)。第三部分包括第 7~10 章，介紹了計(jì)算機(jī)體系結(jié)構(gòu)優(yōu)化的相關(guān)知識(shí)。第四部分包括第 11~16 章，介紹了編譯優(yōu)化的相關(guān)知識(shí)。第五部分包括第17章和第18 章，針對(duì)新興場(chǎng)景下的系統(tǒng)優(yōu)化技術(shù)展開(kāi)專(zhuān)題討論。

前　　言

起源

本書(shū)是根據(jù)郭健美、黃波從2021年秋天起在華東師范大學(xué)數(shù)據(jù)科學(xué)與工程學(xué)院開(kāi)設(shè)的軟件系統(tǒng)優(yōu)化課程的講義總結(jié)而成的，該課程主要面向高年級(jí)本科生和低年級(jí)研究生講授軟件系統(tǒng)的性能優(yōu)化。

性能是衡量軟件系統(tǒng)質(zhì)量和競(jìng)爭(zhēng)力的一個(gè)重要方面，也是軟件系統(tǒng)設(shè)計(jì)、開(kāi)發(fā)和應(yīng)用過(guò)程中必須關(guān)注的一個(gè)基本屬性。如何在給定的硬件資源配置下提升軟件系統(tǒng)的性能，是數(shù)字化系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)過(guò)程中必須思考和解決的問(wèn)題，也是優(yōu)化利用軟硬件資源的有效途徑。

每一位卓越的軟件系統(tǒng)工程師、架構(gòu)師或研究人員都應(yīng)掌握軟件系統(tǒng)優(yōu)化的原理與技術(shù)。開(kāi)設(shè)軟件系統(tǒng)優(yōu)化方面的課程是解決我國(guó)計(jì)算機(jī)系統(tǒng)卡脖子問(wèn)題所需人才的有效措施。我們力求在訓(xùn)練相關(guān)人員解決實(shí)際問(wèn)題的過(guò)程中圍繞優(yōu)化思維培養(yǎng)系統(tǒng)觀和工程能力，鍛煉邏輯思維、批判性思維和創(chuàng)造性思維。

內(nèi)容

本書(shū)包括18章，分為五個(gè)部分。第一部分包括第1章和第2章，作為緒論，先介紹一個(gè)性能優(yōu)化案例，再概述軟件系統(tǒng)優(yōu)化的方法論。第二部分包括第3～6章，主要介紹性能工程的基礎(chǔ)知識(shí)。第三部分包括第7～10章，介紹計(jì)算機(jī)體系結(jié)構(gòu)優(yōu)化的相關(guān)知識(shí)。第四部分包括第11～16章，介紹編譯優(yōu)化的相關(guān)知識(shí)。第五部分包括第17章和第18章，主要針對(duì)新興場(chǎng)景下的系統(tǒng)優(yōu)化技術(shù)進(jìn)行專(zhuān)題討論。

本書(shū)適合高年級(jí)本科生、研究生或相關(guān)工程技術(shù)人員學(xué)習(xí)。在使用本書(shū)講授課程時(shí)，建議讀者先學(xué)習(xí)如下課程：計(jì)算機(jī)程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)、算法設(shè)計(jì)與分析、計(jì)算機(jī)系統(tǒng)。此外，如讀者能先修編譯原理、計(jì)算機(jī)組成與體系結(jié)構(gòu)等課程，就能更好地理解和掌握本書(shū)內(nèi)容。教師可根據(jù)課程要求、個(gè)人喜好、學(xué)生的背景和能力選講部分或全部章節(jié)。書(shū)中各章都給出了思考題，用于幫助讀者鞏固知識(shí)和引導(dǎo)讀者擴(kuò)展知識(shí)面。

讀者可以從https://solelab.tech/sso獲得與本書(shū)相關(guān)的更多資料，包括本書(shū)樣例程序的源代碼，以及軟件系統(tǒng)優(yōu)化課程的課件、上機(jī)作業(yè)、實(shí)踐項(xiàng)目等。

致謝

筆者在開(kāi)設(shè)軟件系統(tǒng)優(yōu)化課程之初，著重參考了以下兩門(mén)課程的教學(xué)設(shè)計(jì)和內(nèi)容：麻省理工學(xué)院的MIT 6.172Performance Engineering of Software Systems、圣路易斯華盛頓大學(xué)的WUSTL CSE567MComputer Systems Analysis。這兩門(mén)課程對(duì)本書(shū)的內(nèi)容組織產(chǎn)生了重要影響，在此向這兩門(mén)課程的授課教師Charles E. Leiserson、Julian Shun、Raj Jain等表示感謝。

本書(shū)由郭健美、黃波先根據(jù)授課講義和學(xué)生反饋確定本書(shū)的整體結(jié)構(gòu)和各個(gè)章節(jié)的大綱，然后分工撰寫(xiě)初稿，部分章節(jié)由Intel公司的林曉東、趙鵬編寫(xiě)，華東師范大學(xué)系統(tǒng)優(yōu)化實(shí)驗(yàn)室的研究生劉通宇、梁文輝、李寧、廖浩宇參與了本書(shū)的編寫(xiě)準(zhǔn)備工作。具體分工如下：第1章由郭健美編寫(xiě)，第2章由郭健美、黃波編寫(xiě)，第3～8章由劉通宇、郭健美編寫(xiě)，第9章和第17章由郭健美編寫(xiě)，第10章由趙鵬編寫(xiě)，第11～16章由黃波編寫(xiě)，第18章由林曉東編寫(xiě)。李寧、廖浩宇協(xié)助整理了部分文本、插圖和參考文獻(xiàn)。全書(shū)的編寫(xiě)通過(guò)審閱修改、交叉評(píng)審、逐步迭代的方式完成。

本書(shū)的成稿離不開(kāi)Intel公司相關(guān)專(zhuān)家的支持，林曉東、趙鵬分別作為華東師范大學(xué)的兼職教授、兼職副教授于2022年開(kāi)始參與軟件系統(tǒng)優(yōu)化課程的授課，并在工作之余編寫(xiě)了相關(guān)章節(jié)。

感謝清華大學(xué)陳文光教授和上海交通大學(xué)陳海波教授在百忙中閱讀了本書(shū)初稿，提出了寶貴的修改意見(jiàn)，并幫忙作序。

感謝機(jī)械工業(yè)出版社的各位編輯，他們耐心細(xì)致的工作確保本書(shū)得以順利出版。

軟件系統(tǒng)優(yōu)化涉及的知識(shí)內(nèi)容廣泛，罕有人士對(duì)其眾多分支領(lǐng)域均有精深理解。由于筆者學(xué)識(shí)水平有限，書(shū)中難免存在錯(cuò)謬，懇請(qǐng)讀者和同行批評(píng)指正，我們將不勝感激。

CONTENTS
目　　錄
推薦序一
推薦序二
前言
第一部分　緒論
第1章　開(kāi)篇案例：矩陣乘法的性能
優(yōu)化　2
1.1　不同編程語(yǔ)言的實(shí)現(xiàn)　2
1.2　循環(huán)交換　5
1.3　編譯器的不同優(yōu)化級(jí)別　7
1.4　多核并行優(yōu)化　8
1.5　循環(huán)分塊　11
1.6　內(nèi)建函數(shù)　15
1.7　本章小結(jié)　17
1.8　思考題　18
第2章　系統(tǒng)優(yōu)化方法論概述　19
2.1　后摩爾時(shí)代性能優(yōu)化的驅(qū)動(dòng)力　19
2.2　數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)優(yōu)化方法　21
2.3　從單點(diǎn)到全局的系統(tǒng)觀　21
2.4　本章小結(jié)　23
2.5　思考題　23
第二部分　性能工程基礎(chǔ)
第3章　性能測(cè)量　26
3.1　測(cè)量方法　26
3.1.1　外部測(cè)量　27
3.1.2　內(nèi)部測(cè)量　28
3.1.3　仿真測(cè)量　29
3.2　計(jì)時(shí)器的選擇　30
3.3　數(shù)據(jù)收集策略　33
3.3.1　計(jì)數(shù)型　33
3.3.2　采樣型　35
3.3.3　追蹤型　37
3.4　性能波動(dòng)　38
3.5　測(cè)量開(kāi)銷(xiāo)　42
3.6　測(cè)量誤差　43
3.7　本章小結(jié)　44
3.8　思考題　44
第4章　基準(zhǔn)評(píng)測(cè)　45
4.1　基準(zhǔn)評(píng)測(cè)程序　45
4.1.1　單一指令　46
4.1.2　指令組合　46
4.1.3　合成程序　47
4.1.4　程序內(nèi)核　47
4.1.5　微基準(zhǔn)評(píng)測(cè)程序　47
4.1.6　應(yīng)用基準(zhǔn)評(píng)測(cè)程序　48
4.2　標(biāo)準(zhǔn)化基準(zhǔn)評(píng)測(cè)套件　48
4.2.1　SPEC CPU 2017　49
4.2.2　基準(zhǔn)評(píng)測(cè)套件的開(kāi)發(fā)
標(biāo)準(zhǔn)　51
4.3　基準(zhǔn)評(píng)測(cè)的策略　52
4.3.1　固定計(jì)算的基準(zhǔn)評(píng)測(cè)　52
4.3.2　固定時(shí)間的基準(zhǔn)評(píng)測(cè)　52
4.3.3　可變計(jì)算和可變時(shí)間的
基準(zhǔn)評(píng)測(cè)　53
4.4　阿姆達(dá)爾定律　53
4.5　古斯塔夫森定律　54
4.6　本章小結(jié)　55
4.7　思考題　56
第5章　配置優(yōu)化　57
5.1　基本概念　57
5.2　技術(shù)挑戰(zhàn)　59
5.2.1　配置空間的組合爆炸　59
5.2.2　性能測(cè)量的高昂代價(jià)　60
5.2.3　復(fù)雜隱蔽的特征交互　61
5.3　實(shí)驗(yàn)設(shè)計(jì)　62
5.3.1　單次單因子設(shè)計(jì)　62
5.3.2　全因子設(shè)計(jì)　62
5.3.3　部分因子設(shè)計(jì)　63
5.3.4　2kr因子設(shè)計(jì)　64
5.3.5　隨機(jī)搜索　69
5.3.6　自動(dòng)調(diào)優(yōu)　70
5.4　基于機(jī)器學(xué)習(xí)的方法　70
5.5　領(lǐng)域知識(shí)驅(qū)動(dòng)的方法　72
5.6　本章小結(jié)　73
5.7　思考題　73
第6章　性能評(píng)價(jià)　74
6.1　評(píng)價(jià)目標(biāo)的設(shè)定　74
6.2　評(píng)價(jià)方法的選擇　75
6.2.1　評(píng)價(jià)方法的選擇條件　75
6.2.2　評(píng)價(jià)方法的優(yōu)缺點(diǎn)　76
6.3　評(píng)價(jià)指標(biāo)的選擇　77
6.3.1　評(píng)價(jià)指標(biāo)的分類(lèi)　77
6.3.2　評(píng)價(jià)指標(biāo)的選擇條件　78
6.3.3　量綱分析與合理性檢查　78
6.4　數(shù)據(jù)的分析與解釋　79
6.4.1　數(shù)據(jù)的匯總　79
6.4.2　數(shù)據(jù)的比較　81
6.5　常見(jiàn)錯(cuò)誤與規(guī)避方法　87
6.6　本章小結(jié)　88
6.7　思考題　88
第三部分　計(jì)算機(jī)體系結(jié)構(gòu)優(yōu)化
第7章　處理器優(yōu)化　90
7.1　五階段處理器　90
7.2　流水線(xiàn)執(zhí)行　93
7.2.1　指令流水線(xiàn)　93
7.2.2　前端與后端　94
7.2.3　流水線(xiàn)的性能評(píng)價(jià)和
細(xì)分　94
7.2.4　流水線(xiàn)的停頓與冒險(xiǎn)　95
7.3　超標(biāo)量處理　96
7.3.1　超標(biāo)量指令流水線(xiàn)　96
7.3.2　機(jī)器指令與微操作　98
7.4　亂序執(zhí)行　99
7.4.1　數(shù)據(jù)依賴(lài)的分類(lèi)　99
7.4.2　旁路　99
7.4.3　順序執(zhí)行與亂序執(zhí)行　100
7.4.4　寄存器重命名　102
7.5　推測(cè)執(zhí)行　103
7.5.1　條件分支造成的控制
冒險(xiǎn)　103
7.5.2　分支預(yù)測(cè)器　104
7.6　本章小結(jié)　105
7.7　思考題　105
第8章　存儲(chǔ)器優(yōu)化　106
8.1　高速緩存　108
8.1.1　存儲(chǔ)器的層次結(jié)構(gòu)　108
8.1.2　高速緩存的組織結(jié)構(gòu)　109
8.1.3　緩存預(yù)取　111
8.2　多核訪(fǎng)存架構(gòu)　113
8.2.1　多處理器系統(tǒng)架構(gòu)　113
8.2.2　異構(gòu)系統(tǒng)架構(gòu)　115
8.2.3　緩存一致性　116
8.3　編寫(xiě)緩存友好的代碼　120
8.3.1　順序訪(fǎng)問(wèn)數(shù)據(jù)　120
8.3.2　數(shù)據(jù)打包　121
8.3.3　對(duì)齊與填充　121
8.4　本章小結(jié)　123
8.5　思考題　123
第9章　微體系結(jié)構(gòu)性能分析　124
9.1　處理器性能的鐵律　124
9.1.1　優(yōu)化每時(shí)鐘周期的時(shí)長(zhǎng)　125
9.1.2　優(yōu)化指令路徑長(zhǎng)度　126
9.1.3　優(yōu)化CPI　128
9.2　CPI分解方法　129
9.2.1　根據(jù)不同類(lèi)型的指令進(jìn)行
CPI分解　129
9.2.2　根據(jù)不同停頓進(jìn)行CPI
分解　130
9.3　自頂向下的微體系結(jié)構(gòu)分析
方法　132
9.4　本章小結(jié)　134
9.5　思考題　135
第10章　異構(gòu)計(jì)算與編程　136
10.1　異構(gòu)計(jì)算概述　136
10.1.1　體系結(jié)構(gòu)的分類(lèi)　136
10.1.2　異構(gòu)計(jì)算的特性　138
10.2　并行編程框架　139
10.2.1　多核編程　139
10.2.2　多節(jié)點(diǎn)編程　144
10.3　異構(gòu)編程：SYCL　148
10.3.1　硬件設(shè)備抽象：設(shè)備和
隊(duì)列　148
10.3.2　數(shù)據(jù)訪(fǎng)問(wèn)方法　149
10.3.3　并行性表達(dá)　150
10.3.4　軟硬件結(jié)合　151
10.3.5　案例分析：矩陣乘法　153
10.4　本章小結(jié)　155
10.5　思考題　155
第四部分　編譯優(yōu)化
第11章　源程序級(jí)別的常見(jiàn)優(yōu)化
方法　158
11.1　程序的工作量　158
11.2　數(shù)據(jù)結(jié)構(gòu)優(yōu)化示例　159
11.2.1　打包和編碼　159
11.2.2　數(shù)據(jù)增添　160
11.2.3　預(yù)先計(jì)算　161
11.2.4　編譯時(shí)做初始化　162
11.2.5　緩存　163
11.2.6　稀疏性　164
11.3　程序邏輯優(yōu)化　166
11.3.1　常數(shù)折疊與傳播　167
11.3.2　公共子表達(dá)式消除　167
11.3.3　代數(shù)恒等替換　167
11.3.4　創(chuàng)建快速通道　168
11.3.5　邏輯短路　168
11.3.6　判斷順序　170
11.3.7　組合判斷　170
11.4　循環(huán)優(yōu)化　171
11.4.1　循環(huán)不變量外提　172
11.4.2　設(shè)置哨兵　172
11.4.3　循環(huán)展開(kāi)　173
11.4.4　循環(huán)合并　173
11.4.5　消除無(wú)用迭代　174
11.5　函數(shù)優(yōu)化　174
11.5.1　函數(shù)內(nèi)聯(lián)　174
11.5.2　尾遞歸消除　175
11.5.3　粗化遞歸　176
11.6　本章小結(jié)　176
11.7　思考題　177
第12章　編譯器概述　178
12.1　編譯器的定義、分類(lèi)及典型
架構(gòu)　178
12.1.1　編譯器的定義與分類(lèi)　178
12.1.2　編譯器的典型架構(gòu)　181
12.1.3　程序中間表示的
必要性　182
12.1.4　程序中間表示的設(shè)計(jì)
思考　183
12.1.5　LLVM IR：LLVM的程序中間表示　184
12.2　符號(hào)表　187
12.3　程序運(yùn)行時(shí)的內(nèi)存組織　188
12.4　程序分析和優(yōu)化　189
12.5　交叉編譯　191
12.6　用編譯器優(yōu)化程序的迭代
循環(huán)　192
12.7　本章小結(jié)　193
12.8　思考題　193
第13章　目標(biāo)指令集架構(gòu)與匯編
語(yǔ)言　194
13.1　編譯與匯編語(yǔ)言　194
13.2　x86-64指令集架構(gòu)　197
13.2.1　數(shù)據(jù)類(lèi)型　197
13.2.2　寄存器　198
13.2.3　指令　200
13.2.4　尋址方式　202
13.3　常用的匯編指令模式　204
13.4　浮點(diǎn)和向量化指令　205
13.4.1　浮點(diǎn)運(yùn)算指令　205
13.4.2　向量化指令　206
13.5　本章小結(jié)　208
13.6　思考題　208
第14章　C程序的匯編代碼生成　209
14.1　C程序是如何被轉(zhuǎn)換成匯編
代碼的　209
14.2　C程序轉(zhuǎn)換成LLVM IR　210
14.2.1　直線(xiàn)代碼到LLVM IR的
轉(zhuǎn)換　211
14.2.2　C函數(shù)到LLVM IR的
轉(zhuǎn)換　212
14.2.3　條件分支語(yǔ)句到LLVM IR的轉(zhuǎn)換　213
14.2.4　循環(huán)語(yǔ)句到LLVM IR的
轉(zhuǎn)換　215
14.2.5　LLVM IR中的屬性　217
14.2.6　小結(jié)　218
14.3　LLVM IR轉(zhuǎn)換成匯編程序　218
14.3.1　匯編制導(dǎo)指令與程序的
內(nèi)存布局　219
14.3.2　函數(shù)調(diào)用規(guī)范　220
14.4　本章小結(jié)　222
14.5　思考題　223
第15章　編譯器的優(yōu)化能力　225
15.1　編譯分析/優(yōu)化報(bào)告　225
15.2　編譯器常見(jiàn)的優(yōu)化能力　227
15.3　編譯優(yōu)化示例　228
15.3.1　標(biāo)量?jī)?yōu)化　230
15.3.2　結(jié)構(gòu)體優(yōu)化　232
15.3.3　函數(shù)調(diào)用優(yōu)化　234
15.3.4　循環(huán)優(yōu)化　236
15.4　編譯優(yōu)化的挑戰(zhàn)　238
15.4.1　靜態(tài)信息的不準(zhǔn)確性　238
15.4.2　編譯單元的局限性　239
15.4.3　優(yōu)化順序的不唯一性　240
15.5　鏈接時(shí)間優(yōu)化　240
15.6　本章小結(jié)　241
15.7　思考題　242
第16章　程序插樁與優(yōu)化機(jī)會(huì)識(shí)別　243
16.1　什么是程序插樁　243
16.1.1　程序插樁應(yīng)用示例　244
16.1.2　程序插樁的手段　246
16.2　二進(jìn)制翻譯助力程序插樁　246
16.3　利用插樁信息識(shí)別編譯優(yōu)化
機(jī)會(huì)　249
16.3.1　最原始的編譯器優(yōu)化
機(jī)會(huì)識(shí)別方法　249
16.3.2　常用的編譯優(yōu)化機(jī)會(huì)
識(shí)別方法　250
16.3.3　熱點(diǎn)驅(qū)動(dòng)的半自動(dòng)編譯
優(yōu)化機(jī)會(huì)識(shí)別框架　250
16.4　本章小結(jié)　257
16.5　思考題　257
第五部分　專(zhuān)題討論
第17章　數(shù)據(jù)中心的性能優(yōu)化　260
17.1　數(shù)據(jù)中心簡(jiǎn)介　260
17.2　混部應(yīng)用的性能干擾檢修　261
17.3　數(shù)據(jù)中心的性能分析　264
17.4　數(shù)據(jù)中心的性能評(píng)價(jià)　267
17.5　本章小結(jié)　272
17.6　思考題　272
第18章　深度學(xué)習(xí)框架的優(yōu)化　273
18.1　深度學(xué)習(xí)框架簡(jiǎn)介　273
18.2　優(yōu)化基礎(chǔ)　274
18.3　算子優(yōu)化　275
18.3.1　提高占用率　276
18.3.2　提高內(nèi)存帶寬的
利用率　277
18.3.3　使用（局部）共享
內(nèi)存　278
18.3.4　小結(jié)　278
18.4　基于計(jì)算圖的優(yōu)化　278
18.4.1　圖編譯器　279
18.4.2　圖編譯優(yōu)化　279
18.4.3　算子融合　280
18.4.4　MLIR簡(jiǎn)介　281
18.4.5　小結(jié)　281
18.5　本章小結(jié)　282
18.6　思考題　282
參考文獻(xiàn)　283

你還可能感興趣

我要評(píng)論

感谢您访问我们的网站，您可能还对以下资源感兴趣：

免费的a级毛片

性欧美牲交xxxxx视频极品美女扒开粉嫩小泬高潮 av视频一区在线播放亚洲最大无码一区二区三区