亚洲欧美成人中文日韩电影,一区二区三区动漫成人在线观看,少妇高潮惨叫久久久久久

本書以深度學(xué)習(xí)入門內(nèi)容為主線，通過(guò)數(shù)形結(jié)合的方式來(lái)漸進(jìn)式引導(dǎo)讀者進(jìn)行學(xué)習(xí)，力爭(zhēng)使各位讀者對(duì)于每個(gè)算法原理不僅要做到知其然更要做到知其所以然。同時(shí)，本書采用了深度學(xué)習(xí)中較為流行且簡(jiǎn)單易學(xué)的PyTorch框架來(lái)進(jìn)行示例，以便讓各位讀者在學(xué)習(xí)各個(gè)算法的原理過(guò)程中也能夠掌握其實(shí)際的用法。
本書共10章，分為深度學(xué)習(xí)領(lǐng)域發(fā)展和開(kāi)發(fā)環(huán)境配置、深度學(xué)習(xí)基礎(chǔ)和深度學(xué)習(xí)技術(shù)在自然語(yǔ)言處理領(lǐng)域方面的應(yīng)用三部分內(nèi)容。第一部分內(nèi)容（第1~2章）詳細(xì)介紹了深度學(xué)習(xí)的起源和發(fā)展階段及深度學(xué)習(xí)環(huán)境的安裝配置。第二部分內(nèi)容（第3~8章）介紹了深度學(xué)習(xí)入門的基礎(chǔ)內(nèi)容，包括線性回歸、梯度下降與反向傳播、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和模型的優(yōu)化等方面的內(nèi)容。第三部分（第9~10章）詳細(xì)介紹了自然語(yǔ)言處理領(lǐng)域的重要概念和技術(shù)發(fā)展路線，包括Seq2Seq、注意力機(jī)制、Transformer和GPT等目前主流的算法模型。
本書圖例豐富，原理與代碼講解通俗易懂，既可作為高等院校和培訓(xùn)機(jī)構(gòu)相關(guān)專業(yè)的教學(xué)參考書，也可作為對(duì)深度學(xué)習(xí)領(lǐng)域感興趣的工程師和研究人員使用。

作為《跟我一起學(xué)機(jī)器學(xué)習(xí)》的姊妹篇，兩年之后《跟我一起學(xué)深度學(xué)習(xí)》一書也終于出版了。北宋大家張載有言：為天地立心，為生民立命，為往圣繼絕學(xué)，為萬(wàn)世開(kāi)太平。這兩部著作雖然沒(méi)有這樣的宏偉愿景，但在它們的編寫過(guò)程中我們自始至終都秉持著為往圣繼絕學(xué)的想法在進(jìn)行。

作為機(jī)器學(xué)習(xí)方向的一個(gè)重要分支，深度學(xué)習(xí)在近年來(lái)的發(fā)展可謂大放異彩。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展，與之相關(guān)的技術(shù)應(yīng)用已經(jīng)深入滲透到了我們?nèi)粘Ｉ畹姆椒矫婷�，從醫(yī)療保健、金融服務(wù)到零售，以及從交通再到智能助理、智能家居等，尤其是在以GPT為代表的大語(yǔ)言模型出現(xiàn)以后，深度學(xué)習(xí)技術(shù)的影子更是無(wú)處不在。如今，利用ChatGPT來(lái)作為日常生產(chǎn)力工具更是成為一種共識(shí)。例如在本書的成文過(guò)程中ChatGPT就為我們提供了不少的靈感和啟示，部分內(nèi)容也是在ChatGPT的輔助下完成的，而這在10年乃至5年前都是難以想象的。也正因如此，對(duì)于這些熱門應(yīng)用背后技術(shù)的探索便逐漸成為計(jì)算機(jī)行業(yè)及高校所追捧的對(duì)象，但對(duì)于絕大多數(shù)初學(xué)者來(lái)講，想要跨入深度學(xué)習(xí)這一領(lǐng)域依舊存在著較高的門檻，所以一本數(shù) 形結(jié)合、動(dòng)機(jī)原理并重、細(xì)致考究的入門圖書就顯得十分必要了。

盡管目前市面上已經(jīng)存在著大量類似圖書，但現(xiàn)有圖書的不足之處在于往往太過(guò)高估了學(xué)生的學(xué)習(xí)能力。首先，這類圖書往往都只是羅列了一堆名詞概念、抽象晦澀的數(shù)學(xué)公式或是枯燥冗長(zhǎng)的代碼，而這對(duì)于初學(xué)者或是數(shù)學(xué)基礎(chǔ)比較薄弱的學(xué)生來(lái)講是極為糟糕的，作為過(guò)來(lái)人我們對(duì)此深有體會(huì)；其次，這類圖書在介紹各個(gè)算法時(shí)僅僅做到了知其然而不知其所以然，并沒(méi)有介紹每個(gè)算法模型出現(xiàn)的背景和動(dòng)機(jī)，仿佛它們都是一個(gè)個(gè)從天而降的獨(dú)立個(gè)體，彼此之間毫無(wú)前因后果的聯(lián)系；最后，對(duì)于算法原理或?qū)崿F(xiàn)的細(xì)節(jié)之處并沒(méi)有充分把握，往往會(huì)一筆帶過(guò)，而這就導(dǎo)致了初學(xué)者總有一種似是而非、朦朦朧朧的感覺(jué)。

數(shù)無(wú)形時(shí)少直覺(jué)，形少數(shù)時(shí)難入微，數(shù)形結(jié)合百般好，這是本書在編寫過(guò)程中所遵循的第一大原則。在學(xué)習(xí)深度學(xué)習(xí)相關(guān)內(nèi)容的過(guò)程中，如果只看論文，則只能了解到算法模型的整體思想而無(wú)法精確刻畫其中的細(xì)節(jié)之處；如果只看代碼，則會(huì)發(fā)現(xiàn)均是各種矩陣之間的四則運(yùn)算，并不知道其中的含義。因此，本書在寫作之初就始終秉持著要以數(shù) 形結(jié)合的方式來(lái)介紹每個(gè)算法模型，即先通過(guò)圖示直觀地來(lái)介紹模型的整體思想和原理，再通過(guò)實(shí)際的數(shù)學(xué)計(jì)算過(guò)程或代碼來(lái)刻畫其中的細(xì)節(jié)和模糊之處。用圖形去形像化，用代碼去唯一化，真正做到數(shù) 形結(jié)合，讓各位讀者能夠真正地做到看得懂、學(xué)得會(huì)、寫得出。為了將各個(gè)算法的建模原理表述清楚，本書使用了近400幅示意插圖。

為了直觀地感受卷積操作的計(jì)算過(guò)程，我們繪制了全部4種情況下的卷積計(jì)算示意圖；為了厘清GoogLeNet中各個(gè)網(wǎng)絡(luò)層的參數(shù)及輸出信息，我們重新繪制了更加詳細(xì)的網(wǎng)絡(luò)結(jié)構(gòu)圖并全方位地進(jìn)行了標(biāo)記；為了講清楚多頭注意力中多頭的概念，我們完整繪制了整個(gè)注意力機(jī)制的計(jì)算流程圖；為了講清楚BERT模型的預(yù)訓(xùn)練任務(wù)和4大經(jīng)典下游任務(wù)的構(gòu)建原理，我們對(duì)于每個(gè)任務(wù)模型和數(shù)據(jù)集構(gòu)建流程都進(jìn)行了圖例繪制；為了介紹百川大模型內(nèi)部的原理機(jī)制，我們又根據(jù)官方開(kāi)源的代碼繪制了其網(wǎng)絡(luò)結(jié)構(gòu)圖，以便讀者從第一眼就能把握其整體的技術(shù)架構(gòu)；為了講清楚大模型對(duì)話場(chǎng)景中的KeyValue緩存機(jī)制，我們根據(jù)Transformers框架中的實(shí)現(xiàn)代碼繪制了對(duì)應(yīng)原理圖。這樣的圖示還有很多，因?yàn)槲覀兪冀K相信，能夠用眼睛看到的一定是最直觀、最容易理解的。

知其然，更要知其所以然，這是本書在編寫過(guò)程中所遵循的第二大原則。任何一個(gè)算法的提出都不會(huì)是憑空捏造或無(wú)中生有的，它要么是為了解決新場(chǎng)景下的問(wèn)題，要么是為了對(duì)已有算法模型進(jìn)行改進(jìn)，因此明白一個(gè)算法模型背后的動(dòng)機(jī)就顯得格外重要了。一方面我們能更好地理解作者的想法及與其他算法模型之間的聯(lián)系；另一方面也可以學(xué)習(xí)如何去講好一個(gè)故事，所以我們不僅需要知道一項(xiàng)技術(shù)的原理，還需要知道為什么出現(xiàn)了這種技術(shù)、它的動(dòng)機(jī)是什么、它需要解決什么樣的問(wèn)題等。這樣才更有利于我們了解整個(gè)技術(shù)的發(fā)展脈絡(luò)并形成一個(gè)合理的思考方向。

因此，本書在行文過(guò)程中對(duì)于每個(gè)算法模型的介紹都遵循了動(dòng)機(jī) 原理的方式進(jìn)行，即先梳理其提出時(shí)的背景動(dòng)機(jī)，然后介紹其具體的實(shí)現(xiàn)原理，而不是直愣愣地開(kāi)始就某個(gè)算法模型進(jìn)行介紹，以至于前后銜接生硬。這也將使各位讀者不僅能學(xué)會(huì)一個(gè)算法的原理和使用方法，同時(shí)還能知道它所提出的契機(jī)，養(yǎng)成這樣的思維習(xí)慣對(duì)于一些讀者后續(xù)的論文寫作也是百利而無(wú)一害的。

如履薄冰，有理有據(jù)，這是本書在編寫過(guò)程中所遵循的第三大原則。在本書簽訂出版合同之初我們就預(yù)留了充分的時(shí)間，約定15個(gè)月交稿，計(jì)劃12個(gè)月完稿，而實(shí)際上14個(gè)月就完成了，目的就是能在一個(gè)輕松的氛圍下完成寫作。不過(guò)如果再算上之前在理解Transformer(2021年38月)和BERT(2021年8月2022年4月)這兩個(gè)模型所花費(fèi)的13個(gè)月時(shí)間，整本書總共歷經(jīng)了27個(gè)月，所以我們也時(shí)常告誡自己切莫心急浮躁、切莫急功近利、切莫誤人子弟，要為我們寫下的每一句話、每個(gè)字負(fù)責(zé)。同時(shí)，在本書的編寫過(guò)程中對(duì)于每個(gè)重要細(xì)節(jié)的把握我們也會(huì)進(jìn)行多方求證，力爭(zhēng)在理解上不會(huì)出現(xiàn)太大偏差。對(duì)于同一個(gè)模型的實(shí)現(xiàn)過(guò)程我們通常會(huì)參考不同框架中的實(shí)現(xiàn)源碼，例如參考TensorFlow、PyTorch、Transformers及論文作者的實(shí)現(xiàn)等，然后根據(jù)這些代碼整理出一份保留核心邏輯且適合初學(xué)者學(xué)習(xí)的示例代碼。

例如在介紹BERT模型的實(shí)現(xiàn)過(guò)程時(shí)，先后閱讀了GoogleResearch、PyTorch和Transformers框架中的相關(guān)實(shí)現(xiàn)過(guò)程；為了弄清楚fastText模型中關(guān)于中文Ngram的構(gòu)建方式，我們?cè)诠俜介_(kāi)源項(xiàng)目的dictionary．cc文件中找到了佐證；為了畫出ELMo模型的真實(shí)結(jié)構(gòu)圖，我們?cè)诠俜降腁llennlp庫(kù)中見(jiàn)到了答案；為了弄清楚大語(yǔ)言模型對(duì)話場(chǎng)景中模型在推理時(shí)的具體解碼過(guò)程，我們歷經(jīng)幾番周折終于在Transformer庫(kù)的generation/utils．py模塊中找到了示例，甚至就連GPT這個(gè)簡(jiǎn)稱的來(lái)歷我們也都細(xì)致地進(jìn)行了考究，而這些本可以一筆帶過(guò)。

對(duì)于GPT這個(gè)簡(jiǎn)稱的來(lái)歷，它到底應(yīng)該是Generative PreTraining的縮寫，還是Generative Pretraining Transformer的縮寫，我們也曾反復(fù)思考過(guò)很多次。此時(shí)有讀者可能會(huì)說(shuō)：這還用想？當(dāng)然是后者，因?yàn)镚PT用到的是Transformer中解碼器的部分�？僧�(dāng)時(shí)我們并不這樣認(rèn)為。首先GPT表示生成式預(yù)訓(xùn)練模型Generative PreTraining也并無(wú)不可，因?yàn)樗拇_是第1個(gè)大規(guī)模語(yǔ)料下的生成式預(yù)訓(xùn)練模型；其次GPT1的論文中并沒(méi)有明確交代T的代指，甚至全文中根本沒(méi)有出現(xiàn)GPT這一縮寫，反而從標(biāo)題Improving Language Understanding by Generative PreTraining來(lái)看它更符合是Generative PreTraining的縮寫；最后，我們檢索OpenAI 官網(wǎng)的所有論文和內(nèi)容后，仍沒(méi)有明確發(fā)現(xiàn)GPT的來(lái)由，但對(duì)于這件事的疑惑并沒(méi)有停止。在我們寫作GPT2的相關(guān)內(nèi)容時(shí)意外發(fā)現(xiàn)了論文的第二作者 Jeffrey Wu 的 GitHub賬戶。在瀏覽他的所有項(xiàng)目時(shí)我們意外發(fā)現(xiàn)了一個(gè)名為minGPT的工程，其簡(jiǎn)介中赫然寫到一句描述： A minimal PyTorch reimplementation of the OpenAI GPT(Generative Pretrained Transformer)training，到這里總算是找到了官方對(duì)于GPT簡(jiǎn)稱的認(rèn)證。

當(dāng)然，上面提到的細(xì)節(jié)之處本書中還有很多，讀者可以在閱讀學(xué)習(xí)的過(guò)程中自行慢慢體會(huì)。本書的目的只有一個(gè)，那就是所有的坑都讓我們先來(lái)踩，所有的錯(cuò)都先讓我們來(lái)犯，各位讀者只需跟隨本書的足跡一步一步踏入深度學(xué)習(xí)的大門。不過(guò)遺憾的是，這本書也只能剛好帶領(lǐng)各位讀者進(jìn)入深度學(xué)習(xí)的大門，至于怎么將這些技術(shù)用得更好、用得更出色還需要各位讀者在實(shí)際使用中進(jìn)行反復(fù)錘煉。

掃描目錄上方的二維碼可下載本書配套資源。

致謝

首先感謝清華大學(xué)出版社趙佳霓編輯的耐心指點(diǎn)，以及對(duì)本書出版的推動(dòng)。其次感謝在本書中所引用文獻(xiàn)的作者，沒(méi)有你們的付出也不會(huì)有本書的出版。如果說(shuō)我們看得比別人更遠(yuǎn)一些，那只是因?yàn)槲覀冋驹诹司奕说募绨蛏�。在本書的寫作過(guò)程中從《動(dòng)手學(xué)深度學(xué)習(xí)》《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》，以及斯坦福大學(xué)的CS224N和CS231N中獲得了不少靈感，在此特意向李沐老師和邱錫鵬老師及相關(guān)作者表示感謝，感謝這些深度學(xué)習(xí)領(lǐng)域中的巨人。同時(shí)我們也要感謝我們的家人在身后默默地支持我們。最后要感謝我自己，感謝那個(gè)曾經(jīng)無(wú)數(shù)次想要放棄但依舊堅(jiān)持下來(lái)的自己。

寫好一本書不容易，寫好一本能讓初學(xué)者讀懂且有所裨益的書更不容易。由于我們才學(xué)和資歷尚淺，書中難免存在著這樣或那樣目前尚未發(fā)現(xiàn)的錯(cuò)誤，因此還請(qǐng)各位讀者海涵與見(jiàn)諒。同時(shí)，也歡迎各位同行前輩對(duì)本拙作不吝指教。在今后的歲月里，我們也將不遺余力地持續(xù)去打磨這兩本書中的內(nèi)容，力爭(zhēng)以最直觀、最簡(jiǎn)潔和最有新意的語(yǔ)言將各個(gè)算法的原理與實(shí)現(xiàn)呈現(xiàn)在各位讀者面前，繼續(xù)秉持著為往圣繼絕學(xué)的初心。

王成
2024年12月于上海

你還可能感興趣

我要評(píng)論