本書所涵蓋的主題包括:數(shù)據(jù)預(yù)處理、預(yù)測建模、關(guān)聯(lián)分析、聚類分析、異常檢測和避免錯誤發(fā)現(xiàn)。通過介紹每個主題的基本概念和算法,為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實際問題所需的必要背景。
本書介紹了Spark應(yīng)用程序及更高級應(yīng)用的工作流程,主要從使用角度進行了描述,每個具體內(nèi)容都有對應(yīng)的代碼。本書涵蓋了ApacheSpark和它豐富的API,構(gòu)成Spark的組件(包括SparkSQL、SparkStreaming、SparkMLlib和SparkGraphX),在Sparkstandalone、Hado
本書是《網(wǎng)絡(luò)工程師教育叢書》的第7冊,介紹和討論大數(shù)據(jù)的基礎(chǔ)知識、技術(shù)原理和應(yīng)用。全書內(nèi)容分為6章,包括緒論、大數(shù)據(jù)采集和預(yù)處理、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)分析與計算、大數(shù)據(jù)可視化和大數(shù)據(jù)應(yīng)用。本書既介紹大數(shù)據(jù)技術(shù)基礎(chǔ)知識,又將這些知識與具體應(yīng)用有機結(jié)合起來,并借助可視化圖表深入剖析大數(shù)據(jù)技術(shù)原理和洞見數(shù)據(jù)價值的方法。各
本書從Hadoop的原理和使用出發(fā),在重點介紹Hadoop生態(tài)系統(tǒng)的重要組件HDFS、MapReduce、YARN、Hive和Spark的同時,注重大數(shù)據(jù)分析能力的全面提高。本書共分13章,主要內(nèi)容包括Hadoop簡介、HDFS文件系統(tǒng)、YARN資源管理、MapReduce計算框架、Hive簡介、Hive數(shù)據(jù)定義、Hi
本書是高職院校與北京昆侖通態(tài)自動化軟件科技有限公司共同開發(fā)的項目化教材,是“十二五”職業(yè)教育國家規(guī)劃教材。本書基于工作過程導(dǎo)向,面向“雙師型”教師和工控行業(yè)技術(shù)人員,服務(wù)于機電和自動化類專業(yè)的職業(yè)能力培養(yǎng)。本書由彩色紙質(zhì)教材和網(wǎng)絡(luò)資源組成。彩色紙質(zhì)教材主要包括:觸摸屏組態(tài)介紹、“觸摸屏+PLC”監(jiān)控工程、“觸摸屏+PL
本書由一線數(shù)據(jù)分析師精心編寫,通過大量案例介紹了數(shù)據(jù)分析工作中常用的數(shù)據(jù)分析方法與工具。本書包括5章內(nèi)容,分別是數(shù)據(jù)分析入門、數(shù)據(jù)分析從玩轉(zhuǎn)Excel開始、海量數(shù)據(jù)管理拿MySQL說事兒、數(shù)據(jù)可視化Tableau的使用、數(shù)據(jù)分析進階Python數(shù)據(jù)分析。本書通俗易懂、通過大量貼近企業(yè)真實場景的案例,幫助讀者在提高
本書由國內(nèi)IPFS社區(qū)公認*的領(lǐng)袖撰寫,從技術(shù)、原理與實戰(zhàn)3個維度講解了IPFS。全書一共分為3個部分:第壹部分:準(zhǔn)備篇(第1章)從宏觀角度簡單介紹了IPFS的概念、價值以及與區(qū)塊鏈的關(guān)系;第二部分:原理篇(第2~5章)分別深入講解了IPFS的工作原理、底層基礎(chǔ)、協(xié)議棧和架構(gòu)。第三部分:實戰(zhàn)篇(第6~8章)應(yīng)用IPFS
《數(shù)控技術(shù)》是數(shù)控原理、數(shù)控機床和數(shù)控編程三門課程主要內(nèi)容的有機結(jié)合,內(nèi)容包括緒論、數(shù)控編程基礎(chǔ)、數(shù)控車削編程、數(shù)控銑削編程,數(shù)控插補原理、伺服驅(qū)動系統(tǒng)、檢測系統(tǒng),數(shù)控機床的主傳動系統(tǒng)、數(shù)控機床的進給傳動系統(tǒng)、數(shù)控機床的典型結(jié)構(gòu)。本書以對數(shù)控機床的應(yīng)用為主線,以數(shù)控工藝的制訂到數(shù)控程序的編制為重點,從易到難,由淺至深,
《單圖及群圖挖掘:原理、算法與應(yīng)用》由DanaiKoutra和全球知名的數(shù)據(jù)挖掘領(lǐng)域奠基人之一ChristosFaloutsos教授合著,介紹了圖挖掘領(lǐng)域一個嶄新的研究方向。《單圖及群圖挖掘:原理、算法與應(yīng)用》內(nèi)容主要包括兩個部分:第壹部分介紹了單圖上的概要表示以及節(jié)點標(biāo)簽分類算法;第二部分介紹了群圖上的概要表示以及群
本書重點研究解決經(jīng)典控制方法受系統(tǒng)內(nèi)部和外部不確定性因素的影響導(dǎo)致的兩個問題(統(tǒng)稱為控制器參數(shù)在線優(yōu)化整定問題):一是對多路結(jié)構(gòu)相同但內(nèi)部、外部略有差異的被控對象,工程師需要使用相同的方法進行重復(fù)參數(shù)調(diào)試整定的問題,特別是對大慣性、有滯后的系統(tǒng)進行調(diào)試,會消耗大量時間和人力的問題;二是當(dāng)系統(tǒng)運行環(huán)境發(fā)生變化后,控制器無