數(shù)據(jù)科學的理論基礎是數(shù)學。本書共六章。前三章系統(tǒng)介紹了數(shù)據(jù)科學里廣泛使用的線性代數(shù)、概率論、微積分以及最優(yōu)化理論的相關基礎知識;后三章簡練闡述了網(wǎng)絡分析、量子算法、大模型的基本數(shù)學原理和一些代表性算法。書中部分應用案例源自作者的原創(chuàng)性工作,通過發(fā)現(xiàn)問題、分析問題、解決問題的邏輯鏈條,生動展示了數(shù)據(jù)建模在解決實際問題中的
數(shù)據(jù)是最有價值的資源,發(fā)掘這一價值需要超越技術本身。本書拋開數(shù)據(jù)科學技術的細節(jié),致力于解決該主題研究中通常沒有涵蓋的數(shù)據(jù)科學“其余部分”的關鍵問題。包括確立正確問題,收集正確數(shù)據(jù),進行正確分析,做出正確決策以及決策評估,與決策者建立信任,將數(shù)據(jù)科學團隊置于正確的組織節(jié)點,以及幫助公司實現(xiàn)數(shù)據(jù)驅(qū)動等內(nèi)容。這本書給出了數(shù)據(jù)
"《大數(shù)據(jù)平臺搭建與維護》以大數(shù)據(jù)平臺項目場景和工作任務驅(qū)動的方式搭建邏輯架構,以大數(shù)據(jù)平臺搭建與維護具體任務活動及工作步驟為核心構建內(nèi)容體系,全書以工作手冊的形式進行編寫!洞髷(shù)據(jù)平臺搭建與維護》共包括6個項目,介紹了Linux系統(tǒng)的安裝與配置、HadoopHDFS高可用集群搭建、HadoopYARN高可用集群搭建與
"本書以Hadoop及其周邊框架為主線,介紹了整個Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)組件以及平臺運維。本書從零開始逐一講解大數(shù)據(jù)體系中的各種技術,通過豐富的實戰(zhàn)案例闡述重點、難點知識,為初學者進入大數(shù)據(jù)領域打好基礎。書中各個項目設計合理,在每個項目開頭設置導讀,首先介紹知識點,然后緊跟實踐操作,最后在每個項目末尾通過課后
"本書是“新一代人工智能系列教材”之一,全面、詳細地介紹數(shù)據(jù)科學的基本問題、前沿技術及應用系統(tǒng)。本書共分為11章。第1章概述數(shù)據(jù)科學,介紹數(shù)據(jù)科學的現(xiàn)有技術與工具;第2章介紹數(shù)據(jù)治理,包括實體對齊、數(shù)據(jù)融合和數(shù)據(jù)清洗;第3章介紹數(shù)據(jù)定價,包括數(shù)據(jù)定價機制和模型定價機制;第4章至第7章介紹面向不同數(shù)據(jù)類型(地理空間數(shù)據(jù)、
本書編寫目的是向讀者介紹大數(shù)據(jù)技術的基本概念與應用。本書一共10章,分別講述了大數(shù)據(jù)介紹、云計算與大數(shù)據(jù)、大數(shù)據(jù)架構、大數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)安全、大數(shù)據(jù)的商業(yè)應用以及綜合實訓。本書將理論與實踐操作相結(jié)合,通過大量的案例及書中的二維碼幫助讀者快速了解和應用大數(shù)據(jù)分析相關
"本書旨在引導讀者全面了解分布式系統(tǒng)的核心原理、關鍵技術和實際應用。全書分為9章,內(nèi)容包括分布式系統(tǒng)概述、理論基礎、基礎架構,以及分布式文件系統(tǒng)HDFS、分布式計算模型MapReduce、分布式協(xié)調(diào)服務ZooKeeper、分布式數(shù)據(jù)庫HBase和分布式消息系統(tǒng)Kafka的工作原理與應用,最后提供兩個實戰(zhàn)項目,幫助讀者將
"本書在第1版的基礎上,進行了全面更新和擴充,旨在反映測控技術的**發(fā)展和國家戰(zhàn)略需求。全書共分9章,第1章簡要介紹測控系統(tǒng)的基本概念、系統(tǒng)構成以及發(fā)展趨勢;第2章介紹現(xiàn)代測控系統(tǒng)的理論方法;第3章介紹各種新型傳感器的原理及應用;第4章介紹基于網(wǎng)絡的測控技術與系統(tǒng);第5章介紹基于計算機視覺的測控技術與系統(tǒng);第6、7章分
"大數(shù)據(jù)分析包括查詢型分析、描述性分析、探索性分析、挖掘型分析等。本書介紹基于R語言的大數(shù)據(jù)分析解決方案。全書分3篇共18章。第1篇R語言,包括第1~10章,分別為R語言概覽、表達式、字符串與正規(guī)表達式、函數(shù)、向量、矩陣、數(shù)據(jù)框、列表、面向?qū)ο蟪绦蛟O計、數(shù)據(jù)存儲;第2篇可視化,包括第11、12章,分別為統(tǒng)計繪圖、圖形文
《數(shù)據(jù)凈界》是一本由行業(yè)資深人士組成的團隊撰寫的全面指南,旨在提供關于管理永久性和可持續(xù)性數(shù)據(jù)清除的詳盡指導,同時確保符合監(jiān)管、法律和行業(yè)標準。本書深入探討了數(shù)據(jù)凈化的原因、方法和時機,強調(diào)了數(shù)據(jù)凈化作為IT運營中實現(xiàn)循環(huán)的重要組成部分。作者還討論了關于數(shù)據(jù)清除的幾個新標準,包括IEEE和ISO即將發(fā)布的標準數(shù)據(jù)凈化如