本書基礎理論和案例分析相結合,全面介紹了大數據技術的基礎知識,以提升讀者對大數據的認知。全書共11章,內容包括大數據概述、大數據時代的思維變革、大數據的采集與存儲、數據可視化、支撐大數據的技術、商業(yè)大數據、民生大數據、工業(yè)大數據、政務大數據、安全大數據和大數據的未來。本書既可作為全國高等學校計算機及相關專業(yè)“大數據導論
《精通Hadoop3》詳細闡述了與Hadoop3相關的基礎知識,主要包括Hadoop3簡介、深入理解Hadoop分布式文件系統、YARN資源管理器、MapReduce內部機制、Hadoop中的SQL、實時處理引擎、Hadoop生態(tài)圈組件、定義Hadoop中的應用程序、Hadoop中的實時流處理、Hadoop中的機器學習
本書是大數據教育系列教材之一。本書的主要內容包括:認識大數據、大數據技術基礎、大數據治理、大數據統計分析、數據挖掘、大數據可視化、大數據安全、大數據應用案例實操(零售、互聯網、金融保險、制造、網絡游戲、廣告、旅游等)等。本書編寫是以國運數據自主研發(fā)的大數據分析工具——“魔鏡”為平臺,理論結合實踐,通過具體案例介紹如何進
數據分析是指用適當的數學方法對收集來的大量數據進行分析,以求最大化地開發(fā)數據的功能,發(fā)揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究及概括總結的過程。數據分析的目的在于把隱藏在一大批看來雜亂無章的數據中的信息集中、萃取和提煉出來。 數據科學是高等學校非計算機專業(yè)本科學生必修的一門公共基礎課程,
保障和促進“新基建”的健康發(fā)展,重點在于建立健全以數據為中心的治理法治化架構與體系。本書緊緊圍繞新基建與數據治理法治化的各方面展開,主要論及新基建與數據權屬治理、數據競爭治理、數據綠色治理、數據跨境流動治理、數據安全發(fā)展治理等方面的現實問題與潛在風險,在此基礎上提出了相應對策和治理方案。
本書沿著時間的軌跡,講述了物理世界中宇宙和地球的誕生與演變,探討了生物世界中生命和人類的誕生與進化,討論了數字世界中科學技術的產生與進步。數據與物質和能量并駕齊驅,構成了人類宇宙的三個基本要素,并以此為基礎建立了物理、生物和數字三個各有千秋卻密切相連的世界!叭齻世界”的概念和框架構成了本書討論數據智能的基礎,為認識、
《數據挖掘原理(第4版)》解釋、探索了數據挖掘的主要技術,可以從數據中自動提取隱式和潛在有用的信息。數據挖掘越來越多地用于商業(yè)、科學和其他應用領域,它側重于分類、關聯規(guī)則挖掘和聚類。書中對每個主題都進行了清晰的解釋,重點是算法而不是數學公式,并通過詳細的有效示例加以說明。本書是為沒有強數學或統計學背景的讀者寫的,并詳細
本書理論聯系實際,配以大量實例,系統地介紹了大數據有關的基礎知識。全書共分10章,內容包括大數據概述,大數據、云計算與物聯網,大數據架構與Hadoop,數據采集與預處理,大數據分析與大數據挖掘,數據存儲與HDFS,MapReduce,數據可視化,大數據安全,大數據應用案例。本書主要作為本科和高職高專相關專業(yè)的教材,也可
大數據分析與挖掘已經廣泛應用于各行各業(yè)。本書以項目實踐為基礎,對大數據分析與挖掘的基礎知識進行了介紹,總結了機器學習、大數據分析與挖掘過程、數據分析挖掘框架和庫,分析了當前的研究熱點與前沿技術。為了增強本書的實用性、提高讀者的動手能力,本書結合案例討論了爬蟲與數據處理、Echarts和Python可視化、描述性分析、并
本書系統介紹數據科學的核心概念、基本方法和關鍵技術,內容涵蓋數據科學的導向目標,涉及科學計算、數據處理和分析、數據可視化等關鍵知識環(huán)節(jié)。本書基于Python技術框架實現,內容注重理論和實踐的有機融合,克服單調、晦澀的知識累積之苦,以問題為導向,學以致用,提供了大量的案例代碼和樣本數據集,可以為學習者平添幾分學習的樂趣。