本書(shū)按照“理論+實(shí)戰(zhàn)”的形式編寫(xiě),將企業(yè)項(xiàng)目需求分解為單獨(dú)的任務(wù),全面系統(tǒng)地講解了大數(shù)據(jù)采集與預(yù)處理的相關(guān)知識(shí)與技術(shù)。全書(shū)針對(duì)數(shù)據(jù)采集的不同來(lái)源,將知識(shí)內(nèi)容分為五個(gè)項(xiàng)目,包括網(wǎng)絡(luò)數(shù)據(jù)采集、分布式消息系統(tǒng)Kafka、實(shí)時(shí)數(shù)據(jù)庫(kù)采集工具Canal和Maxwell、ETL日志采集技術(shù)棧以及ETL工具——Kettle。本書(shū)針對(duì)
全書(shū)共9章,內(nèi)容涉及數(shù)據(jù)采集、環(huán)境部署、Kettle安裝及應(yīng)用、pandas應(yīng)用以及Python應(yīng)用案例,由淺入深地介紹了數(shù)據(jù)可視化的基礎(chǔ)內(nèi)容。
"本書(shū)是一本面向大數(shù)據(jù)基礎(chǔ)知識(shí)學(xué)習(xí)、基本技能訓(xùn)練和場(chǎng)景應(yīng)用的項(xiàng)目化教程。全書(shū)共分為8個(gè)單元,內(nèi)容包括初識(shí)大數(shù)據(jù)、Linux應(yīng)用基礎(chǔ)、大數(shù)據(jù)存儲(chǔ)與計(jì)算、大數(shù)據(jù)編程基礎(chǔ)、數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化、大數(shù)據(jù)典型行業(yè)應(yīng)用分析。本書(shū)知識(shí)點(diǎn)全面,融合了大數(shù)據(jù)應(yīng)用開(kāi)發(fā)的新技術(shù)和多個(gè)典型行業(yè)應(yīng)用場(chǎng)景,突出情境案例導(dǎo)引
本書(shū)以大數(shù)據(jù)分析與挖掘的常用技術(shù)與真實(shí)案例相結(jié)合的方式,按照“概念和原理講解、案例分析、能力拓展——Python軟件應(yīng)用”的層次進(jìn)行闡述,深入淺出地介紹大數(shù)據(jù)分析與挖掘的重要內(nèi)容。全書(shū)共11章,第1章作為全書(shū)的緒論,介紹了大數(shù)據(jù)分析與挖掘的基本概念、行業(yè)應(yīng)用等;第2章介紹了Python的安裝、編程基礎(chǔ)以及常用的數(shù)據(jù)分析
Spark是業(yè)界主流的大數(shù)據(jù)計(jì)算框架。本書(shū)通過(guò)一系列大數(shù)據(jù)應(yīng)用案例和實(shí)踐項(xiàng)目貫穿始終,使用Python詳細(xì)闡述了Spark大數(shù)據(jù)環(huán)境的搭建、SparkRDD離線數(shù)據(jù)計(jì)算、SparkSQL離線數(shù)據(jù)處理、SparkStreaming實(shí)時(shí)數(shù)據(jù)計(jì)算等一系列常見(jiàn)的大數(shù)據(jù)處理問(wèn)題,并在此基礎(chǔ)上對(duì)Spark的核心概念及技術(shù)原理進(jìn)行了
我國(guó)互聯(lián)網(wǎng)平臺(tái)經(jīng)濟(jì)自2010年開(kāi)始步入快速發(fā)展階段,成為推動(dòng)經(jīng)濟(jì)、社會(huì)發(fā)展的重要引擎,也推動(dòng)著新業(yè)態(tài)新模式不斷涌現(xiàn)。在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)成為互聯(lián)網(wǎng)平臺(tái)經(jīng)濟(jì)的驅(qū)動(dòng)要素。平臺(tái)企業(yè)基于互聯(lián)網(wǎng)技術(shù),以數(shù)據(jù)作為生產(chǎn)要素對(duì)資源進(jìn)行配置。然而,互聯(lián)網(wǎng)平臺(tái)企業(yè)數(shù)據(jù)造假現(xiàn)象問(wèn)題一直存在,尤其是社交平臺(tái)、媒體廣告平臺(tái)、點(diǎn)評(píng)平臺(tái)問(wèn)題最為突出
本書(shū)第4版根據(jù)計(jì)算機(jī)控制與網(wǎng)絡(luò)技術(shù)的發(fā)展,基于工業(yè)界、科技界和教育界的成果進(jìn)行了全面修訂。本書(shū)面向新工科建設(shè)、工程教育專(zhuān)業(yè)認(rèn)證和卓越工程人才培養(yǎng)計(jì)劃,以立德樹(shù)人為根本任務(wù),以科學(xué)家精神、企業(yè)家精神、工匠精神等中國(guó)精神為動(dòng)力,以培養(yǎng)學(xué)生解決復(fù)雜工程和實(shí)際問(wèn)題的綜合能力為出發(fā)點(diǎn),以主流機(jī)型PC/ISA/PCI/PCIE總
本書(shū)是備受廣大讀者推崇的數(shù)據(jù)結(jié)構(gòu)與算法入門(mén)教程,已在GitHub獲得超60k的Star,并多次登頂GitHubTrending。書(shū)中系統(tǒng)介紹了數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)、復(fù)雜度分析、數(shù)組與鏈表、棧與隊(duì)列、哈希表、樹(shù)、堆、圖、搜索、排序、分治、回溯、動(dòng)態(tài)規(guī)劃和貪心算法等核心知識(shí),通過(guò)清晰易懂的解釋和豐富的代碼示例,以及生動(dòng)形象的
本書(shū)結(jié)合作者多年的研究成果和實(shí)踐經(jīng)驗(yàn),深入講解了PID控制器參數(shù)整定方法和復(fù)雜控制方案設(shè)計(jì)策略。書(shū)中首先介紹了PID控制器的基礎(chǔ)知識(shí),包括過(guò)程控制基本原理、PID控制器發(fā)展簡(jiǎn)史、PID參數(shù)影響分析、PID算法改進(jìn)等,之后結(jié)合實(shí)操案例重點(diǎn)講述了PID參數(shù)的Lambda整定方法,最后給出了串級(jí)控制、前饋控制、比值控制、超馳
主要內(nèi)容包括,大數(shù)據(jù)技術(shù)概述(或背景知識(shí)),Scala基礎(chǔ)知識(shí),Spark基礎(chǔ),RDD編程,SparkSQL開(kāi)發(fā),SparkStreaming/StructuredStreaming編程,MLLib機(jī)器學(xué)習(xí)編程等基礎(chǔ)內(nèi)容。 主要作為本科生數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)等相關(guān)專(zhuān)業(yè)必修或選修課程教科書(shū),或作為相關(guān)工