本書分八個(gè)項(xiàng)目,內(nèi)容包括:大數(shù)據(jù)概述、Hadoop部署與應(yīng)用、Ambari安裝與應(yīng)用、HDFS項(xiàng)目開發(fā)與應(yīng)用、MapReduce項(xiàng)目開發(fā)與應(yīng)用等。
本書圍繞全國職業(yè)技能大賽大數(shù)據(jù)技術(shù)與應(yīng)用賽項(xiàng)的技能要點(diǎn):大數(shù)據(jù)平臺(tái)的搭建與運(yùn)維、大數(shù)據(jù)的采集與存儲(chǔ)、大數(shù)據(jù)的處理、數(shù)據(jù)的分析、數(shù)據(jù)的可視化等內(nèi)容展開,詳細(xì)講述了Numpy數(shù)值分析、Pandas統(tǒng)計(jì)分析、基于Matplotlib的數(shù)據(jù)可視化、Hadoop平臺(tái)及組件部署、Spark組件部署、python數(shù)據(jù)采集方法等內(nèi)容,
本書針對(duì)目前大數(shù)據(jù)發(fā)展的方向,就數(shù)據(jù)獲取領(lǐng)域介紹數(shù)據(jù)獲取原理和技術(shù)而專門編寫的教材。本選題在講解理論的同時(shí)突出實(shí)踐,在實(shí)踐中理解爬蟲的原理、爬蟲庫的使用,在講解技術(shù)的同時(shí)輔以案例來幫助讀者領(lǐng)會(huì)和掌握技術(shù)。本選題分為三大板塊,分別是基礎(chǔ)篇、實(shí)踐篇和拓展篇;A(chǔ)篇主要講述了爬蟲的基本原理、爬蟲的基本配置以及爬蟲相關(guān)庫的使用
本書分為基礎(chǔ)篇和技術(shù)篇兩部分,在每部分的章節(jié)中貫穿課程思政,通過本書的學(xué)習(xí),能夠讓讀者在了解和掌握大數(shù)據(jù)的基本知識(shí)和基本技能的基礎(chǔ)上,培養(yǎng)讀者的家國情懷、工匠精神;同時(shí),本書系統(tǒng)、全面地介紹大數(shù)據(jù)相關(guān)專業(yè)在“數(shù)據(jù)經(jīng)濟(jì)”政策引領(lǐng)下的學(xué)習(xí)指導(dǎo)。以“數(shù)字經(jīng)濟(jì)”的大數(shù)據(jù)驅(qū)動(dòng)為出發(fā)點(diǎn),一是介紹大數(shù)據(jù)的基礎(chǔ)知識(shí),包括大數(shù)據(jù)的概念及
近年來,多媒體技術(shù)的飛速發(fā)展,極大地促進(jìn)了大數(shù)據(jù)數(shù)據(jù)的增長。人們對(duì)大數(shù)據(jù)的需求有著不同的應(yīng)用,如大數(shù)據(jù)信息檢索、識(shí)別與合成等。然而,在混合大數(shù)據(jù)中,相互干擾給大數(shù)據(jù)信息處理帶來了巨大的障礙。如何從混合大數(shù)據(jù)中提取所需信號(hào)已成為一個(gè)重要的研究課題。因此,本書主要研究魯棒主成分分析(RPCA)及其擴(kuò)展模型的方法實(shí)現(xiàn)大數(shù)據(jù)分
本書著重分析了滿足高階內(nèi)模規(guī)律、存在多重非嚴(yán)格重復(fù)問題的被控系統(tǒng)的學(xué)習(xí)控制律設(shè)計(jì)問題;讦朔稊(shù),給出了一種P型迭代學(xué)習(xí)控制律設(shè)計(jì)的嚴(yán)格理論分析。在此基礎(chǔ)上,針對(duì)逐步復(fù)雜的分析對(duì)象,設(shè)計(jì)了幾種自適應(yīng)迭代學(xué)習(xí)控制律。研究對(duì)象從單輸入、單輸出,擴(kuò)展到多輸入、多輸出,從系統(tǒng)中存在高階內(nèi)模變化的未知參數(shù)且跟蹤非嚴(yán)格重復(fù)變化的參
本書綜合當(dāng)前數(shù)據(jù)挖掘領(lǐng)域的最新研究成果,系統(tǒng)地介紹了數(shù)據(jù)挖掘的基礎(chǔ)理論、技術(shù)原理、算法和應(yīng)用,以使讀者對(duì)數(shù)據(jù)挖掘有一個(gè)系統(tǒng)、全面的了解。本書主要介紹數(shù)據(jù)挖掘的基本概念和數(shù)據(jù)挖掘的過程;數(shù)據(jù)挖掘的主要技術(shù)、各類典型算法及其編程實(shí)現(xiàn),包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)預(yù)處理技術(shù)、數(shù)據(jù)相似度與異常檢測(cè)、關(guān)聯(lián)規(guī)則挖掘技術(shù)、分類技術(shù)、聚類技術(shù)等
隨著互聯(lián)網(wǎng)和移動(dòng)設(shè)備的普及,我們生產(chǎn)的數(shù)據(jù)越來越龐大,大數(shù)據(jù)的應(yīng)用也逐漸成為了各行各業(yè)的趨勢(shì)。特別是在決策分析領(lǐng)域,大數(shù)據(jù)的應(yīng)用能夠幫助我們更加準(zhǔn)確、高效地做出決策,提高決策的成功率和效果。本書基于這一未來既定趨勢(shì),從大數(shù)據(jù)基本理論開始介紹,意在幫助各行各業(yè)的人能夠認(rèn)識(shí)大數(shù)據(jù),理解大數(shù)據(jù),意識(shí)到大數(shù)據(jù)給未來生產(chǎn)生活中帶
本書分四章,第一章介紹如何搭建一個(gè)以R為中心的語料庫研究和處理平臺(tái),包括如何安裝和配置TreeTagger軟件以及Perl和Python解釋環(huán)境;第二章講解R編程的基本方法;第三章介紹用編程方式實(shí)現(xiàn)語料庫語言學(xué)的主要方法;第四章通過一些實(shí)例講解如何綜合運(yùn)用這些方法,以實(shí)現(xiàn)更復(fù)雜的語料庫研究需求。
本書內(nèi)容涵蓋機(jī)械結(jié)構(gòu)、電氣線路、傳感器檢測(cè)等自動(dòng)化生產(chǎn)線的基礎(chǔ)技術(shù),以及氣壓傳動(dòng)、變頻調(diào)試、交流伺服等運(yùn)動(dòng)控制技術(shù),還包括自動(dòng)化生產(chǎn)線基本組成單元的機(jī)電系統(tǒng)的裝調(diào)、PLC控制程序設(shè)計(jì)、人機(jī)界面設(shè)計(jì)、控制系統(tǒng)通信、系統(tǒng)運(yùn)行及維護(hù)等方面的技術(shù)實(shí)踐操作。