Spark數(shù)據(jù)處理引擎是一個驚人的分析工廠:輸入原始數(shù)據(jù),輸出洞察。PySpark用基于Python的API封裝了Spark的核心引擎。它有助于簡化Spark陡峭的學(xué)習(xí)曲線,并使這個強(qiáng)大的工具可供任何在Python數(shù)據(jù)生態(tài)系統(tǒng)中工作的人使用!禤ython和PySpark數(shù)據(jù)分析》幫助你使用PySpark解決數(shù)據(jù)科學(xué)的
從信息資源管理協(xié)同創(chuàng)新視角,分析了大數(shù)據(jù)治理面臨的挑戰(zhàn)、機(jī)遇和焦點議題,大數(shù)據(jù)治理研究的視角、立場及代表性觀點,大數(shù)據(jù)治理的框架類型及其構(gòu)成要素。以公共價值理論、數(shù)字連續(xù)性理論、利益相關(guān)者理論和協(xié)同創(chuàng)新理論為主要理論支持,從大數(shù)據(jù)治理目標(biāo)、主體、治理客體、治理活動、治理環(huán)境等多個維度,分析了大數(shù)據(jù)治理的政策、標(biāo)準(zhǔn)和技術(shù)
首先,本書在內(nèi)容選擇上堅持“經(jīng)典”與“前沿”并重。一方面,系統(tǒng)全面地講述了無約束和有約束最優(yōu)化問題的常用求解方法,包括負(fù)梯度方法、牛頓方法、擬牛頓方法、共軛梯度方法、罰函數(shù)方法等。另一方面,加入近幾年在數(shù)據(jù)科學(xué)領(lǐng)域受到廣泛關(guān)注的一些新型一階最優(yōu)化方法,例如隨機(jī)梯度下降方法、小批量隨機(jī)梯度下降、動量方法、Nesterov
本書從理論上論述非線性系統(tǒng)的全局能控性.主要介紹平面仿射非線性系統(tǒng)和幾類特殊的高維非線性系統(tǒng)的全局能控性判據(jù),以及幾類多項式系統(tǒng)全局能控性的判別算法.另外,本書也對平面仿射非線性系統(tǒng)的全局漸近能控性及全局鎮(zhèn)定性做一點討論.
魯棒預(yù)測控制是在預(yù)測控制的基礎(chǔ)上考慮到實際系統(tǒng)存在著模型不精確或者參數(shù)時變、未知擾動等各種不確定性而發(fā)展起來的先進(jìn)控制技術(shù)。如何在魯棒預(yù)測控制的基礎(chǔ)上有效處理時變時滯對系統(tǒng)的影響成為工業(yè)過程控制亟待解決的問題。本書針對具有時變時滯的工業(yè)過程可能存在參數(shù)時變、強(qiáng)干擾、執(zhí)行器故障、非線性、多階段切換、時變跟蹤軌跡等問題,重
本書從需求規(guī)劃、需求實現(xiàn)到可視化展示等,遵循項目開發(fā)的主要流程,全景介紹了電商行業(yè)Flink實時數(shù)據(jù)倉庫的搭建過程。在整個項目的搭建過程中,介紹了主要組件的安裝部署、需求實現(xiàn)的具體思路、問題的解決方案等,并穿插了大數(shù)據(jù)和數(shù)據(jù)倉庫相關(guān)的理論知識,包括數(shù)據(jù)倉庫的概念介紹、電商業(yè)務(wù)概述、數(shù)據(jù)倉庫理論介紹和數(shù)據(jù)倉庫建模等。最核
本書全面介紹了SparkSQL語言如何建表、導(dǎo)入數(shù)據(jù)、查詢分析數(shù)據(jù)、統(tǒng)計數(shù)據(jù),以及如何使用函數(shù)處理數(shù)值、字符串、時間日期等常用數(shù)據(jù)元素,讓學(xué)生能夠在單機(jī)上學(xué)習(xí)企業(yè)分布式集群環(huán)境中的大規(guī)模數(shù)據(jù)分析方法。本書還介紹了如何用Scala語言編寫數(shù)據(jù)分析應(yīng)用,并編譯成可以提交到分布式集群上執(zhí)行的程序。本書旨在幫助學(xué)員入門,想進(jìn)一
通過完成書本中的實踐內(nèi)容及課后練習(xí),學(xué)生能夠深度理解大數(shù)據(jù)平臺Hadoop、HDFS、MapReduce的運(yùn)行原理,并能從實際業(yè)務(wù)環(huán)境出發(fā),將知識點與業(yè)務(wù)結(jié)合,提高實戰(zhàn)開發(fā)能力。本書共分為八章,主要介紹了大數(shù)據(jù)Hadoop平臺下的HDFS、MapReduce、Hbase的使用特點和使用方法。前四章主要介紹平臺架構(gòu)的核心
本書內(nèi)容包括Hadoop概述、Hadoop的安裝與配置管理、HDFS技術(shù)、YARN技術(shù)、MapReduce技術(shù)、HadoopI/O操作、海量數(shù)據(jù)庫技術(shù)HBase、ZooKeeper技術(shù)、分布式數(shù)據(jù)倉庫技術(shù)HIVE、Hadoop實時數(shù)據(jù)處理技術(shù)等。
本書是面向高等學(xué)校自動控制相關(guān)專業(yè)復(fù)變函數(shù)課程的教材,是作者基于一線教學(xué)經(jīng)驗,積極進(jìn)行教學(xué)內(nèi)容和教學(xué)方法創(chuàng)新的結(jié)果。本書的目的在于為自動控制相關(guān)專業(yè)的同學(xué)提供一本與專業(yè)知識密切結(jié)合的復(fù)變函數(shù)教材。本書在涵蓋復(fù)變函數(shù)課程的主要核心知識點的同時介紹復(fù)變函數(shù)與自動控制的關(guān)聯(lián)關(guān)系與具體應(yīng)用。本書共分為六章,分別介紹復(fù)數(shù)和復(fù)變函