《商業(yè)數(shù)據(jù)分析與Stata程序設(shè)計》闡述了如何設(shè)計Stata(Mata)程序以高效地完成數(shù)據(jù)分析。本書分為三個部分:第一部分介紹了構(gòu)成Stata(Mata)程序的基本要素,包括Stata的命令、變量(數(shù)據(jù)集)、宏與標(biāo)量,以及程序控制語句等;第二部分詳細(xì)介紹區(qū)間估計、假設(shè)檢驗、方差分析以及回歸分析等常用統(tǒng)計方法的基本原理及其Stata實現(xiàn)過程;第三部分詳細(xì)介紹Stata的do程序設(shè)計、ado程序設(shè)計、Mata編程基礎(chǔ)以及Mata和Stata之間數(shù)據(jù)交換的方法;第四部分介紹Stata回歸命令的格式化輸出方法以及圖形繪制的具體方法。
《商業(yè)數(shù)據(jù)分析與Stata程序設(shè)計》是一本經(jīng)管類專業(yè)本科精品教材,Stata具有優(yōu)異的交互式功能,基于整理好的數(shù)據(jù),在交互式環(huán)境下,當(dāng)用戶需要進(jìn)行特定方法下的統(tǒng)計分析時,只需運(yùn)行合適的Stata(Mata)命令便可得到結(jié)果。例如,用戶可以通過運(yùn)行reg(或xtreg)命令,便可實現(xiàn)回歸分析,運(yùn)行anova便可實現(xiàn)方差分析等。對于僅限于使用特定統(tǒng)計方法的用戶而言,只需掌握交互方式下特定命令的使用方法。因此,Stata具有易學(xué)易用的特點(diǎn),是一款可運(yùn)行于個人計算機(jī)的通用統(tǒng)計軟件。本書通過介紹構(gòu)成Stata(Mata)程序的基本要素,數(shù)理統(tǒng)計的基本原理以及常見統(tǒng)計方法的Stata運(yùn)用實例和do程序設(shè)計、ado程序設(shè)計、Mata編程基礎(chǔ)以及Mata和Stata之間數(shù)據(jù)交換的方法等三部分幫助學(xué)生掌握高效率實現(xiàn)數(shù)據(jù)分析的實操技巧,在寫作過程中還參考了大量的有關(guān)Stata(Mata)的軟件技術(shù)開發(fā)資料,如Stata 18的軟件說明書及Stata公司技術(shù)開發(fā)人員的論文或著作,理論與實踐緊密結(jié)合,推薦作為專業(yè)教材使用。
前言
Stata是一款可運(yùn)行于個人計算機(jī)的通用統(tǒng)計軟件。自1985年誕生以來,Stata已經(jīng)實現(xiàn)了多次更新升級。2023年4月,Stata公司發(fā)布了最新版本Stata 18。目前,Stata已成為一個功能完整的集成統(tǒng)計軟件包,可提供數(shù)據(jù)分析所需的數(shù)據(jù)處理、可視化、統(tǒng)計分析和自動報告等功能。由于軟件的開放性,Stata不但能夠?qū)崿F(xiàn)幾乎所有主流統(tǒng)計學(xué)中的方法,對于新出現(xiàn)的統(tǒng)計方法,Stata也能夠快速推出相應(yīng)的解決方案。特別是在2008年第8版中推出了用于矩陣運(yùn)算的Mata模塊后,Stata的數(shù)據(jù)運(yùn)算功能進(jìn)一步強(qiáng)化。因此,Stata受到越來越多用戶的認(rèn)可,市場占有率逐步擴(kuò)大,現(xiàn)在已經(jīng)成為主流的統(tǒng)計應(yīng)用軟件之一。據(jù)美國經(jīng)濟(jì)協(xié)會(美國經(jīng)濟(jì)評論雜志的主辦方)數(shù)據(jù)編輯Vilhuber的統(tǒng)計,2019年在經(jīng)濟(jì)學(xué)領(lǐng)域頂級期刊發(fā)表的論文中,高達(dá)73%的研究者使用Stata進(jìn)行數(shù)據(jù)分析(Vilhuber,2020)。
Stata具有優(yōu)異的交互式功能。基于整理好的數(shù)據(jù),在交互式環(huán)境下,當(dāng)用戶需要進(jìn)行特定方法下的統(tǒng)計分析時,只需運(yùn)行合適的Stata(Mata)命令便可得到結(jié)果。例如,用戶可以通過運(yùn)行reg(或xtreg)命令,便可實現(xiàn)回歸分析,運(yùn)行anova便可實現(xiàn)方差分析等。對于僅限于使用特定統(tǒng)計方法的用戶而言,只需掌握交互方式下特定命令的使用方法。因此,Stata具有易學(xué)易用的特點(diǎn),這也是Stata深受用戶特別是初學(xué)者歡迎的原因之一。
然而,在實際統(tǒng)計分析過程中,尤其是在經(jīng)驗實證研究過程中,數(shù)據(jù)分析變得越來越復(fù)雜,僅在交互式狀態(tài)下運(yùn)行特定命令已經(jīng)不能滿足數(shù)據(jù)分析的需求。首先,在數(shù)據(jù)分析中,用戶經(jīng)常需要重復(fù)執(zhí)行具有特定功能的命令。例如,在基于時間序列回歸方法估計某個資產(chǎn)的超額收益時,研究者可基于已經(jīng)整理的數(shù)據(jù),在交互式狀態(tài)下運(yùn)行reg命令,得到某個資產(chǎn)的超額收益的估計值。而金融市場上往往有數(shù)量眾多的資產(chǎn),因此需要基于每個資產(chǎn)的收益數(shù)據(jù)反復(fù)執(zhí)行reg命令才能夠獲得每個資產(chǎn)的超額收益。顯然,這在交互式狀態(tài)下通過重復(fù)運(yùn)行reg命令很難實現(xiàn)計算目的。其次,在數(shù)據(jù)分析中,用戶需要在多個Stata命令的運(yùn)行結(jié)果基礎(chǔ)上匯總數(shù)據(jù)以便做進(jìn)一步的綜合分析,以實現(xiàn)研究目的。顯然,僅僅通過在交互式狀態(tài)下運(yùn)行Stata命令很難達(dá)到數(shù)據(jù)綜合分析的目的。最后,數(shù)據(jù)分析所依賴的數(shù)據(jù)往往來自多個數(shù)據(jù)源,用戶需要將來自不同數(shù)據(jù)源的原始數(shù)據(jù)經(jīng)過整理、拼接,并形成Stata命令所需要的數(shù)據(jù)格式,才能夠正確運(yùn)行Stata(Mata)命令并完成統(tǒng)計分析。大多數(shù)的數(shù)據(jù)整理、拼接工作都很難在交互式狀態(tài)下通過輸入Stata(Mata)命令完成。由此可見,在數(shù)據(jù)分析中,僅在交互方式下通過運(yùn)行Stata命令很難滿足數(shù)據(jù)分析的需求。
通過編寫Stata程序可以高效率地實現(xiàn)數(shù)據(jù)分析。首先,用戶可以通過編寫Stata程序?qū)崿F(xiàn)命令的自動重復(fù)運(yùn)行;其次,由于Stata程序記錄了數(shù)據(jù)處理的整個過程,通過對程序的檢查分析,能夠發(fā)現(xiàn)數(shù)據(jù)處理過程中存在的問題;最后,用戶只需重新運(yùn)行程序,便能實現(xiàn)對數(shù)據(jù)重新處理而無需再次輸入Stata命令。因此,編寫Stata程序能夠大大提高數(shù)據(jù)處理的靈活性和準(zhǔn)確性,提高數(shù)據(jù)分析的效率。
本書闡述了如何設(shè)計Stata(Mata)程序以高效地完成數(shù)據(jù)分析。本書分為三個部分:第一部分介紹了構(gòu)成Stata(Mata)程序的基本要素,包括Stata的命令、變量(數(shù)據(jù)集)、宏與標(biāo)量等;第二部分介紹了數(shù)理統(tǒng)計的基本原理以及常見統(tǒng)計方法的Stata運(yùn)用實例。這部分內(nèi)容包括區(qū)間估計與假設(shè)檢驗、方差分析、回歸分析等內(nèi)容,以及聚類分析、主成分分析和因子分析的原理及運(yùn)用示例。第三部分詳細(xì)介紹了do程序設(shè)計、ado程序設(shè)計、Mata編程基礎(chǔ)以及Mata和Stata之間數(shù)據(jù)交換的方法;
本書在寫作過程中參考了大量的有關(guān)Stata(Mata)的軟件技術(shù)開發(fā)資料,如Stata 18的軟件說明書及Stata公司技術(shù)開發(fā)人員的論文或著作。其中,Baum(2014)和Gould(2018)無疑是最重要的關(guān)于Stata和Mata編程的著作。Baum(2014)主要講述Stata編程(部分內(nèi)容也討論了有關(guān)Mata編程的問題),而Gould是Stata公司的創(chuàng)始人,長期從事Stata軟件開發(fā)。Gould(2018)是目前唯一的一本專門闡述Mata編程的專著。讀者可以從這兩本專著獲得有關(guān)Stata和Mata編程的詳細(xì)資料。
本書得到了西華大學(xué)工商管理國家級一流本科專業(yè)建設(shè)項目的支持。在本書寫作過程中,西華大學(xué)國際經(jīng)濟(jì)與管理研究院的李明春、張菲菲、謝雨婷、黃一參與了本書的資料收集和文字校對等編寫工作;西華大學(xué)管理學(xué)院的研究生陳銘陽、陳耀、段志棟、劉琴、葉芮江、程楠、陳虹瑾也參與了本書的資料收集和文字校對等編寫工作。
本書適用于具有一定Stata軟件應(yīng)用基礎(chǔ)并需要提高Stata(Mata)數(shù)據(jù)分析能力的高年級本科生、研究生及相關(guān)研究人員。
目錄
第1章 Stata概述
1.1 Stata的發(fā)展歷程與軟件特點(diǎn)
1.2 Stata程序的類型及程序編輯器
1.3 Stata的命令與函數(shù)
1.4 Stata的文件組織與幫助資源
第2章 數(shù)據(jù)集與變量
2.1 數(shù)據(jù)集及其類型
2.2 觀測變量及其類型
2.3 變量的標(biāo)簽、注釋和格式化輸出
2.4 變量類型的轉(zhuǎn)換與變量的生成
2.5 數(shù)據(jù)集的合并
2.6 其它數(shù)據(jù)集管理命令
2.7 數(shù)據(jù)分析實例1數(shù)據(jù)集導(dǎo)入與管理
第3章 標(biāo)量、宏與矩陣
3.1 第一節(jié) 標(biāo)量
3.2 宏的定義及其引用
3.3 宏函數(shù)
3.4 Stata矩陣
3.5 Stata數(shù)據(jù)集與Stata矩陣的互相轉(zhuǎn)換
3.6 數(shù)據(jù)分析實例2打印九九乘法表
第4章 區(qū)間估計與假設(shè)檢驗及其Stata實現(xiàn)
4.1 總體、樣本以及樣本統(tǒng)計量
4.2 區(qū)間估計
4.3 假設(shè)檢驗
4.4數(shù)據(jù)分析實例3工人小時工資的區(qū)間估計與假設(shè)檢驗
第5章 方差分析及其Stata實現(xiàn)
5.1 方差分析的基本原理
5.2 數(shù)據(jù)分析實例4方差分析的Stata實現(xiàn)
第6章 相關(guān)分析與回歸分析
6.1 相關(guān)分析
6.2 回歸分析
6.3 回歸估計結(jié)果的格式化輸出
6.4 數(shù)據(jù)分析實例5工人小時工資影響因素分析
第7章 條件控制、循環(huán)與前綴子句
7.1 條件控制
7.2 循環(huán)
7.3 while
7.4 Stata命令的前綴(by,statsby,xi,rolling)
7.5 數(shù)據(jù)分析實例6比較變量中位數(shù)
第8章 do程序和ado程序設(shè)計
8.1 程序及其作用
8.2 do程序及其執(zhí)行
8.3 do程序參數(shù)傳遞
8.4 從do程序到ado程序
8.5 ado程序的類型、返回值與前綴
8.6 子程序及egen適用函數(shù)的設(shè)計
8.7 程序設(shè)計的常用命令
8.8 ado程序設(shè)計風(fēng)格指南
8.9 數(shù)據(jù)分析實例7估計基金超額收益
第9章 Mata基礎(chǔ)
9.1 為什么需要Mata?9
9.2 Mata程序(函數(shù))的結(jié)構(gòu)
9.3 Mata的變量類型
9.4 Mata的表達(dá)式與運(yùn)算符
9.5 條件控制與循環(huán)
第10章 Mata與Stata的數(shù)據(jù)交換
10.1 Mata獲取與修改Stata數(shù)據(jù)集
10.2 Mata獲取與修改Stata的宏、標(biāo)量與矩陣
10.3 Mata中獲取、修改Stata數(shù)據(jù)集中變量標(biāo)簽
10.4 顯示與刪除當(dāng)前內(nèi)存中的數(shù)據(jù)
10.5 數(shù)據(jù)分析實例8變量去均值處理
第11章 Mata程序設(shè)計
11.1 Mata程序的結(jié)構(gòu)
11.2 do程序中定義并調(diào)用Mata函數(shù)
11.3 在ado程序中定義并調(diào)用Mata函數(shù)
11.4 定義并添加Mata函數(shù)到Mata庫中并引用
11.5 線程代碼與Mata函數(shù)
11.6 結(jié)構(gòu)(struct)及其在程序設(shè)計中的應(yīng)用
11.7 Mata的類(class)及其在程序設(shè)計中的應(yīng)用
11.8 數(shù)據(jù)分析實例9雙重自舉抽樣法及其Mata編程實踐
第12章 圖形繪制
12.1 Stata的圖形種類與構(gòu)成要素
12.2 圖形繪制命令的標(biāo)準(zhǔn)選項
12.3 二維圖坐標(biāo)軸的設(shè)定
12.4 二維散點(diǎn)圖
12.5 二維柱形圖
12.6 二維函數(shù)圖形
12.7 直方圖
12.8 普通柱形圖
參考文獻(xiàn)