PART 1如何寫一篇比較規範的實證研究論文
今天就實證研究中的幾個方面和大家聊聊。很高興在微信課堂和大家輕松聊天,中間你們有什麼問題就可以互動,咱們群裡有本科生碩士生博士生,大家在學習過程中會經常會遇到如何寫一篇比較規範的論文的問題,我的研究主要是實證方面的,所以就此點和大家具體交流一下。
我把實證研究文章的框架簡單地列了幾部分,僅個人觀點,在經濟學的文章寫作中有純理論的經濟學的文章,也有實證研究方面的文章,它們寫作的特點并不一樣,我們一起讨論實證研究文章該怎麼寫,寫作框架注意什麼問題,每一部分應該關注哪些點,對于實證研究即Empirical study我在下面圖片中主要列了六個部分。
這六部分其實我個人也把它叫做寫文章的框架的八股文的格式,學術論文比較規範,我就這幾個部分和大家探讨:
第一,為什麼要寫這篇文章,你做研究、寫文章的意義是什麼,也就是the importanceof your study,要把這一點回答清楚,你需要一個introduction,要在開題中回答這些問題。
在introduction中我們需要描述寫實證文章背景有什麼、目前了解到的信息有什麼、明白提出的研究問題:是一個還是多個,這些問題都包括哪些方面,是微觀層面的還是宏觀層面的?你做這篇文章要從哪幾個角度準備入手,它的重要性在哪? 舉一個研究的例子,很多人聽說過生态足迹ecological footprints,生态足迹最近在學術領域比較活躍,很多學者關注這個問題。
但是在不同的研究領域科學家研究的點不一樣。比如說在science領域,就是純科學領域,假設研究者想搞清楚食物消費的水足迹研究,科學家的研究就是想搞清楚為了生産一斤面包需要多少水或者也叫虛拟水,我們知道面包是通過小麥來的,但是在小麥生産過程中也是需要水的,所以在科學領域的研究學者在想用各種方法來考慮這一斤面包生産中需要多少斤原材料小麥,而生産這些小麥又需要多少水,在小麥的運輸要又損耗掉多少水。這樣研究者可以計算出來消費一斤面包,從生産領域和流通領域最終折算出來所需要的水是多少,但要注意在此過程中,在很多環節科學家測算的是H2O的存在形态,也就是你看不到水,但水的構成分子是存在的,也就是很多文獻中所稱的虛拟水virtualwater.那麼這是science領域研究者要測算的問題。
在軟科學領域即soft science領域, 比如說我們的經濟領域,經濟學家在想我們是研究那些因素影響到人的消費行為的?有很多社會的、經濟的、環境的、人口的等各方面的因素會影響人們的食物消費,所以經濟學家的問題就是哪些因素影響到面包的消費呢? 盡管都關注消費consumption問題,但這兩個問題在science領域和soft science領域研究者關注的角度和層面截然不同。我們想知道,這些影響到食物消費的各方面的因素,最終怎麼表現在生态上,比如說,水足迹的需求方面呢?
所以這樣我們就提出了一個研究的問題,我們将回答食物消費對于生态,比如說,對水足迹承載力的研究,從這個角度提出這個問題了,那麼研究的重要性也要回答,在science領域科學家隻關注于虛拟水的折算問題,但經濟領域隻關注哪些因素影響食物消費的問題,為了研究我們提出的這個問題,我們就要把這兩個領域角度交叉研究,也就是影響到食物消費的各個經濟社會環境等因素最後如何折算成對生态的虛拟水的影響,這就是你提出研究的重要性。
為了搞清楚這個問題,我們既要完成science領域的文獻閱讀,也要完成經濟領域的文獻閱讀,我的建議是對于一個研究問題。一般最起碼得寫約三十頁左右的文獻綜述,這對于學生們說并不容易,尤其是你閱讀的都是英文文獻時。文獻開始有個精讀而且是個慢讀過程,随着對問題不斷研究深入,在别人的觀點中慢慢找到自己感興趣某一角度,某一觀點,在某一分支中繼續讀下去,才能明白研究的重要性在哪幾個點,最終才能提煉出introduction中我列出的這幾點。所以說找到研究的重要性很不容易。
一般說論文寫作萬事開頭難,最難的部分是introduction,要抓住審稿人的眼球,讓他看完頭頭兩段就被深深吸引,情不自禁看下面怎麼做,在論文寫作中introduction是需要修改最多的地方,introduction來源于一個認真艱苦的文獻綜述過程,導師們在培養學生時,也是在此階段和你們親密接觸的階段,這階段的辛苦親密是為了品嘗最後甜美的論文結果。
為了回答清楚所研究的問題你需要讀很多國内外文獻,其實每一篇學術期刊、文章,它都有自己的摘要,都有introduction,認真讀過的與你的研究問題相關的論文中的introduction,就會得到大量信息。所以我再次強調計劃寫好一篇規範論文之前,需要認認真真做好文獻閱讀,比較好的綜述寫作必須有,為了完成一篇文章你所讀的文獻摘要最起碼要有30頁左右。
這是第一個大的部分,即在實證研究introduction中要回答的問題。
第二部分是Theoretical framework即理論框架,bevictor伟德官网學生學過的宏觀經濟學、微觀經濟學理論知識,為理論框架奠定了最重要的基礎,假設你想研究消費領域,研究理性人在資源有限的情況下如何合理有效使用資源從而達到自己的效用最大化。消費者效用最大化問題受制于收入預算約束線,時間約束線,在這些條件約束下情況下你才能找到效用最大化的點,這個效用理論在研究消費的行為時,理論框架就來自于這一部分。具體到某一個研究來講,在理論框架中很多研究學者給出一些創新的理論點,理論研究文章與實證研究不一樣,實證研究是從實證中來驗證理論假設是否成立,而理論研究中更多在理論框架中對理論模型突破創新。那麼這第二個部分理論框架目前對學生來說不是那麼困難的問題,畢竟你們有這一部分基礎接觸,比較容易開展。
第三個部分是實證研究方法部分Empirical Methods,包括幾塊,第一大塊是Statistical/ econometric methods;第二個是Empiricalmodel specification;第三個是Estimation method。
關于實證研究方法這一部分,一般來說大多數同學剛開始接觸感覺比較難,所以這一部分具體介入的課程就是計量經濟學,計量經濟學主要是在文章中幫你解決所列的三部分問題,第一部分就是統計計量方法有哪些,第二部分在這篇實證研究中模型是怎麼界定的即specification,第三部分是模型對你要研究的未知參數、解釋變量,估計方法都有什麼。
大家覺得難的原因是因為計量經濟學研究的框架和微觀經濟學、宏觀經濟學有區别,計量經濟研究的角度和數學和其他概率統計有區别,在它搭建的這個框架下它認為影響你的被研究對象有很多因素,我們分析它的一些邊際影響,但是我們還要控制住随機擾動項,在框架的界定下面我們需要利用數據,從一些未知總體中得到樣本抽樣,用樣本抽樣試圖回答被研究變量的總體分布情況。
大部分的實證研究需要用到實證數據,這些數據就是我們的samples,這個sample的代表性我們就需要在數據的描述中給讀者非常清楚的說明,數據的來源是第一手調研的數據,收集的資料還是歸納整理的aggregated宏觀的數據?數據的類型在實證研究中也是多種多樣,在你回答的問題中你選用的模型的框架都有什麼,研究的問題不同,研究的模型框架也是大相徑庭的。
不管在什麼樣的模型的框架下我們都要回答一個問題就是,這個樣本所推斷出來的樣本分布中我們能否估計出來未知參數,這個未知參數是在每個既定範圍内可以讓我們對外的波動範圍做出一個預測,做出一個判斷,從而使得我們這個研究對于研究的經濟預測我們可以做哪一部分的工作,這就是在我們的模型框架中試圖要搞清楚的問題。還有就是說未知參數的估計方法,這個方法有很多種。
大部分同學都了解有OLS,有MLE還有GMM估計方法等等,實際上現在計量中,在估計上,有參數估計還有非參數估計方法,有各種各樣找到未知參數估計量的方法,同學們在介入初期會感覺比較難,随着計量經濟學的接觸和學習就會感覺這一部分的技術難點不是一個大的問題。
那麼,現在對于實證研究已經有了introduction,大家現在有理論的框架,我們确定了實證研究的方法,在實證研究中你要把你模型的估計結果進行讨論,那麼就進入第四部分result discussion,這個result discussion實際上就是你要圍繞着你研究的估計結果來讨論。因為每年畢業季學生們的論文寫作中經常犯的一個問題就是,做了一堆分析但所讨論的結果并不是自己研究的,或者說他做了很多的分析,但是他并沒有去琢磨分析的東西的經濟意義有什麼?
那麼,具體點來講,基于你的理論框架和你的實證模型的估計你的結論這些各個的因素,它能回答的問題是什麼,也就是它的story,它的後面的經濟學的故事是什麼,你的經濟學的直覺在中間,那麼在你的假設檢驗過程中,是否驗證了你的經濟學的一些假設,對于這個模型的基本預測,你要做出什麼解釋。這都是你要在結果讨論中要逐一的仔細回答的問題,而不是說像有些同學籠統的把結果擺出來,不作分析,就扔給了導師。
另外一個需要說的是,在結果讨論中我們要對照着你在前面看過的文獻中,别人的結論說了什麼,你研究的story和别人的文獻區别在于什麼,所以在你的結果讨論中需要對比,你和前人的結論中一緻的地方你需要标明出來,不一緻的地方,它的原因是什麼,是你的樣本問題,你的模型的框架的問題,你的模型的估計的問題?你要把原因分析清楚,這樣才能保證給在未來研究這個領域問題的學者提供一個研究這個問題的有建設性的觀點。
這就是實證研究框架的幾部分的簡單的讨論。
在框架中下面一部分就是conclusion,基于你之前的研究,你的創新性的觀點,你得出來的結論,你的conclusion中你要非常鮮明地提出你的觀點是什麼,在這個理論框架下你所支撐的你的數據的結論是什麼,你的創新點是什麼,還有你論文的不足之處有什麼,都要逐一的進行說明。
PART 2實證研究文章中計量分析方法的“地位”
那我們開始第二部分的讨論。那麼這一部分其實大家剛剛注意到我在實證研究的框架中關于這個實證研究方法我用一個紅色的框框起來了,那麼為什麼框起來?我就想借這個機會和大家聊一下我的看法。
這個看法就是說到底在現在的經濟學文章中那麼這個計量研究方法它所占有的位置是怎麼一回事?我想在我這個框架中大家可以看出來它自然是一個很重要的部分。但它絕對不是說這個部分就可以代表一篇經濟學論文,這是兩碼事。但是現在研究領域中大家讀期刊就感覺沒有計量的模型好像這個文章就很難發出來,所以大家為了發一篇文章大家用各種數據做了很多的模型,我想聊一下我的看法,經濟的計量模型隻是為這個論文來服務的,絕對不要舍本逐末。
這個計量方法模型隻是論文組成的一部分,它隻是為了研究清楚你這個問題一個有效的工具,所以計量經濟學是為我們宏觀微觀經濟做服務的,它隻是一個服務的工具,但不能替代我們的經濟學。所以說并不是學好計量經濟學,經濟學就沒有問題了,這純粹是兩碼事,學好計量隻是說明這個工具掌握的不錯,但是經濟學的基本的理論才是最最重要的部分。
但是因為在文章的研究中計量方法又占有一個比較重要的技術的服務的部分,所以就和大家分享一下,研究中常用的計量經濟學的軟件都有什麼?那麼這些軟件它有哪些資源、鍊接?我想借這個機會和大家聊聊。
剛發的下面幾個圖片能看到其實就是在計量經濟學中不同的老師常使用的不同的計量軟件的使用界面,那麼這些軟件使用的難易程度自然是有差異的,對于高級微觀,高級宏觀,比較複雜的比較前沿的一些經濟學研究問題那麼我們需要借助一些在計量經濟軟件中一些編程的程序來幫助我們實現,對于我們一些基礎的古典模型的理論就需要借助一些簡單的編程的軟件就可以實現。
頭兩個圖片第一個圖片是EViews,第二個是SPSS,這兩個是在研究中模型估計中同學比較常用的軟件,這兩個軟件我就把界面截圖過來了,那麼比較清楚得看到就是有很多下拉菜單,就像用excel似的,點擊菜單,所點即所得,比較容易使用,比如在第二個圖片SPSS你點擊分析菜單,就會看到你是要統計描述,還是做一般線性模型分析,還是廣義線性模型分析,還是做相關分析啊,所以進入鍊接就可以直接得出結果來。
那麼後面兩個圖片第一個是SAS,第二個是Stata,那麼這兩個在我們學院用的比較多的,有同學用Stata和導師做課題的更多。這兩個是功能比較強的,包括模型的界定啊,包含的模型所設定的參數的選擇性特别多,相比EViews和SPSS,老師們用SAS和Stata更多一些,這兩個軟件各有千秋,像最初的Stata軟件它内部的使用空間比較有限,所以對于分析大樣本數據有一點力不從心,但是随着Stata8.0之後的版本就沒有這個問題了,這個問題被克服了,那麼SAS這個軟件有一些老師可能會接觸到,在國外的一些高校中老師在計量課程中用SAS的是比較多的,因為大部分公司或研究機構用SAS軟件比較多,所以老師介紹這個軟件給學生對于學生将來的就業會比較有用。
這兩個軟件大緻一看就會發現與前兩個軟件有非常明顯的區别,SAS的功能非常強大,在SAS軟件使用中包括很多模塊,所以我們經濟學家如果你的研究是時間序列方向的,那麼你可能就專門使用時間序列模塊,如果你做受限因變量模型分析或者說其他的一般模型回歸,那麼像SAS STAT基本上就可以來實現。Stata下面也有很多模塊,它有很多新的計量模型,新的計量估計方法,如果研究學者給它發表之後Stata公司就會通過編程人員把新的模塊編程進去,最初我記得幾年前我用Stata對于受限因變量中的Tobit模型,它的marginal effect求解的時候最初是沒有的,但後期很快的這個模塊就生成了就放到了軟件中,你可以去下載,導入你的Stata,就可以運行。
當然你如果看Stata截圖中你會清楚的看它也比較友好,它接近EViews與SPSS的操作界面,也可以點擊,比如你點擊statistics中,你點了統計中,那麼下面就分了很多模塊,分的很細,有參數估計方法,時間序列方法等等,它按照我們計量經濟的模塊來分,我們就可以按照菜單下面的分類來做我們的計量分析。
PART 3有關模型軟件的資源分享
下面想和大家借助于微信的平台來分享一些資源,你要是想學習了解這一部分模型軟件,相關模型軟件書籍,例子,數據應該從什麼地方去找到這些資源,我現在發幾個圖片,把這些資源,鍊接發給大家。
在這個實證研究中,不管你的模型有多少種,你的軟件有多少種,它的所有的一個根本目的是為了解釋我們這個經濟學的研究問題,是為這個經濟學研究的意義來服務的。所以千萬不要舍本逐末,不要把做文章變為為了計量而完成模型的一個過程。然後弄了一堆,你就以為你的任務完成了。這是一個誤區,我是希望大家同學們千萬不要進入這個誤區中。
下面一些資源。你們想去了解這一部分的模型的軟件,和一些相關模型軟件的使用書籍,以及相關的地址,資源。我接下來發一些圖片和鍊接給大家
我以Stata為例給出了基本學習的書籍,它們都非常經典。它們都是從不同角度書寫的,有的是從宏觀角度,有的是從微觀經濟學角度。
以綠色的這本《regression models forcategorical dependent variables using stata》為例,它是比較前沿的。大家在這個分類回歸數據中,它給出了很多的樣本數據。還講了每一個模型的理論框架是怎麼一回事,stata這個程序語言是怎麼了一步一步求出對于某個未知參數的估計值,然後它的邊際效應,還有它的這個概率的預測值等等。是一本挺好的書。同時,這幾本是大家相對于Stata可以參考的。
還有一個就是網址,也給大家說一下。UCLA大學www.ats.ucla.edu這個網站中有非常詳盡的,常用的通用計量經濟軟件及還相關的數據,書籍。都配有比較好的講解,大家可以在這個鍊接中找到有用的信息。
例如,以stata為例,進入UCLA的Academic Technology Service網站以後,可以看到這幾個闆塊。其中,statistical analysis歸納了它的基本的統計分析都有什麼,還給了很多例子。裡面的textbook examples包含了一些這個的方面的書籍所給出的例子。 而Linksby topic則對于不同回歸模型,按照分類把不同stata的命令都給列出來了。裡面有Dada management,ANOVA分析,圖片的制作,Regression,Logistic Regression,Survey Dada Analysis等等,你們結合自己的研究可以從這個地方找到相關的例子來看一看。
那麼,如果你點擊這個textbookexamples它給常用書分了幾個層次。首先是Introductory Statistics介紹統計方面的書,裡面兩本書分别是David和Alan寫的。這兩本書是比較淺顯易懂的。第二大塊就是這個Regression Methods,關于回歸方法的,有五本書,它們的方法本身也是各有千秋的。有的是從這個回歸的角度,有的側重于回歸中的一個圖形的分析,有的是側重于這個回歸中不同數據數據集的合并和使用等等。
舉個例子,比如說這五本書的最後一本就是Neter寫的《Applied Linear Statistical Models》,比較有特點。它的特點就是說,對于我們的實證研究中要用的這個計量的分析方法,他給出了兩個大的例子。其中一個例子從頭到尾穿越了每一章,分析了所有模型分析中,從模型的空間的搭建,到參數的估計,然後到這個樣本的分布,到假釋驗證和prediction。他是用stata把這些全部給你列出來了。
第二個例子也是這本書。他是把所有的SAS命令穿越所有的章節,也是給你舉例舉出來了。所以如果大家感興趣也可以參考一下這個書。
我的想法就是通過這個微信平台給大家分享一些資源啊,大家可以在下面自己學習然後通過這個網站的書籍和相關的數據,自己可以進行學習探索,使用這些軟件。但是我再次說明我的個人的看法。計量經濟絕對不是經濟學,它隻是為經濟學服務的一個工具。所以說學習計量經濟這個工具課程沒有問題,但是更重要的是要把微觀經濟和宏觀經濟搞清楚,學明白。
今天我基本就講到這個地方,跟大家也就是聊了一聊相關的實證研究的一些基本框架,方法。以及所用的軟件和資源。今天的課堂到此結束,謝謝大家。