bevictor伟德官网
院長信箱 書記信箱 English

學院新聞

學院快訊

當前位置: 首頁 -> 學院快訊 -> 正文

bevictor伟德官网短期課程 | 計算社會科學系列講座順利結束

閱讀次數:日期:2018-11-20

2018年11月11日與16日,bevictor伟德官网在bevictor伟德官网沙河校區主教209開展了計算社會科學系列課程。課程請到了清華大學社會科學學院政治學系副教授孟天廣老師,向同學們講解了大數據背景下社會科學研究的新發展和新方法。課程中,孟天廣教授從大數據的概念入手,深入淺出的講解了大數據+社會科學的新型研究方法,文本分析及相關模型以及計算社會科學中的因果分析方法等方面的内容,為我們充分的展現了大數據思想及技術在社會科學研究中應用的方法、意義、優缺點以及前景。

講座伊始,孟教授首先向大家介紹了計算社會科學提出的背景,即大數據時代的到來,以Volume、Velocity、Variety、Veracity和Value為特征的大數據技術,正被應用到社會研究的各個方面。通過大家介紹了多位計算社會科學的前沿學者的觀點,認為計算社會科學主要是利用計算機系統幫助人們進行溝通和協作,并研究社會運行的發展與規律的一種方法。孟教授着重詳細講解了數據爬蟲、主題模型、情感分析、知識圖譜等多種計算社會科學方面的前沿研究方法以及其功能分類,并針對不同的研究方法,列舉了YouTube選情分析、Google Books、空間與政治等多個實例,深入淺出的介紹了進行計算社會科學研究的一般步驟和方法,分析了當前學術界對大數據+社會科學這一新型研究方法存在的争議。

接着,孟教授重點為同學們介紹了文本分析這一計算社會科學中為最常用、最容易被接受的一種分析方法。從文本分析的定義入手,系統的講解了文本分析的目标、方法途徑和存在的機遇與挑戰。孟教授認為,由于文本分析最大的挑戰在于數據的非結構化和海量的潛在維度,因此,采用合适的降維方法是文本分析的一個重要的思想。而文本分析的主要步驟,首先需要采取爬蟲技術從社交媒體、網絡論壇、各種數字化檔案庫等種種渠道獲取文本數據;其次,要對爬取的文本進行分詞和清理,去掉文本中無意義的數字、停詞等,以便進行進一步的分析;接下來,則要根據不同的研究目的,選用不同的手段,如機器學習、文本聚類、主題模型、情感分析等來進行分析。在講座現場,孟教授還實際演示了爬蟲軟件以及文本分析軟件的操作,使大家更直觀地理解了文本數據挖掘與分析的方法。

最後,孟天廣教授講解了大數據框架下因果推論問題,對大數據分析因果推論的挑戰與機遇、推論的方法途徑、大數據+回歸分析等方面的内容進行了具體分析。他認為,盡管大數據方法當下存在着數據、方法、可行性、倫理等多方面的局限及批評,但是在大數據模态的多元化、全量、真實的特點,不僅為小概率事件分析提供了可能,并且蘊含着豐富的時空信息。孟教授從關聯分析、數據管理等視角講解了因果推論下作為方法論的大數據分析,強調了大數據因果推論的四種主要的方法路徑:即大數據+計量分析、大數據+小數據分析、大數據+時空分析以及大數據+實驗設計。孟教授講解了大數據與小數據結合的優點、兩者的可能組合以及大數據分析的時空模型和實驗設計,并從随機化分配幹預、内外部效度、施加幹預三方面解釋了大數據時代的實驗研究。

講座結束後,引發了同學們熱烈的思考及讨論,孟老師一一解答了同學們提出的相關問題,至此,bevictor伟德官网計算社會科學系列課程講座圓滿結束,同學們在講座中拓寬了視野,對計算機社會科學這一學科有了較為深入的了解,同時也掌握了許多實用的研究分析方法和思想。感謝孟天廣教授的給我們提供學習的寶貴機會。

 

上一條:産業轉型與産業政策學術研究會在我院召開
下一條:第五屆中富青年領袖大賽回顧

版權所有:Bevictor伟德官网 - 韦德(中国)体育-伟大始于1946 學院南路校區地址:北京市海澱區學院南路39号 郵編:100081 沙河校區地址:北京市昌平區沙河高教園區 郵編:102206

Baidu
sogou