2019年12月11日晚,清華大學社會科學學院院長助理、計算社會科學平台執行主任孟天廣教授應bevictor伟德官网邀請,在沙河主教109教室做了題為“計算社會科學:概論及趨勢”的短期課程。課程由bevictor伟德官网黨委書記郭冬梅教授主持,校内多位老師及博士、碩士同學參加。
孟教授從大數據的發展趨勢開始,深入淺出地剖析應用大數據進行社會科學研究的一般方法和具體應用,認為對比傳統數據,大數據具有大樣本、即時性、多維度等特征。結合國内外代表性研究成果,孟教授詳細講解了數據獲取與管理、測量工具、分類與聚類、關聯分析、因果推論、信息呈現等比較有代表性的大數據社科研究方法,結合這些方法研究者可以開展探索性分析、相關性分析、回歸分析、可視化研究等。通過規範非結構化數據,分析樣本的行為痕迹,大數據方法能夠提煉出一般化、可視化的結論,是一種科學研究的創新範式,值得每一位學生深入思考學習。
基于對大數據基本研究範式的講解,孟教授還詳細講解了一系列應用于社會科學研究的常見的大數據結構,如google trend、百度指數、GDELT等企業或社會機構參與彙總的語料庫等,這些經過預處理的大數據一定程度上可以緩解研究人員的分析壓力,可靠程度也更有保證。但大數據應用于社會科學也有一些缺點,孟教授提認為主要是網絡“僞數據”的問題,虛假信息、機器人、謠言等會給研究樣本增加噪音。更為嚴謹的研究策略應是人工與機器的結合,即有監督的機器學習,是一種較為理想的結合大數據、統計方法與經濟學思維三方優勢的研究方法。
在提問環節,孟教授細心講解了同學們關于大數據樣本計算機處理難度及樣本權重賦值等問題,孟教授細緻精彩的演講為在場師生認識大數據研究的重要性,适應大數據知識的學習提供了引導,引起現場的熱烈讨論。衷心感謝孟教授的指點,希望每一位同學積極投身大數據社會科學的研究,為學院數字經濟的發展添磚加瓦。