2020年8月20日,受我校bevictor伟德官网邀請,清華大學孟天廣教授“雲”做客bevictor伟德官网,為中财學子帶來“自動文本分析:方法與運用”為主題暑期課程。講座采用騰訊會議線上舉辦,bevictor伟德官网院長陳斌開教授主持,學院老師及學生參加。
社會科學中的文本分析由來已久,但因文本資料難獲取、難推廣、難管理、難分析,尚未成為社會科學研究主流。近些年,文本分析的繁榮條件逐漸具備,不僅在信息技術上獲得大數據存儲與管理能力的跟進支持,而且在社會關注度上獲得廣泛關注與重視。這一變化構成了“計算社會科學”孕育、興起、壯大的社會背景。
孟教授按照定義介紹、方法介紹、實操模拟的邏輯主線,深入淺出地為同學們描繪文本分析的概念藍圖。孟老師列舉了包括清華大學計算社會科學平台在内的大數據分享平台,鼓勵同學們多探索、多交流。
進一步地,孟教授從文本類别入手介紹文本分析主流方法,他指出文本分為表達文本與工具文本兩類,前者重視客觀信息,追求對外現關鍵信息的準确解碼,在該類型的文本提取中詞頻很重要。後者則重視潛在信息,表現為研究者往往更為關注獨立于字面含義的價值信息,如主題、情感等。而且結合課程内容,由鄭思堯博士分闆塊介紹了具體實際操作。
課程最後的提問環節中,同學們針對課程内容與老師積極互動,孟教授一一予以解答。感謝孟天廣教授的耐心指導,希望同學們能在日後的學習中靈活運用這一收集數據的方法論,舉一反三,在實操中不斷提升自己的數據挖掘能力。