北京单场奖金少

 首頁 >> 國際關系學 >> 頭條新聞
21世紀以來中國的大數據國際關系研究 ——董青嶺教授訪談
2019年11月06日 09:01 來源:《國際政治研究》2019年第4期 作者:董青嶺 王海媚 字號

內容摘要:

關鍵詞:

作者簡介:

    內容摘要:進入21世紀以來,大數據及其分析技術迅速崛起,逐漸介入國際關系研究議程并發揮越來越大的作用。那么,應該如何看待大數據國際關系研究的緣起和發展?該研究包含哪些基本原理?我國學者在大數據國際關系研究領域有哪些嘗試?這一研究的未來發展前景是怎樣的?為此,本刊特約記者王海媚專訪對外經濟貿易大學國際關系學院董青嶺教授,董教授主要從事大數據科學與國際關系的交叉研究,內容涵括大數據海外輿情監測與沖突預警、國際關系自然語言處理與社會情感挖掘、機器學習與國際關系智能分析等,代表作有《復合建構主義:進化合作與進化沖突》《大數據與機器學習:復雜社會的政治分析》《大數據安全態勢感知與沖突預測》《新戰爭倫理:規范和約束致命性自主武器系統》等。

  作者單位:對外經濟貿易大學國際關系學院

 

  一、大數據國際關系研究的緣起與發展

  王海媚(以下簡稱“王”):董教授您好!當前,大數據及其分析技術的崛起正在成為一種新的社會科學范式,您是如何看待大數據介入國際關系研究議程的?

  董青嶺(以下簡稱“董”):當前,大數據及其分析技術的應用已經深入到社會生活的每一個角落。伴隨著社會生活的“網絡化”和“數字化”趨勢的不斷發展,數據體量將呈爆炸性增長、數據價值也將得到前所未有的釋放,以數據公司和數據科學家為代表的數據精英正在成長為新的政治力量,新的社會結構也正圍繞著數據的存儲、挖掘和應用而展開。這主要體現在以下三個方面:首先,作為現代政治基礎的民主選舉活動正在被編程化的輿論“機器人”和各種“算法偏見”所操控,大數據及附著于數據之上的算法對決越來越顯現為未來權力角逐的幕后驅動力量;其次,“數據驅動型外交”或依托于數據及其算法的“智慧型外交”正在開啟人工智能時代的外交革命,尤其是在跨國政治溝通和沖突預防領域,大數據精準政治營銷、大數據海外輿情監測,以及大數據反恐和早期沖突預警都已大顯身手;再次,以智能決策和自主殺人為特征的軍事機器人研發正在掀起新一輪軍備競賽,人類正在被自我創造的人工智能網絡和漫無節制的數據使用所傷害。

  歷史從來沒有像今天這樣,擁有數據便意味著主宰一切,數據即生活、數據即權力,一方面,我們越來越受益于數據革命所帶來的種種生活便利、憧憬著一個高度智能化社會的到來;另一方面,我們又深刻恐懼于數據革命所帶來的種種社會變革,數據的深度挖掘正使得我們的社會越來越透明化、越來越脆弱、越來越不安全。

  王:您能簡單介紹一下大數據與國際關系相結合這一跨學科交叉研究的起源和發展嗎?

  董:大數據介入國際關系研究正在受到越來越多研究者的關注,但其興起和發展需要滿足以下兩方面條件:其一,有關研究對象的豐裕數據基礎。隨著社會生活網絡化、數據化和智能化趨勢的日漸增強,社會實踐主體之間的高頻互動每天將產生難以計數的數據痕跡,這使得國際關系研究能夠獲得比以往任何時期都更為豐富的數據信息。邁入大數據時代,國際關系研究存在走向“數據密集型科學研究”的可能;其二,有關數據處理的突破性技術進步。當前,大數據分析技術的進步,特別是非結構化數據庫(如MongoDB和HBase)和分布式并行計算系統(如Hahoop和Spark)的出現,不僅解決了大體量混雜數據的采集、存儲和計算問題,而且還能夠使國際關系研究能夠抵近觀察微觀主體之間的互動細節。正因如此,大數據及其分析技術的介入或將打破傳統國際關系研究范式,傳統范式強調以群體間政治為核心觀察對象、以結構主義為主導分析路徑、以小樣本歸納為主要知識生產方式、以傳統因果律為邏輯基礎。大數據或許是我們重塑現行國際關系理論、外交指導思想及沖突預測方法的歷史性契機。

  基于上述動因和背景,如果要粗線條地回顧一下大數據與國際關系研究的結合進程,我認為大體可以分為兩個階段:

  第一階段可稱之為“數據模擬階段”即“計算機仿真實驗階段”。它肇始于1971年哈佛大學教授托馬斯·謝林《隔離的動態模型》一文的發表,該文在計算機尚未普及甚至尚未成熟的年代,在學界率先提出未來的學者將兼具社會科學知識和編程技術,借助計算機的強大算力,學者們將就所研究問題生成隨機模擬數據、建立博弈規則和形式模型,進而仿真社會互動進程、研究政治的動態演進,后世稱之為“謝林模型”。簡單來講,“謝林模型”認為,計算機模擬不僅可以幫助學者解決大體量可觀測樣本的隨機生成問題(如數十億條電話號碼、地理位置和身份信息),而且還可以使研究對象和推理過程通過編程技術動態可視化(如NetLogo軟件對各種社會學、政治學和自然科學問題的可視化模擬)。在某種意義上,“謝林模型”不僅啟發了后世有關社交網絡和博弈論應用的模擬分析,而且還極大影響了學界有關種族、宗教、貧富和黨派等對抗問題的理解,開啟了計算機模擬與政治分析相結合的學術研究先河。沿著計算模擬這條路徑,這一時期最引人注目的成果莫過于美國密歇根大學政治學與公共政策教授阿克塞爾羅德使用計算機模擬來破解“囚徒困境”,并寫就《合作的進化》一書。

  第二階段可稱之為“數據分析階段”,也可冠之以“大數據與機器學習階段”。20世紀80年代中期后,很多學者對計算機模擬社會問題提出質疑,這些質疑點包括:其一,計算機模擬情景下的人際互動更加接近自然科學過程中的“變量控制實驗”,在很大程度上刻意忽視或漠視了真實社會過程中真實數據與模擬數據的差異。在模擬過程中,不僅形式規則是由研究者主觀設定,而且變量的挑選也受到研究者嚴格的條件限定,因為濾掉了某些至關重要的真實信息,有時模擬結果與真實社會情景相去甚遠;其二,計算機模擬忽視了真實社會情景中人的相互學習和進化能力,忽略了在反反復復的社會互動中人類個體具有從實踐中汲取經驗教訓并改進、優化行為模式的進化學習本能。就此而言,以“謝林模型”為代表的早期計算機模擬并未真正觸及社會系統的開放性與復雜演進性。

  直到最近,由于數據體量的爆炸性增長、數據價值的不斷釋放和數據處理技術的突飛猛進,有學者開始關注到,大數據及用以處理大數據的機器學習技術要比計算機模擬更適合分析國際關系問題:首先,機器學習是在非過濾、非控制信息的情形下,利用算法程序從嘈雜數據中去歸納、分類和識別模式,而不是像計算機模擬那樣利用形式邏輯去演繹規則,它對數據的處理尊重社會系統的開放性、研究變量的非控制性及測量對象的相互擾動性;其次,機器學習具有環境自適應性和學習進化特征,可以根據環境的變化感知數據的細微波動,進而重構模式識別并調整預測輸出結果;再次,大數據在結構化數據之外試圖容納并分析各種非結構化數據(如海量的新聞報道、社交網絡對話和網頁瀏覽痕跡等),追求數據的多樣性、混雜性而非精確性。就此而言,機器學習的優勢恰恰在于具有從雜亂、混合數據中尋找可辨別模式的能力,因而,大數據與機器學習較傳統研究方法更容易捕捉國際社會的復雜多變性和不確定性。

  王:目前,國內外學界在大數據應用于國際關系研究方面都開展了哪些研究、取得了怎樣的成果?

  董:作為一種新興事物,由于技術門檻的限制,當前大數據在國際關系領域中的應用并不是十分普遍和活躍,現有研究主要集中在以下兩個方面:

  其一,面向實時數據自動采集的新型數據庫建設,旨在利用大數據技術重構國際關系研究的底層數據基礎。與傳統的國際關系研究常用數據庫,例如,戰爭相關因素數據庫(COW)、烏普薩拉武裝沖突數據庫(UCDP)和全球恐怖主義數據庫(GTD)不同, 新一代數據庫的建設將著力應對當下洶涌而來的數據洪流,不僅數據體量巨大、數據產生速度快,而且數據維度和數據顆粒度也遠超以前時代所能想象。在此情景下,以自動摘要和自動編碼技術為核心的新一代數據庫建設正在取代傳統人工摘錄和人工編碼數據庫,在這方面目前業已成型并被廣泛使用的數據庫如谷歌GDELT,這是一個基于谷歌Big Query 、面向全球、免費開放的滾動型即時新聞事件數據庫,由美國喬治城大學教授卡里夫·利塔魯于2013年創建,它不僅對新聞事件中的人物、組織、事件、語氣等事件要素進行標簽化提取,同時,還通過自動編碼技術自動標注新聞事件的地理位置信息(即經緯度坐標),并且每15分鐘實時更新一次。目前,該數據庫已基本做到對某些國家政治新聞事件的即時監測、即時編碼,其所提供的數據資料不僅包括時間序列數據,同時,還涵括地理空間信息,且每條數據都可核查、可驗證,堪稱真正意義上的“時空大數據”。

  其二,面向特定問題解決的算法模型研發,目的在于將國際關系理論與計算機智能分析相結合改善決策質量。譬如,通過協同過濾算法篩選恐怖嫌疑人、通過K-Means鄰近算法進行特征聚類分析、通過PageRank算法進行網絡鏈接分析,以及通過隨機森林算法進行分類預測等。概括來說,基于算法的大數據國際關系應用重在規避數據噪音、挖掘數據關聯,進而建立特征模式識別和進行分類預測。目前,大數據算法在國際關系中的應用主要集中在以下三個場景:第一,精準外交。通過抓取數據痕跡和聚類分析,精準圈定事件地域、事件人群及人群屬性特征,定制化推送政治營銷廣告和實施精準公共外交戰略;第二,沖突預防。通過數據監控和云計算,即時監測、鎖定、跟進事態進展并自動生成事件報告和危機預警,動態掌控問題爆點,提前推進基于預測的預防性戰略執行;第三,關聯預測。通過多源數據收集和數據組合算法,在各種結構化和非結構化數據資源中發掘事件關聯關系和節點因素,優化決策、合理配置資源。目前,在國際關系研究中經常用到的算法模型主要分為有監督學習和無監督學習兩種,其中,有監督學習最常用的訓練方法主要有支持向量機、貝葉斯網絡、決策樹和馬爾科夫鏈等,而無監督學習則主要包括聚類分析和模式挖掘,另外諸如主成分分析、多元線性回歸以及信息熵等數值分析法也經常被用來測度數據關聯關系。

作者簡介

姓名:董青嶺 王海媚 工作單位:

轉載請注明來源:中國社會科學網 (責編:陳茜)
W020180116412817190956.jpg
用戶昵稱:  (您填寫的昵稱將出現在評論列表中)  匿名
 驗證碼 
所有評論僅代表網友意見
最新發表的評論0條,總共0 查看全部評論

回到頻道首頁
QQ圖片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
內文頁廣告3(手機版).jpg
新國際.jpg
中國社會科學院概況|中國社會科學雜志社簡介|關于我們|法律顧問|廣告服務|網站聲明|聯系我們
北京单场奖金少 江苏11选五遗漏号码 广西麻将赌博标准 pk10漏洞打法 深圳赚钱偏门 青朋棋牌大厅 pk10三线一码无连错 澳门玩双骰子 重庆时时彩龙虎玩法 科学投注法 足彩比分怎么买 快乐十分如何买最赚钱 极速11选5开奖结果 福彩3d走势图17500乐彩网 捕鱼大师变态版 下载单机麻将免费游戏 雪缘网棒球比分直播