以數據分析為基礎來進行證據力支持的政策議題探討,一直是本研究團隊的研究主軸,其中針對科研議題隨時間演化所呈現出的議題出現、成長、衰退、消失等特徵,則是關切科研發展的重點。本研究團隊鎖定健康資訊議題(Health-Information Topics),從期刊論文書目資料庫下載2007-2021年間相關論文書目,藉由作者關鍵字的共現(Co-occurrence)關係來進行議題演化的探討。
Girvan-Newman(GN)演算法是最常見的社群偵測(Community Detection)演算法,本研究團隊採用GN演算法針對795篇健康資訊論文區分三期間(2007-2011, 2012-2016, 2017-2021)進行社群偵測,而每一個社群內的作者關鍵字共現網絡則可呈現如下圖1所示,藉由人工依據關鍵字網絡進行判讀,以完成各期間的所有研究議題(社群)的命名,整理如表1所示。
圖1、「健康資訊」關鍵字共現網絡圖
表1、「健康資訊」在三期間研究議題命名與論文篇數
針對表1的三期間健康資訊相關研究議題,依據各議題涵蓋的關鍵字清單來計算兩兩議題間的餘弦相似度(Cosine Similarity)大於0.5門檻值時,即視為議題間具跨期演化關係,並繪製出如下圖2的Sankey圖。從圖中可知「健康資訊行為」與「健康資訊行為研究方法」兩個議題在第一期與第二期均持續引起學者的研究興趣,其中社群媒體則是主要的健康資訊交換平台,針對資訊交換平台的議題研究有持續延至第三期引起學者們的興趣,除此之外第三期出現新興研究議題,針對健康資訊的研究方法透過文字探勘(Text Mining)來進行。
圖2、「健康資訊」在三期間研究議題演化Sankey圖