社会科学研究所

公開研究会「中台における近年の環境研究について」開催報告(社会科学研究所)

2017年03月16日

2017年3月3日(金)、多摩キャンパス研究所会議室3にて、下記の公開研究会を開催しました。

【テーマ】 中台における近年の環境研究について

【講 師】 シャオ, スアンレイ(Shao, Hsuanlei)台湾師範大学助教授

【日 時】 2017年3月3日(金)16:00~18:00

【場 所】 中央大学多摩キャンパス 2号館4階 研究所会議室3

【主 催】 研究チーム「グローバル・エコロジー」(社会科学研究所)

******************

【要 旨】

 今回の研究会では台湾師範大学助教授のシャオ・スアンレイ氏に、中国及び台湾の環境問題研究をテーマに発表して頂いた。近年中国ではPM2.5に代表される公害以外にも、砂漠化や水問題など社会に重大な影響を及ぼす環境問題が深刻化しており、この分野の研究に関する論文の発表数も大幅な増加傾向にある。環境問題の研究は、生物学のような自然科学からガバナンスや法律に至るまで幅広い分野で扱われているが、こうした幅広い「環境問題研究」を総合的に扱った研究が必要ではないかとシャオ氏は見解を述べた。今回の講演のテーマは、テキストマイニングの手法を用いて中国本土および台湾における「環境問題研究」のトピックス(主題)の傾向について分析することである。テキストマイニングを用いることで、環境問題に関する論文を領域毎に整理し、どのような傾向が近年主流になっているか、あるいは各領域において多く論文を発表しているリーダー的な研究者は誰か、といったデータを分析することができる。今回の研究会では、データ数が豊富な中国本土における論文を主な対象にしているが、補論として台湾についても同様のデータを紹介する。
 シャオ氏は、今回の研究方法であるテキストマイニングについて次のように説明した。テキストマイニングは、コンピュータ(ツール)を使用して、対象となる文章の文字情報を分析して有用な情報を取得する手法である。こうしたテキストデータの解析を形態素分析と呼ぶ。今回は、環境問題に関する論文の概要(アブストラクト)やキーワードを分析し、論文に書いてある文字情報から、その論文はどの領域に該当するかをあてはめていく。今回のテキストマイニングではHAC(Hierarchical Agglomerative Clustering)というクラスタ分析手法を用いて、各論文をクラスタにあてはめていく。HACでは各論文の文章を比較し、それぞれの論文がどれくらい似ているか判断できる。例えば論文D1と論文D2の文章を比較して30%程度似ていれば非常に類似度が高い、逆にD4とD6では10%しか類似しないのであまり似ていない、といった比較を行い、それぞれどの程度似ているかを検討してクラスタに分類する。その結果論文に共通するトピックを抜き出してクラスタ分けが行われ、環境問題を各フィールド(領域)に分割することができる。
 今回の研究では資料として、中国の総合的な学術情報データベースであるCNKIに掲載されている論文をリサーチし、1979年から2016年の間に「環境」をキーワードにリサーチした16,462本の論文からデータを絞り込んだ結果、関連度の高い論文6,233本を分析対象とした。
 シャオ氏は、分析によって得られたデータを次のように説明した。まず、HACの分析により論文は大きく7つのクラスタに分けられる。7つのクラスタはそれぞれ、生物学、教育、開発、行政といった分野に該当し、それぞれのクラスタにおける論文数と比率の年度別グラフが示された。環境問題に関する論文数は2010年前後から急増し始めており、特に生物学に関するクラスタが飛躍的に伸びている。このクラスタは2010年に32本の論文だったのが、2016年には249本にまで延びており、現在最も数の多いクラスタである。次に多いクラスタは環境教育や環境意識といったキーワードで抽出されたものであり、2010年に24本だった論文数が、2016年には116本に増えている。これに加えて、各クラスタの本数の比率のグラフも示され、どの論文が主流になっているかを調べることもできる。例えば環境教育や環境意識のクラスタは2012年までは10%以下だったが、2016年には20%弱程度にまで増加しており、このクラスタの論文が徐々に主流になりつつあることを示している。なお、各クラスタにおける論文の著者別の発表数についてもシャオ氏は解説した。著者の論文数を表したデータについては、例えばクラスタ1(生物学)では「編集部」という著者が39本と最も多く、雑誌記事の論文が多いことを示している。こうしたデータを調べることで、それぞれの領域でどの研究者がリーダー的な存在か調べることができる。
 次に台湾を対象に同様の分析を行うとどうなるかシャオ氏は説明したが、台湾において環境問題で調べたデータでは論文数が66本と限られている。これらを4つのクラスタに分けたものの、全体の傾向などを分析するのには不十分である為、中国本土における研究と比べると統計的な意義を見出すことは難しいとシャオ氏は述べた。
 最後にシャオ氏は結論として、テキストマイニングを利用する意義は、限られた時間で多くの文献を整理し、各分野における論文数の傾向や、研究者の動向といった基礎的な知識を調べられることであると説明した。また、この研究で使われた技術は、政治などほかの分野にも適用することができる。テキストマイニングで得られた結果についてより精度の高い分析を得るには、研究者同士が協力する必要があると結論づけた。

(主催チーム記)