「究める」では、大学院に携わる人々や行事についてご紹介します。
経済学研究科 博士後期課程1年の菊池 陽(きくち ひなた)さんが代表を務めるチームが、PWS Cup 2025にて「ベストプレゼン賞」を受賞しました。
PWS Cupはコンピュータセキュリティシンポジウムの中の「プライバシー」をテーマとするプライバシーワークショップ(PWS:Privacy Workshop)内で実施されるコンテストです。
チームのメンバー:菊池 陽さん(経済学研究科 博士後期課程1年)
早川 拓実さん(経済学研究科 博士前期課程1年)
杉山 拓海さん(経済学研究科 博士前期課程3年)
Wu Liujieさん(国際経営学部3年)
他学外者2名
本記事では、発表内容の紹介や参加にあたってのメッセージをお届けします。
コンピュータセキュリティシンポジウムの概要について
コンピュータセキュリティシンポジウム2025
コンピュータセキュリティシンポジウム(CSS:Computer Security Symposium)は、情報処理学会のコンピュータセキュリティ研究会(CSEC:Computer Security Group)とセキュリティ心理学とトラスト研究会(SPT)の共催により、国内で毎年開催されている日本最大規模のセキュリティ分野のシンポジウムです。2025年度は10月27日から31日にかけて岡山で開催されました。
シンポジウムでは、「マルウェア」「プライバシー」「ブロックチェーン」「AI」など、10区分にわたる多様なテーマで研究発表が行われます。
その中で私たちが参加したPWS Cupは、「プライバシー」をテーマとするプライバシーワークショップ(PWS:Privacy Workshop)内で実施されるコンテストです。
PWS Cupの概要について
PWS Cupは、データの匿名化技術とそれに対する攻撃技術を競う形式のコンテストです。参加チームは、匿名化処理を行う「加工フェーズ」と、他チームが作成したデータに対して攻撃を試みる「攻撃フェーズ」の二段階で競い合います。
加工フェーズでは、与えられたデータに匿名化などの処理を施し、その結果を提出します。攻撃フェーズでは、他チームが匿名化したデータを解析し、元データの要素(例えば個人情報)をどの程度復元できるかを試みます。
最終的な評価は、
・匿名性(攻撃耐性):どの程度、再識別や攻撃を防げたか
・有用性(分析可能性):元データの統計的性質をどの程度保てたか
の2つの観点から行われます。
この2つを高い水準で両立させることが、PWS Cupにおける最大の挑戦となっています。
発表の内容について
今回のPWS Cupでは、匿名化処理および攻撃アルゴリズムの双方を設計し、実装・検証を行いました。概要は以下の通りです。
発表の様子
■ 匿名化処理
本研究では、個人特定リスクを低減するための枠組みである「k-匿名性(k-anonymity)」を満たす一般化アルゴリズムを採用しました。k-匿名性とは、「同一の属性値をもつ個人(レコード)が少なくとも k 件存在する」ことを保証する仕組みであり、特定の個人が識別されにくくなるよう設計された代表的なプライバシー保護手法です。今回の実装では、識別されやすい、すなわち珍しい属性値を持つ個人情報に対して、類似した個人同士をクラスタリングでまとめ、同一の値へと一般化する処理を行いました。例えば、「24歳」「25歳」「26歳」の年齢をそれぞれ 1 人ずつしか有していない場合、3 人を同一グループとして扱い、全員の年齢を「25歳」に統一するといった変換を行います。これにより、特定の個人が他と区別されるリスクを効果的に抑えることができます。
■ 攻撃アルゴリズム
攻撃アルゴリズムとしては、属性のエントロピーに基づく重み付けを導入した最短距離マッチング法を開発しました。
今回の PWS Cup では複数の属性を含む医療データが使用されており、異なる匿名化手法を適用した結果、値の多様性が大きい属性(エントロピーの高い属性)に強い匿名化を施すと、有用性が大きく損なわれることが確認されました。
そこで本研究では、「エントロピーが高い属性ほど匿名化が軽く行われている可能性が高い」と仮定し、元データと匿名化後データを対応付ける際に、エントロピーの高い属性をより重視する重み付き距離を用いたマッチング攻撃を実装しました。
このアプローチにより、属性ごとの匿名化の度合いを反映した攻撃モデルを構築することが可能となり、より精度の高い攻撃を行うことができました。
■ 匿名化データを用いた分析
プレゼンテーションでは、上記の匿名化および攻撃手法の説明に加えて、生成した匿名化データの有用性評価を行いました。
具体的には、作成した匿名化データを用いて、
• ロジスティック回帰モデル
• XGBoostモデル
• ランダムフォレストモデル
の3種類の統計モデルを構築し、実際の保健データ(NHANES)を用いてその予測性能を比較しました。
その結果、ロジスティック回帰モデルにおいて約9割の正答率を確認し、匿名化後のデータであっても、十分に有用な分析・応用が可能であることを示しました。
ベストプレゼン賞受賞!
■ 受賞について
本発表は、ベストプレゼン賞を受賞しました。
評価理由としては、次の2点が挙げられました。
1. 攻撃手法の開発において、複数の匿名化処理や過去研究を踏まえた実験的検討を行い、その内容を明快に説明した点。
2. 医療データに対する匿名化および攻撃というPWS Cup 2025の主題を的確に理解し、現実の医療データ利用を想定した実践的な分析を行い、有意義な示唆を与えた点。
これらの点が総合的に高く評価され、今回の受賞につながりました。
参加にあたって
■菊池 陽さん(前列中央)
PWS Cupへの参加は、2024年度に続き今回で2回目となります。
前年度のPWS Cupと同様の設計方針に基づく匿名化アルゴリズムや攻撃アルゴリズムを用いた研究発表をこれまでに複数回行っていたため、当初はある程度有利な立場からスタートできると考えていました。
しかし、今年度のPWS Cupでは多くの仕様変更があり、匿名化・攻撃の双方で新たな困難に直面しました。
特に匿名化処理については、これまで私が主に研究対象としてきた差分プライベートな合成データが十分な有用性を発揮できなかったため、最終的にはチームメンバーのChanhさんが中心となって一般化アルゴリズムを開発してくださいました。
攻撃アルゴリズムにおいても、前年度とは設計方針が異なり、ブラックボックス化されたデータに対して攻撃を行う必要があったため、大きく方向転換し、複数の新しいアイデアを試行しました。
また、今年度はPythonやGitの使用方法、Cupのルール理解といった基礎的課題の解決にも多くの時間を要しました。こうした経験を踏まえ、来年度はより効率的に取り組み、より良い成果を目指せると感じています。
私たちの行った匿名化・攻撃手法や分析手法を評価いただき、ベストプレゼン賞を受賞することができたことは大変光栄なことであり、非常に嬉しく感じております。
最後になりますが、今回のPWS Cupを企画・運営してくださった委員会の皆様、互いに切磋琢磨した参加チームの皆様、そして難解なルールや初めての課題に真摯に取り組んでくれたチームメンバーの皆様に、心より感謝申し上げます。
参加チームのメンバー
■早川 拓実さん(前列右)
PWS Cup参加を通じ、情報セキュリティやデータサイエンスについて多くを学びました。特に情報セキュリティシステム分野の知識習得が大きな刺激となりました。経済学研究では匿名性やデータ不足の課題がありましたが、本大会で得たデータ整理や加工の知識を活かし、経済学と情報セキュリティの両側面から研究を進めていきたいと考えています。
■杉山 拓海さん(後列右)
今回は、前回に続いての参加となりました。今回の企画では、ルール設定が以前よりも複雑で、各フェーズの内容をチーム内で検討するにあたり難しさを感じる場面もありました。私自身は微力ながら取り組ませていただきましたが、チームの皆様が非常に熱心に取り組んでくださり、ポスターの完成度を含め、受賞につながったのはチーム内の皆様のおかげであると考えております。チーム内では来年度の参加を希望する声もあり、私自身も可能であれば、来年も参加させていただきたいと考えております。
■Wu Liujieさん(前列左)
このたびは、学部生でありながら学会に参加するという貴重な機会をいただき、誠にありがとうございました。
初めての参加で分からないことも多かったのですが、チームメンバーの皆さんの丁寧なサポートと温かいご助言のおかげで、無事に経験を積むことができました。
今回の学びを糧に、来年はより一層自分の力を発揮し、チームに貢献できるよう努めたいと思います。
※この記事は2025年11月時点の内容です。