大学院

【究める vol.131】杉山 拓海さん(経済学研究科 博士前期課程)がイタリアで開催されたIEEE BigData 2023で発表しました

2024年01月12日

経済学研究科 博士前期課程に在籍している 杉山 拓海さんが、イタリア南西部にあるソレントにて、2023年12月15日~12月18日に開催された「IEE Big Data 2023」で発表を行いました。
IEEEとは、Institute of Electrical and Electronics Engineersの略称であり、数多くの技術者や研究者が所属している組織となります。特に今回の学会においては、データに関する研究分野のなかで、多岐にわたる研究を募集しており、データやデータ利用、データそのものに対する研究に関連していれば応募可能な学会でした。
記事では、杉山さんによる発表内容の紹介や発表にあたってのメッセージをお届けします。
 

IEEE公式ホームページ

IEEE Big Data 2023

発表の概要について

題目は ”Differently Private Frequency Tables Based on Random Sampling(ランダムサンプリングによる差分プライベートな度数表の実現)" で、20分間プレゼンテーションを行いました。
論文では、ランダムサンプリングによる差分プライバシーの実現を、ARX匿名化ツールを用いて、その有用性の実証実験を記載しました。先行研究にて、匿名化技術のなかでも最も直観的であるk-匿名化によるフルドメイン一般化とベルヌ―イサンブリングのスキームを元データに適用することで、差分プライベートなデータを出力できるという仕組みが提示されています。これはすべての属性が準識別子として仮定されるため、差分プライベートな度数表を出力することと等価であると考え、研究するに至りました。 
実験としては、ARX匿名化ツールに、上記の匿名化アルゴリズムが組み込まれており、それを用いてUS Census Bureau というオープンソースデータとがん登録情報のデータセットを用いて評価実験を行いました。この研究から、ランダムサンプリングによる差分プライバシーの実現は、高い秘匿性を担保しながら度数表においてEarth Mover's Distance という、どれだけ度数分布が似ているかを評価する手段を用いて有用性を調べた結果、高い有用性を示すという結果が得られました。
今後の研究では、より実際のサンプリング手法(有意抽出法や無作為抽出法、さらには1段階で調査地域を選び、2段階目にて調査対象を選ぶ、2段階抽出法等)などに、この考えが応用できないかを考え、日本で公開されている度数表の有用性を担保しながら、よりプライバシーに関して安全であるかを評価できないかと考えています。

発表にあたって

昨夏、国内の学会にて発表を行いましたが、国際学術会議での発表は初めての経験でした。非常に大きい規模の国際学術会議でしたので、沢山の刺激を受けよい経験となりました。私が発表したセッションは、セキュリティーとプライバシーについて中心的に議論するセッションでした。私の発表を聞いた参加者から、様々な質問や議論等を提示され、発表も含め20分という短い時間でしたが、とても有意義な時間となりました。
研究者同士で交流する場面も多い印象を受けました。コンピューターサイエンス系の学会でしたので、理工系の日本人の研究者も多数参加しており、機械学習や情報マーケットにおける研究は非常に興味深かったです。なにより、私の発表における鋭い質問等、様々な国から参加している研究者と活発な議論を交わし、充実した4日間を過ごせたと感じています。
今回参加した学術国際会議で交わした議論等をもとに、さらに研究を重ね、より深い知識とともに次回の学会発表を見据えながら、研究活動に励みたいと思います。