Eventイベント
研究開発機構
2024年度 第3回 中大―OKI OAICO Seminar 「『n個のp変量からなるデータ』ではないデータ」
- 日程
- 2025年3月11日(火)14時~15時30分
- 場所
- 後楽園キャンパス 3号館14階セミナールームAB
- 日程
- 2025年3月11日(火)14時~15時30分
- 場所
- 後楽園キャンパス 3号館14階セミナールームAB
- 講演者
水田正弘 (統計数理研究所 特任教授)
(中央大学 研究開発機構 客員研究員 機構教授)
- 内容
統計学の教科書で扱う基本的なデータセットは、p個の変量(数値)がn個集まった「n個のp変量からなるデータ」であることが多い。このデータから、p個の(標本)平均や分散、さらには(p-1)p/2個の共分散、相関係数の定義や計算方法が示される。p変量多変量正規分布などを仮定して検定の話に進めることもできるし、各変数に役割を与えて重回帰分析や判別分析を実施したり、因子分析、主成分分析、非階層的クラスター分析を適用することができる。「n個のp変量からなるデータ」ではないデータの代表としてはp×p行列で表現される類似性データや距離データがある。さらに時系列データもよく知られている。
しかし、現在の複雑なデータを扱う社会においてはこれらの形式のデータ以外の解析を求められている。例えば音声データや画像データ、さらにはデータベースからの出力結果が解析対象となることが多い。シンボリックデータ解析を提唱したEdwin Diday先生は、
What are Complex data? Any data which cannot be considered as a standard “observations x variables” data table.
として「複雑データ」を定義した。さらに、
What are “symbolic data”? Any data taking care on the variation inside classes of standard observation.
としてシンボリックデータを定義した。そこで関数データ解析を含めたシンボリックデータについて概略を紹介する。
- 参加手続き
事前申し込みは不要です。(学内者及び共同研究者のみ参加可能)