toptoppage
2017年度公開講座案内はこちら

多変量データ解析V
1日コース
 多変量データ解析Vは因子分析、正準相関分析、クラスター分析を中心に据えたた講座です。我々が普段 観測するデータは、いくつかの測定項目、調査項目を同時に得たものがほとんどで、多変量データ解析はそのようなデータの分析法として、開発されてきました。上記の分析法は統計パッケージも豊富で世の中では良く使われている統計データ分析法ですが、これらの分析法の考え方の本質を、分析の際の留意点・注意点などをきちんと学ぶ機会はほとんどないのではないかと思い、この講座を設けました。
 以前、関西の製薬会社で、
因子分析について講義をしたことがあります。そこでは、製薬会社の医薬情報担当者(MR)の方々が、医者と接するときに、因子分析で医者を「新薬に関心の強い医者」、「薬の副作用に重きをおく医者」、・・・、等と分類して、活用しているとのことでした。また、因子分析による「顧客満足度・従業員満足度・企業業績を高める人材マネジメントモデル」や「買い物意識に関する調査項目のグルーピング」などの多くの分析例があります。因子分析は計量心理学の分野で活用されて約100年、多くの応用例があります。このように、因子分析は、心理学・物理などのような実験科学の分野においては広く用いられてきましたし、マーケティング、経済などの分野でも用いられています。データから数値解を得る手順は、主成分分析に比べてかなり複雑です。また、数値解を得てから、さらに工夫が必要になります。この講座では約3時間という限られた時間で、因子分析の基本的な考え方、活用する際の注意点、計算結果からさらに回転などを施して、扱いやすい活用できる結果を導き出す方法などを講義します。
 正準相関分析による家計の所得と消費の関係、産業廃棄物処理業者の格付けモデルに関する正準相関分析など、複数個の計測項目間の関連性についての分析法が正準相関分析です。相関係数は、対のデータ(x、y)の関連性を表す尺度としてよく知られていますが、対のデータ(x、y)で、xは多変量データ(ベクトル)、yも多変量データ(ベクトル)のときのベクトル間の関連性を知りたいことがあります。簡単な例では、xは(国語、数学、・・・英語)の高校での成績、yは(国語、数学、・・・英語)のセンター入試の成績の場合、どちらも多変量データです。このような複数個の測定値の間の関連性を分析するときに用いる方法が、正準相関分析で、これについて講義をします。
 
クラスター分析とは、調査・研究の対象となる集団(人や項目)から、「互いに似ているもの」同志を集めて、クラスターを作る方法です。クラスターとは「集団、群れ」を意味し、データ全体を幾つかのグループに分類する方法です。分析ではサンプル同士が「似ているか」または「似ていないか」を基準に分類します。基準としては、類似度(あるいは非類似度)を測るために、サンプル同士の距離や相関係数などを使います。どのような類似度、距離を使うかで、結果が異なってきます。距離の定義について、L1ノルム、L2ノルム、マハラノビス距離など、どの距離を使うかで数値結果が異なりますし、クラスター分析を活用している分野によっても距離の使い方が違います。また、グループ間の距離を測るときにクラスターの重心を用いるか、群平均を用いるか、・・・などのグループ分けの仕方に、いろいろな場合があります。調査・研究の対象の分類をするクラスター分析は、マーケティング、工学、医学等々、多くの分野で使われてきた統計手法です。1985年にドイツのProf. Bockが世界分類学会を立ち上げ、学会では毎回、多くの研究成果が発表されてきています。近年、計算機の発達によってビッグデータの解析が可能となり,その重要性はますます高まっています.実データやサンプルデータ例を使いながら、講義を進めます。
 正準相関分析、クラスター分析因子分析のテーマそれぞれに、1日の時間が欲しいところですが、それぞれ2時間、2時間、3時間の時間配分で、これらの分析法の本質が分かるように話したいと思っています。後で自分でより詳しく学びたい方のために、分かりやすく書いた本などを紹介します。参加者には、講師によって書かれた名著「多変量データ解析」を差し上げています。
 また、学習支援のため、講義のパワーポイントと関連資料をUSBを通して提供しています。当日パソコンを持参しない方はUSBをご持参下さい。
 担当は杉山高一です。午後の2時間は牛澤先生がクラスター分析を担当致します。
内容:
(1)
正準相関分析とは
(2) 正準相関分析の適用例(1)
(3) 正準相関分析の適用例(2)
(4) 正準相関係数の信頼性・再現性
(5)
クラスター分析の目的
(6) 類似度・非類似度の定義とその適用例
(7) クラスター分析で使う距離
(8) 階層的クラスタリング基本アルゴリズム
(9) 最短距離法とその例
(10) 最長距離法とその例
(11) 群平均法、重み付き平均法ウオード法、重心法
(12) クラスターの妥当性の基準
(13)
因子分析のモデル
(14) 主成分分析と因子分析の違い
(15) 共通因子と独自因子、共通性
(16) 因子分析モデルと回転
(17) 因子負荷量と独自因子分散の推定
(18) 適合性検定と因子数の選択
(19) 斜交モデルと斜交回転
(20) 因子分析における問題点
(21) 分析結果の信頼性と現実問題での対応
講師の話を一方的に聞くだけでなく、遠慮なく質問等をして下さい。

Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved