toptoppage
2017年度公開講座案内・申込締切日・授業料など詳細はこちら

多変量データ解析T
1日コース
 多変量データ解析T、多変量データ解析U、多変量データ解析V の違いは、難易度ではなく「分野:学ぶ内容」の違いです(補足参照)。多変量データ解析 を履修してから、統計データ分析T・Uを履修する方もいます。その際は、少なくとも正規分布の知識を持っていることが必要です。多変量データ解析T・U・Vの2科目以上を履修した方には、名著として30刷まで増し刷りされた担当講師の書いた本の改定版(4,000円)を進呈しています。 実務でよく活用される 多変量データ解析T・U・Vを履修してから、統計データ分析T・Uを履修する方々もいます。
 現実のデータは、幾つかの測定項目がセットで(多変量、多変数)で、観測されることが多い。例えば、輸入額を国内生産額、資本形成、国内消費額で予測することを考えます。輸入額の推測に使う国内生産額、資本形成、国内消費額を説明変数と言いますが、説明変数が互いに関連していなければ簡単ですが、実際には相互に関連しています。我々はそれらを同時に扱って分析し、予測式を作ることになります。冷蔵庫の価格を、総容量、ドア数、・・・、冷凍室の広さで予測するモデル式の作成も重回帰分析です。どちらの場合も、統計ソフトにデータを入力して出てきた数値結果は、解釈不能で使い物になりません。これに対する対応の仕方(対策の方法)は、2通りあります。どちらの方法を使うかは、結果の利用の仕方と関係します。このような問題が「多変量データ解析T」の中心テーマになります。これは世の中で、
最もよくつかわれている統計データ分析の方法の一つです。
 目的変数 y(上の例では、輸入額や冷蔵庫の価格)を、
幾つかの調査項目、あるいは複数個の観察した項目を用いて、推測する式を求めたいことがあります。また、知りたい項目の値 y を計測することは難しく、計測の容易なあるいは観察の容易な複数個の項目から、目的変数 y を推測したいことがあります。そのさいによく用いられるのが重回帰分析です。これはいろいろな分野で、最もよく活用されているデータ分析法です。本講座では重回帰分析について、パソコンの 打出した一つ一つの数字は何を意味しているのか、それらの数値結果はどのような状況のときに安定していて信頼性が高いのか、数値結果が意味不明のときはどのような対応をすればよいか、等が分かるように、いろいろなデータ分析の適用例を通して講義を進めます。
 数学を使わないで、分析例通して、これらの重回帰分析の本質的な考え方、数値結果の解釈、結果の信頼性等を学んでいただきたいと思います。
 また、学習支援のため、講義のパワーポイントと関連資料をUSBを通して提供しています。当日パソコンを持参しない方はUSBをご持参下さい。
 ほとんど全ての講座で、教室は少し贅沢なのですが、32人から40人が使える部屋を用意してあります。ゆったり座って、居心地良く授業を受けていただければと思っています。
 教室は8時半に開き、使えます。講師は開始30分前には、会場についています。早く会場に来られた方とは、開始までの時間、講師との名刺交換等のcommunicationの時間として活用しています。
 担当は杉山高一先生です。午後の2時間は牛澤先生がデータ分析例を中心に話しを致します。
 
内容:
(1) 重回帰式モデルとその実例.
  
例)工業製品卸売物価指数のモデル等:和のモデル
  国民総生産のモデル等:積のモデル.残差項に関する条件.
(2) 2変数・3変数による重回帰分析.
  例)歯の咬耗度の例、売上高の分析例
(3) 残差分散、重相関係数.決定係数と自由度調整済み修正済決定係数.
 例) 消費支出の分析例:残差から見た説明変数の妥当性、
   ダミー変数の活用による予測精度の向上.
(4) 偏回帰係数の信頼区間.
  例)世帯実質実収入と消費者物価指数の例
(5) 多重共線性:多重共線性は何故起こるのか.
  例) ドルベース輸出価格指数の例
(6) リッジ回帰分析.多重共線性を検出するVaiance Inflation Factor.
  例)フランス経済のデータ分析.リッジ係数をどのように決めるか.
(7) リッジ回帰: リッジ軌跡と推定値の決め方.
  例)冷蔵庫の実勢価格の分析例.偏回帰係数の妥当性.
(8) 説明変数の選択:変数増減法と変数減増法(逐次法).
(9) 説明変数の選択:変数を取り入れる基準Fin. 変数を除去する基準Fout.
  例)歯の咬耗度データ分析、各方法による変数選択の順序と結果の妥当性
(10) 説明変数の選択:AIC規準.C
p 規準.それぞれの統計量の関係.
  情報量基準AICとCp 規準によるベスト5.標準化回帰係数
(11) 説明変数の選択:変数選択による重回帰モデルの検討
  例)生活保護に影響する指標にもとずく分析、3つの仮設の検証分析
(12) 数量化1類:カテゴリカルデータによる予測モデルと計算
  例)火力発電所の発電機の起動時間データの分析
    アンケート調査データの分析
(13) 多変数による
ロジスティック回帰モデルとデータ分析例
(14) 分析結果の信頼性と現実問題での対応


補足:多変量データ解析では、優れた統計フリーソフト「R」はお勧めです。その使い方、「R」を用いたデータ分析を、この講座でお教えする十分な時間はありません。詳しく勉強したい方は、2015年度公開講座の参加者のために用意した「R」での統計データ分析実習 にご参加下さい。ご自分の使い慣れた「統計データ分析ソフト」をお持ちの方は、そのソフトを用いるのが良いと思います。
 「多変量データ解析T」は重回帰分析を中心に、「多変量データ解析U」は
主成分分析、判別分析を中心に、「多変量データ解析V」は因子分析、正準相関分析、クラスター分析を中心に据えた講座です。
Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved