トップページに戻るtoppage
2020年度公開講座案内・申込締切日・授業料など詳細はこちら

統計データ分析 I
講義時間 13時〜18時
 統計分析でよく出てくる正規分布について学びます。測定項目が複数個ある場合の測定項目間の関連性をみる尺度として相関係数を主にして話します。また、相関係数の統計的意味とその意味について、相関係数の分布について述べます。信頼できる結果、再現性のある結果を得るのに、必要なデータ数を知っておくことは重要です。統計データ分析は、機械学習・ディープラーニングでも、よく活用されている方法論です。数学の知識としては、パイ π=3.14、e = 2.718、また対数 log が数回出てきます(簡単な復習を適宜入れます)。
予測でよく用いられる回帰分析、とくに回帰直線の求め方(最小二乗法)について、相関係数と回帰直線の関係について説明します。回帰直線は1次式ですが、2次式、3次式、などの多項式による回帰分析を説明し、いまのデータからは何次式が妥当であるかを、情報量基準AICで判断します。データが時間と共に変わるときに役に立つ自己回帰分析について学びます。
 ロジスティック回帰分析は、信頼性工学・医療・経済データ等でよく出てきます。例を挙げながら説明します。また、説明変数が多変数のときの変数選択法についてもふれます。
 学習支援のため、講義のパワーポイントと関連資料をUSBを通して提供しています。当日パソコンを持参しない方はUSBをご持参下さい。

(1) 正規分布に従う現象とその確率計算:
  正規分布はなぜ統計学では重要なのか.統計データ分析で果たす正規分布の役割と位置付け.正規分布が自然科学、社会科学の様々な場面において複雑な現象を簡単に表す統計モデルとして用いられている理由と、その背後にある有名な定理について..
 例) 身長の分布、誤差の分布、筆跡のデータなど正規分布に従うと考えられる事象.企業の金 利負担率.標準正規分布の両側5%点(1.96)、片側5%点(1.64)等、また標準正規分布表を用 いた正規分布の確率計算.
(2) 測定項目が複数個ある場合の測定項目間の関連性をみる尺度.
  相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数.相関係数とその大き さの意味および安定性.相関係数に関する仮説検定.
 例)経常利益率と金利負担率の相関、 新生児の体重と身長、姉妹の身長、中学校における科目間の相関.
(3) 相関係数の統計的意味とその意味について、相関係数の分布.
  相関係数の精密分布と、有名な正規近似・Fisherのz変換について説明します。相関行列と それに関連したいろいろな分析法について.
(4) 回帰直線:
  最小二乗法の考え方と回帰直線.相関係数と回帰直線の関係.
 例) 経常利益率を説明する指標、年齢と血圧、葉の窒素含有率と葉色、家計消費関数の例
(5) 回帰分析:多項式の当てはまりの良さ.
 例) 直線回帰モデル、2次曲線回帰モデル、3次曲線回帰モデルの中で、何が最もどのモデ ルが最適か.データによる分析例.AIC.
(6) 自己回帰モデル:時間と共に変わるデータをあつかう自己回帰分析.
  例)非鉄金属卸売物価指数の予測.自己回帰式の次数の決定と分析例.
(7) ロジスティック回帰モデルとデータ分析.
 例)スペースシャトル事故の予測.医療・経済データ等での活用.

 本講座では、いろいろなデータ分析の適用例を通して、統計データ分析の基本概念を習得できるように説明します。

Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved