トップページに戻るtoppage
2024年度公開講座案内・申込締切日・授業料など詳細はこちら

統計データサイエンス V
講義時間 10時〜17時
 始めに、統計学で出てくるいろいろな確率分布について簡単な復習をし、その期待値と分散を調べます。
 現実には、確率分布を規定する未知母数を、観測等で得られたデータから推定することになります。
データから未知母数の良い推定量をどのようにして求めるか(最尤法等)良い推定量はどのような性質を持っていることが望ましいか等を、重要な概念なのでより詳しく学びます。また、ベイズ推定の考え方を話します。
 データから計算される平均、分散は重要な統計量です。真の平均の95%信頼幅などを求める際に、平均の分布を知ることが必要になってきます。分散についても同様です。また、例えば「成功の確率pは 0.8 である」という仮説を検証する統計的検定があります。
仮説検定に対する良い検定統計量の求め方としては、ネイマン・ピアソンの定理、尤度検定法等が知られていますが、その基本的な考え方を説明します統計学の入門書には、観測データを得たときに、未知母数(平均、分散、比率、・・・など)の良い推定量と、仮設検定に使う検定統計量は同じ式を用いる場合が多いのですが、その式を導き出す考え方は全く異なります。そのことを一度は理解しておくことは、プラスであると考えています。
 今年度の担当は杉山高一先生です。
(1) 統計学で出てくるいろいろな確率分布:その期待値と分散
 例) 二項分布:コイン投げ、サイコロの目の分布
  ポアソン分布:まれに起こる事象の分布(工場の不良品数、交通事故)
  幾何分布:製造ラインで次の欠陥品が出るまでの平均時間間隔など
  正規分布:身長、医学データ、測定誤差などの分布
  対数正規分布:血液のデータ、寿命分布(ワイブル分布等との関連)
  指数分布:大型システムの故障発生、放射性物質の寿命、待ち時間
  ワイブル分布:機器の故障分布など
  2次元正規分布:生産量の分類、磁器ヘッドのバイアスなど
(2) いろいろな標本分布と大標本分布による法則:
 例) 正規分布の平均と分散の分布、二項分布の比率の分布、年間平均収入
  の平均値、B型の人の割合、不良品の割合
大数の法則(生命保険、損害
  保険で)、
中心極限定理(近似の妥当性)
(3) 良い推定量の求め方−尤度関数と最尤推定量、その具体的な計算
 例) 正規分布の最尤推定量、指数分布の最尤推定量、二項分布の最尤推定
  量、幾何分布の最尤推定量、
ベイズ推定
(4) 良い推定量の望ましい性質
統計講座 統計セミナー 統計講座 統計セミナー
  不偏推定量、一致推定量、十分推定量、漸近正規性等
(5) ベイズの定理とベイズ推定  
  確率の定義と性質を簡単に復習しながら、条件付き確率に関するベイズ
  の定理について説明。ベイズの定理は病気の診断や迷惑メールの判定、
  人工知能など、応用分野が広がっている。ここではテキストマイニング
  への応用にも触れます。さらに、ベイズの定理を用いて母数を推定する
  ベイズ推定の考え方を紹介する。ブートストラップ法と同様に、ここで
  も乱数(モンテカルロ法)が重要な役割を果たします。
(6) 良い検定統計量の求め方:尤度比統計法など。検定統計量の例
 例) p 値、t統計量(平均の検定)、カイ2乗統計量(分散の検定)、
  母比率の検定、非劣性検定(新薬の有効性などの検定)

(7) 分析結果の信頼性と現実問題での対応
質疑応答を随時入れながら進めます.
--------------------------------------------------------------------

 データから計算される平均、分散は重要な統計量です。真の平均の95%信頼幅などを求める際に、平均の分布を知ることが必要になってきます。分散についても同様です。また、例えば「成功の確率pは 0.8 である」という仮説を検証する統計的検定があります。仮説検定に対する良い検定統計量の求め方としては、ネイマン・ピアソンの定理、尤度検定法等が知られていますが、その基本的な考え方を説明します。統計学の入門書には、観測データを得たときに、未知母数(平均、分散、比率、・・・など)の良い推定量と、仮設検定に使う検定統計量は同じ式を用いる場合が多いのですが、その式を導き出す考え方は全く異なります。そのことを一度は理解しておくことは、プラスであると考えています。

統計講座 統計講座
Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved