トップページに戻るtoppage
2020年度公開講座案内・申込締切日・授業料など詳細はこちら

統計データ分析 U
講義時間 10時〜17時
 統計データ分析では、結果の信頼性が問題になることがあります。データ分析で出てきた数値(結果)は、同じ条件でデータをとったときに、同様の数値(結論)になるのか、このような結果の再現性・信頼性を調べたりする際に、統計的推定の考え方を知っていることが重要になります。
 確率の考え方を導入として、ベイズの定理とベイズ推定について話します。ベイズ統計学にふれることになります。
 平均値はよく使われます。平均値はどのような分布に従うのかを、またデータの散らばり具合を、分散で計ることが多いのですが、それがどのような分布に従うのかを学びます。
 真の平均は、確率0.95でどの範囲にあるか, 区間による推定(95%信頼区間)を説明します。正規分布や、それに近い分布の平均は、比較的少ないデータ数で正規分布に従いますが、0と1の値しかとらない2値データの平均は、どのぐらいのデータ数で正規分布とみなせるのか、その95%信頼区間などを学びます。推定値は最尤法という、よい推定量を求める考え方で得られますが、それを簡単に説明します(最尤法について、詳しくは統計データ分析Vで学びます)。
 ブートストラップ法について説明し、時間があれば経験していただきたいと思っています。

(1) ベイズの定理とベイズ推定
  確率の定義と性質を簡単に復習しながら、条件付き確率に関するベイズの定理について説 明。ベイズの定理は病気の診断や迷惑メールの判定、
  人工知能など、応用分野が広がっている。ベイズの定理を用いて母数を推定するベイズ推 定の考え方を紹介する。この際、乱数(モンテカルロ法)が重要な役割を果たします。
(2) よく用いる平均値はどのような分布に従うのか.
  正規分布からのデータ(無作為標本)の平均値の分布は正規分布に従う.正規分布によら ないデータの場合、その平均値はどのような場合に正規分布に従うとしてよいのか.本には 大標本の平均と書いてあるが、ときには標本数が12、ときには標本数が2のときの平均値が 正規分布に従うとしてよい場合もある.またかなりの数の標本数を必要とする場合もある
 が、その見分け方について.
 例)利益率の平均値の分布、ある種のプランクトン数の平均値の分布、大数の法則の適用例.
(3) 分散と標準偏差:
  データの散らばりの尺度としての分散の重要性と活用、真の分散の推定値である標本分散 のばらつきを表すカイ二乗分布.分散以外の散らばりの尺度.
 例) 3シグマ、血色素量のデータ、売上高の分散.推定値の安定性の条件.
(4) 母平均(真の平均)の信頼幅:
  分散が既知の場合の母平均の区間による推定(95%信頼区間).分散が未知の場合の分布と 母平均の区間による推定(95%信頼区間).
 例) 出生時体重の平均の95%信頼区間、第1大臼歯の長さ.信頼幅と標本数.
(5) 正規分布の対極としての2値データとその分布:
  二項分布(2値データ)の推定(比率の推定)と母比率の信頼区間、母比率に関する仮説検定、 官能検査で行われる美味しさの比較の検定.例えば、ある意識調査(回答は、1.賛成、2.反対)で、600人を抽出して調べたとき、賛成者の真の比率pの95%信頼区間が、0.35〜0.45で あったとします。
  調査対象の人口が、10万人であっても、100万人であっても、1000万人であっても、信頼 区間の幅は僅かしか変わりません。その理由は.
(6) いろいろな標本分布と大標本分布による法則:
 例) 正規分布の平均と分散の分布、二項分布の比率の分布、年間平均収入の平均値、B型の人 の割合、不良品の割合、大数の法則(生命保険、損害保険で)、中心極限定理(近似の妥当性)
(7) ブートストラップ法の基本的な考え方
 例) 正常分娩と早産の出生児の体重増加の違いの検定など
 データの確率分布が未知母数に依存する場合は、棄却点あるいはパーセント点を数値的に求 めることは、複雑で厄介な問題になります。ほとんどの場合に解けません。1979年にエフロ ンが提案したブートストラップ法は、与えられたデータから繰り返しリサンプリングを行う ことに置き換えて対応する考え方で、複雑で厄介な問題を解決する手法として、近年よく使 われています。パソコンの性能が良くなり、簡単に結果を出せるようになりました。その基 本的な考え方を学び、パソコンで実際に行います。理論的な対応が不可能なときに、パソコ ンに頼ったこの方法の研究は、千人を超える統計の教授を輩出したのではと思っています。 「R」で実際のデータで、その再現性などを確認します。「R」をパソコンに入れている方
 は、プログラムを差し上げますので、実際に家でも試みていただきたいと思います。

Copyright c Toukei Kagaku Kenkyujo, Co., Ltd. All right reserved