2022年度公開講座案内・申込締切日・授業料など詳細はこちら
統計学的リスク解析入門Ⅰ/Ⅱ
(基幹編/実践編)
講師 中村 剛先生
授業料 各20,000円
授業時間 Ⅰ、Ⅱ各6時間
<講義内容> ※講座要旨はこちら
【Ⅰ】統計学的リスク解析入門Ⅰ(基幹編A,B)6時間の受講
本当にそんな効果が有るんだろうか、そそられるけど疑わしい。そんな宣伝文句の根拠を探る単純で確かな手順が分かります。その手順に従えばビジネス、日常生活で判断ミスをしなくなります。
(1) 因果関係の分類
・原因は目的により異なる:治療法と予防対策は異なる
・局所的因果関係vs大局的因果関係
・観察(例:ワインの効果)vs介入(例:治療の効果)
(2)因果関係の定義
・相対危険度:原因と結果の関連の数量化
・因果推論図:リスク対策の効果検証の道具
(3)因果関係の実例
・実例:見えない原因の究明法
・実例:仮釈放の請願に対する判決
・実例:喫煙は肺がんの原因?
(4)有意差 検出力
・有意差:Tea-Milk実験,確率
・t分布はs の値に依らない:シミュレーション
・t検定の奥深さ:推測原理、小標本
【Ⅱ】統計学的リスク解析入門Ⅱ(実践編A,B)6時間の受講
リスク分析のために、データを収集し統計解析し、結果を基に判断することは危険な山道を登るのに似ています。実例を用いて、落下せず登り切るコツを解説します。これが分かればビジネス、日常生活で誤判断しなくなります。
(1)無作為化
・割付:対等な2群の構成
介入効果を証明するGold Standard
・抽出:標本の確率変数化によりリスク分析を可能にする
(2)多変量モデルの意義
・重回帰式:交絡要因の影響の除去
・比例ハザードモデル:不思議で怖い病気の法則
・Logistic モデル:リスク分析に欠かせない万能モデル
色の効果も、非線形な関係も、前向きも後向きもOK
(3) 研究デザイン
・前向き=Cohort=Prospective=Follow-up
Relative Risk (RR)=相対危険度
右打ち切りデータ:Coxモデル ハザード
Logistic model: Odds比から相対危険度
・後ろ向き=Case/control=Retrospective
Odds比 Logistic model
・Matching Case/Control:2x2表 条件付きLogistic model
(4)落とし穴、バイアス
・回帰現象:成績評価、薬効評価における落とし穴
・バイアス:選択、情報、転用
・測定誤差:無視できない誤差とは
<講座要旨>
統計学の入門講座をどのように教えるかは、教える先生の専門によって、異なります。信頼性工学を専門にしている方はそれらの例で、経済予測、計量ファイナンスを専門にしている方、企業経営システムを専門にしている方、環境問題や生命科学を専門にしている方、・・・、はそれぞれの分野を例にして講義を進めます。ここでは疫学統計の大家である中村
剛先生に担当していただきます。疫学の実例を通じて、統計学的リスク解析入門を学んでいただきたいと思います。
疫学は統計学に基づく病気や障害の予防法を発見するための知識の集大成です。例えば、肌の若返りに効く、病気に効く、疲れが取れる、収益が上がる、といった話に本当か?と心動かされたことはないでしょうか?
我々は何故都合の良い話を、直ぐ真に受けたがるのでしょうか? 「データが示している」「グラフがそうなっている」「これは事実だ」とか言われたときに、「その根拠は何か?」と考えることは稀です。それは日常生活において、「根拠とは何か、どうすれば得られるのか」が分からないせいもあるようです。基幹編ではデータから因果関係を解釈し、確かな根拠として示すために必要な、根幹となる考え方を事例に基づき解説します。
さらに、生活習慣、医療、経済、行政と分野毎に扱うデータは違っていても、介入(食習慣、運動習慣、環境汚染、治療、看護、経済対策、行政支援等)と効果の関連を示すデータを正しく解釈することは必要です。実践編では介入の程度と反応の程度、統計学の言葉で言えば量反応関係を求めるための解析法と解析結果の解釈、並びに、論文に記載する際の正確な表現を解説します。
量反応関係を表現する式は統計モデルと呼ばれます。普通のモデルと違い、結果の不確実性を表現するために確率変数を用います。そのため、確率に苦手意識のある方は良く分からないと思うでしょうが、初歩的な説明だけで親しみが湧き、習うより慣れろで、正しい理解を得ることを実感し、実は世の中の殆どの出来事に確率が関与していることに気づくでしょう。
例えば、飲酒量と血圧の関係は1次関数のような数式では記述できません。同じ飲酒量でも人によって血圧に与える効果は正確に同じではないからです。このような不確実な関係を記述するのには確率の考え方が有効です。例えば硬貨を投げた時に表になるか裏になるか答えなさいと聞かれたら、どう答えますか。分からない、では思考停止です。一方、表の出る確率は0.5、という答えは単純で、正確に現象を説明しています。さらに2回投げた時に表の出る回数を当てろと言われたら、少し複雑にする必要がありますが、同様に答えられます。このように、結果が不確実な現象を正確に記述するために確率を用いたモデルは、統計モデルと呼ばれます。統計モデルに付随する有意差、有意水準、P値の意味も具体例を用いて会話をしながら解説します。
本講座では、t 検定とロジスティックモデルを主に扱います。これらのモデルは生産工場での品質管理、医療における治療効果判定、喫煙と肺がんの因果関係解明、公害による健康被害の原因究明などで用いられることで磨かれ、現在ではビジネスでの戦略立案、ソフト開発での工程管理、行政データの有効利用など幅広い分野に普及しています。
先ほどのアルコールと血圧の例をさらに掘り下げてみます。そもそもひとの血圧は一日中一定ではなく、朝高く、夜には低くなります。これは個人内変動といわれます。また、血圧は少量のアルコールでは上昇し、大量では下降します。これは非線形な量反応関係です。さて、この人がアルコールを飲んだ時の血圧の変化を予測するモデルはどのようになるでしょう。ロジスティックモデルに小さな工夫を加えることでそのようなモデルを構成することが可能なことも紹介します。アルコールと血圧を他の変数で置き換えれば、どの分野においても同様の問題は、あるでしょう。
研究目的を決めたら次に来るのは、データの収集です。データ収集法には2通りあります。前向き法と後ろ向き法です。それぞれに結果の解釈をスッキリさせるための作法(留意点)があります。作法に則った研究をデザインするための工夫を具体例に沿って解説します。
本講座には基幹編(Why)と応用編(How) と有りますが、どちらか一方だけを受講することも可能です。統計データの解釈における根本の考え方より、まずデータの収集法、解析法そして解釈のコツ(目の付け所、要点、落とし穴、表現法等)を知りたい方は実践編を受講し、その後実践法の根拠を知りたくなったら基幹編を受講することも可能です。
|