これからの臨床研究に求められる統計手法⑤

このシリーズの最後になります。臨床予測モデル、機械学習、バリデーション研究の説明です。

ある程度統計が分かってきたら、こちらの本を、折を見て複数回読み直すことをお勧めします。自分の統計レベルが上がってから読み直すことで、毎回新たな発見があると思います。

画像に alt 属性が指定されていません。ファイル名: image-8-1.jpg

臨床予測モデル

臨床予測モデルで有名なものの1つは、関節リウマチの分類基準でしょう。

アメリカリウマチ学会 ( ACR ) /ヨーロッパリウマチ学会 ( EULAR ) による分類基準より引用

このように何点以上で関節リウマチと分類というような提示ではなく、何点の場合に何%の確率で関節リウマチですという提示もできます。この予測モデルはどのように作られているのでしょうか。答えは多変量解析です。

RCTや傾向スコアマッチングでは、背景因子(交絡因子)は揃っているので、介入の有無(曝露の有無)とアウトカムを単変量解析することができました。では背景因子が揃っていない2群の場合の、曝露の有無とアウトカムの関係はどのように検討するのかというと、多変量解析でした。2群間で揃っていない交絡因子を全て多変量解析の説明変数(=独立変数)として投入し、興味のある曝露とアウトカム発生の関連を解析するのでした。このように曝露とアウトカムの関連があるかを検討することは、臨床研究の中でもよく触れる機会があると思います。
興味ある曝露因子だけでなく、その他の予測因子と思われるもの(上の表でいう、罹患間接数、罹病期間、RF、CRP)を全て意識し、それらを多変量解析に入れて得られる予測式が臨床予測モデルになります。シンプルな予測因子の選び方の一例は、予測因子と思われるものを1つずつ単変量解析にかけて、特定の基準(p<0.05や<0.1)を満たすものを多変量解析に入れることです。多変量解析を行うと、log[p/(1-p)]=B0+B1X1+B2X2+・・・+BpXpという式が得られます。pがアウトカムの予測確立で、Bpは回帰係数、Xpが各予測因子です。このpが0.9になるところを選べば、90%の診断率のためには何点以上を取ればいいかという診断モデルを作れます(上の関節リウマチの診断予測モデル)し、逆にXp(各予測因子)のスコアから診断率またはアウトカム発生率(予後)を知ることもできます(有名なものはフラミンガムリスクスコア)。
診断予測モデルとするか予後予測モデルとするかにはもう1つ、アウトカムを測定する時点を意識することも重要です。現在のアウトカムであれば診断予測モデルになりますし、未来のアウトカムであれば予後予測モデルとなります。

臨床予測スコアを完成させるにはまだいくつかのステップがありますが、今回はその成り立ちを知るというところを目的として、ここまでにします。

機械学習

多変量解析を考慮する状況で、①説明変数が膨大な場合、②説明変数同士の交互作用がある場合、③目的変数と説明変数で回帰直線を引けない場合=非線形である場合(相関、傾向というものが判然としない場合)に、コンピューターに法則を見つけてもらう手法です。臨床予測モデルも機械学習で作れるものがあり、機械学習の方が優れるケースがあります。

機械学習の手法については、康永先生の本書を見てください。
突然これらの言葉に出会って勉強意欲が下がらないよう、言葉だけ挙げておきます:
ランダムフォレスト
サポートベクターマシーン
パーセプトロン(→それを複雑にするとニューラルネットワーク→さらに誤りを補正するようにしたものがディープラーニング)

データベースに対するバリデーション研究

データベース、例えばDPCデータベースですが、どれだけ正確だと思いますか?医師ではなく事務員が登録したり、治療の保険点数を採るために病名を付けているケースがないとは言い切れません。
データベース自体が不正確ならば、当然それを基にした臨床研究も誤ったものになります。そこで、そのデータベースの正確性を突き止めるものがバリデーション研究です。

手法としては、
①カルテ数百例とデータベースの診断名が一致するか確認し、感度や特異度などを算出する。
②より信頼性が高い別のデータベースと照合する(DPCデータを院内がん登録データベースと照合する)。

しかしバリデーション研究の実施は実な大変なようです:
カルテ数百例をレビューする人件費、
粗探しをされることになる当事者(病院)の協力、
匿名化されている場合はカルテや別のデータベースとの照合不可、
稀な疾患やイベントでは感度や特異度の検証が当てにならない、など。

今回のまとめとしては:
臨床予測モデルは、関節リウマチやフラミンガムなど、研修医にも馴染みがあります。
多変量解析の式から得られるものだったのですね。
機械学習は、人的処理では困難な膨大なデータや非線形モデルの場合でも法則性を見つけることに有用でした。
バリデーション研究は、データベースの正確性を検証し、そのデータベースを基にする研究結果の妥当性を担保するための研究でした。

以上が、これからの臨床研究に求められる統計手法の知識でした。そしてこれからも、医学と同様に統計学も進化するでしょう。自分を満足させるには、どちらに重みを置くにせよ、現状では両方を学び続けるのがいいように思います。

Posted by ガイドワイヤー部長