なぜ我々は統計用語を理解すべきか①　〜まずは多重性〜

2023年2月24日2023年4月15日

臨床研究をこれからする、またはやり始めている皆さん。難解な統計用語はなぜ理解する必要があるのでしょうか。よく分からなくても、データを取って統計ソフトに入れたら後は自動で結果が出るのでそれでいいでしょう？私も最初はそう思っていました。というか、そう思わないと膨大な勉強量になるであろう臨床研究というテーマに向き合えない臆病さもあったと思います。

しかし臨床研究を進めて行くと、
・試験デザインの選択（例えば、前向きでやるべき？後ろ向きでやるしかない？）
・数ある統計解析の選択（例えば、多変量解析？傾向スコアマッチングがいいの？どっちでもいい？）
・ソフトが出してくれた結果は、p値だけ見ればいいの？
まさに私が直面した疑問の例ですが、統計用語を知っていることで簡単に乗り越えることができる問題もあります。また、直面した問題を調べるためにサイトや参考書を開きますが、統計用語０のサイトなんてありません。それを理解するためにさらに統計専門用語を調べ直すというテンションがだだ下がる事態も少なくなります。統計専門家に相談する際も、共通言語として理解がないと、専門家の提案を理解できず鵜呑みにすることになります。

出現頻度も高く、理解にひと勉強必要な用語は、“標準偏差、分散、多重性、生存時間解析、回帰分析、相関"あたりでしょうか。

偏差、分散、標準偏差についてはこの順番で勉強すると連続して理解して行けます（こちらのページで解説しています）。

そのため、まずは多重性の解説をします。
多重性とは、臨床試験のエンドポイントを複数設定し、それぞれのエンドポイントに対して別々に検定を行い、どれかが有意になればその臨床試験の有意差があると判断することです。

例えば、"抗凝固薬を内服している群は、非内服群と比較して消化管出血が多い"と仮説してそれを確認する臨床試験を組みます。エンドポイントは、内視鏡的止血術を要した or 輸血を要した or ヘモグロビンが2g/dl以上低下したの３つを設定します。この３つは２値変数（＝０か１で代弁できる事柄）ですから、それぞれにカイ２乗検定を行います。で、どれかが有意なら"抗凝固薬を内服している群は、非内服群と比較して消化管出血が多い"と結論します。

これは何が問題なのでしょうか。結論は、この"or（＝もしくは）"が成立する状況で統計を複数回行うと、αエラーが増大するです。αエラーはあわてんぼうのエラーでした（有意でないものを有意と勘違いするエラー）。３つの検定はそれぞれ固有のαエラーを持ちますので、当然αエラーは増大します。基本的には５％を許容するのですが、１つの検定につき５％で設定されているので、当然それを超えてしまいます。

ではこれに対処するには？
①エンドポイントに対する検定を１つにするために、エンドポイントは１つに絞る。またはエンドポイントを点数化などで合成し、その点数に対して検定をする。
②全てのエンドポイントを独立して使いたい場合は、検定にかける順番を事前に決めておき、1つ目が有意なら次のエンドポイントの検定に行き、全てが有意な場合にその臨床試験が有意なものと判断する。
③それぞれのエンドポイントに対してどれかが有意ならその臨床試験も有意とする（or＝もしくはの状況）ならば、それぞれの検討の有意水準（p値）を厳しくする。2回の検定を並列するなら、p=0.025にする感じです。ボンフェローニ法で調整できるようです。

デザインや統計解析は何となく選べるようになっても、このように詳細な使い方になると、そのやり方が正しいのかどうか判断できないことがありますよね。そういったことが少しでも減ればと思います。

2023年2月24日2023年4月15日

Posted by ガイドワイヤー部長