なぜ我々は統計用語を理解すべきか④ 〜95%信頼区間〜

2022年10月1日

 偏差→分散→標準偏差の順で勉強すると分かりやすいよ

95%信頼区間は?と問われて端的答えられますか?

母集団から標本を取ってきて、標本の平均から95%信頼区間を求めるという作業を100回やったときに、95回はその区間の中に母平均が含まれる」ということが答えになります。母平均という固定された数値があって、この研究を、母集団から取り出す100個の標本で繰り返すと95個の標本の研究の信頼区間は、母平均に引っ掛かるということです。

今回はそれを噛み砕くお話。理解がきついところもありますが、放置してたらいずれ自然と理解できる項目ではないんです!ここを乗り越えたら統計の実力が上がります。頑張りましょう。

まずは重要な前提をお話しします。

私たちが行う研究(当たり前だが母集団から抜き出した"標本"が対象)が母集団にどれだけ正確に当てはまるかは、
①偏り(バイアス)をどれだけ排除するデザインを計画できたか
②研究の精度を高めることができたか
に寄ります
バイアスは計画の段階から生じ、後からは生じているのかどうか明確にはできません。そのためバイアスがより出ないデザインが求められるのです。精度に関しては、症例数を増やすことと、データのバラつきを小さくすることで高めることができます。データのバラつきとは、平均値からどれだけ離れたところにデータが散っているかです。
ただし症例数を増やしすぎると、臨床的に意味のないことまで統計的な有意差が出てしまうので、適切な症例数にすることが重要です(サンプルサイズ の計算方法がある)。データがバラつくことを防ぐには、対象を限定することです。例えば、「胆管炎に対するの適切な抗菌薬投与期間を調べたい」ではなく「軽症胆管炎に対するERCP後の適切な抗菌薬投与期間を調べたい」というリサーチクエスチョン(RQ)を持つことです。

上に書いた「データのばらつき」を出したいための前置きでした。
その心は、このデータのばらつきが95%信頼区間に関わってくるからです。理解に辿り着くように順に解説します。用語を理解することはゲームの説明書を読むようでおっくうです。しかし直感的にやりながら理解できるゲームと違い、統計用語はどこかで勉強する必要があります。どうせならそう、今ですね笑

データのバラつき

厳密には正規分布しているデータの話になるのですが、データのバラつきとしての用語は、偏差、分散、標準偏差(SD)があります。この順番で理解してください。計算もこの順番で進んでいくからです。
「偏差=実測値ー平均値」です。
「分散=偏差2乗の和/症例数」です。
「標準偏差=√分散」です。

偏差は直感で分かりますね。ある実測値が平均値から大きく外れたら当然バラついているということです。
分散は、偏差のように個々の実測値ではなく、実測値全体を見ているものですね。2乗している理由は、全ての偏差の和をとると0になってしまうという原理があるからです。
標準偏差は、分散の√(ルート)をとったものです。実測値や平均値の単位がcmだった場合、分散の単位はcm2になってしまうので統計解析の段階で問題になるため、単位を合わせるためです。2乗しようが√しようがバラつきの指標としてはなんだっていいのですが、統計解析の都合がよくなるようにしているということですね。

ここまでは母集団から取り出した1つの標本に限定した話です。その標本における研究精度を高めるためにはバラつきが小さいほどよく、その1つの標本の中でデータがどれだけバラついているかを示す指標として標準偏差(SD)が最適なのでした。

ではここで標準誤差(SE)という用語を知りましょう。SDの次はSEです。
1つの標本を飛び出して、別の標本のことも気にする概念です。
「SE=SD/√n」です。SDを√症例数で割っただけです。SDは、1つの標本内において、すべてのデータが平均値からどれだけ離れているかを示すものでした。SEの意味は、「母集団から別の標本をとってきて今回と同様の研究を複数回した場合、その標本ごとの平均値がどれだけバラつくか」です。標準誤差という単語とその意味が合ってなさ過ぎて統計の先人を恨みます。

1つの標本内でデータの平均値からのバラつきを示すのがSD。
複数の標本間の平均値のバラつきを示すのがSE。

ここまでが前置きです!お疲れ様です、一息つきましょう。

では本題の95%信頼区間です。
まず提示してしまうと、「95%信頼区間=標本の平均値±1.96SE」です。
正規分布の場合、掛けるものがSDなら、±1は標本内の症例の68%が、±2は95.5%が、そして±1.96は95%が含まれる範囲が算出されるという性質があります。掛けるものがSEなら、母集団から複数抜き出した標本の個々の平均値がその範囲に95%の確率で含まれるものとして算出されます。

もうこれが95%信頼区間の答えです。ある母集団から同様の研究を100回行なった場合、その個々の平均値のうち95個は、ある標本の平均値±1.96SEの範囲に含まれるのです。

はいスッキリ!ではないです。あと一踏ん張り。
私たちが統計を勉強しているのは、母集団から標本を抽出して研究し、それを母集団に還元して日々の診療に役立てることです。つまり95%信頼区間も、母集団を推測するためにあるのです。それを最後に解説していきます。

まず答えを先に提示しておくと、「母集団から標本を取ってきてその標本の95%信頼区間を計算する」という作業を100回やったときに、当然100個の95%信頼区間が生まれます。母集団の平均値(真値)は、そのうちの95個に含まれる!ということが答えになります。

以下で図示してみます。

今回は、この図を解説していくということでもあります。

よくある間違いは、「母平均が、標本から推定した平均の信頼区間に95%の確率で含まれる」と言うことです。95%信頼区間は、1回の研究についてだけについて語っているのではありません。母集団から100回標本を抽出して同様の研究を行なった時、そのうち95回の研究の"95%信頼区間"の中に母平均がありますよということです。
まだスーっとは理解できませんよね!私もです笑
なのでちょっと別の視点から考えてみましょう。%なので確率ですよね。ならば絶対に分母が必要です。もし95%信頼区間が「母平均が標本から推定した平均の信頼区間に95%の確率で含まれる」というものだと仮定すると、その95%の分母ってなんですか?何十万人や何百万人という母集団から、たかだが数百人や数千人の標本をとってきたところで、母集団を代表するような値の分母なんて分かるはずがないです。

そうではなくて、「母集団から100回標本をとって、その中に真の母集団の平均がいる」ということを統計的に計算できるのです。母集団全体ではなくても、偏りが少ない全体の近似を見ていることになり、分母を近似母集団として確率を計算できる気がしますよね?笑

似たようなもんじゃんという感じもしますが、分母というものに注目してみると違うものだとイメージが湧きますね。

え?分かりにくい?誰かスーっと腑に落ちるコメントください笑

ここで、outcomeとして平均値ではなくリスク比などを求めた場合、95%信頼区間で考えるべきことが1つ追加されます。リスク比が1を跨いでいるかどうかです。
まさに今の標本(自分が行なった研究)での介入群のoutcomeであるリスク比が、コントロール群有意なものかどうかを判定します。1を跨いでいたら、リスクを下げる方向のものにせよ上げる方向のものにせよ有意ではないということです。ただしそのリスク比は、母集団としての介入群のコントロール群に対するリスク比を表しているかは分かりませんけどね、ということです。

信頼区間の話はここまでです。どうでしたでしょうか。少しでも皆さんの統計胃もたれが軽くなればと幸いです。

ところで、私の場合は胆膵が専門ですので、胆管炎について研究することがあります。以前にやった研究では、「ERCPが成功した軽症胆管炎は、抗菌薬はERCP翌日までで十分」というものです。これは当院5年分のデータから400例ほどを「標本」として抽出し解析をしました。本当は、日本全国の軽症胆管炎で検証をして、「母集団」でも「ERCPが成功した軽症胆管炎は、抗菌薬はERCP翌日までで十分」という研究ができればいいのですが、そんなことは研究に人生を捧げたって99.999%不可能です笑
だから「標本」を利用して、私の介入が「母集団」でどうなるかを推定するんですね。
この推定の正確性は、症例数と試験デザインに依存します。デザインはRCT>前向きコホート>後ろ向きコホートという試験デザインで決まるわけです。症例数が多く試験デザインがいいほどにその標本の結果は、母集団でも同様なことが起こる可能性が高くなります。そして95%信頼区間に関しては、症例数に依存して狭く推定できるようになります。

「標本」をコントロール群と介入群に分けて比較し解析結果を出すと、コントロール群に比べた介入群のリスク比とかオッズ比とか、介入群のoutcomeの平均値というものが95%信頼区間付きで出てきます(リスク比とオッズ比の違いについてはまた別でアップします)。この95%信頼区間が何を意味するか知っとくだけで、人と統計の話をするときにドキドキすることが減ります笑
もちろん他人の論文を解釈する力が上がります。自分の論文を書くときは統計ソフトが勝手に出してくれます笑

「統計を勉強したってどうせい統計専門家に任せるんでしょ?」という考え方もありますが、統計の勉強をして自分の能力を上げることで、研究可能なRQを思いつけます。そして研究が走り出すまでのイメージを持てるようになり、個々の研究がスムーズになるので、勉強を続けるほどに自分でできる研究は指数関数のように増えていきます(臨床研究をやる人の方が優れていると言っているわけではありませんよ笑 仕事も人生の一部です。その仕事を楽しめる選択肢を増やそうということです。)。

まずは点としての知識を増やしましょう。それがいつの間にか面となり、臨床研究という課題を受け止めてくれるネットとなります。

2022年10月1日

Posted by ガイドワイヤー部長