なぜ我々は統計用語を理解すべきか⑤　〜オッズ比とリスク比！〜

2022年10月21日2023年8月1日

皆さんが統計用語で嫌いなものはなんですか？
私は「標準偏差」「標準誤差」「オッズ比」でした。理由は直感で理解できないからです。
さて今回はそんなオッズ比に挑戦します。
オッズ比を理解することが重要な理由は、コホート研究とケースコントロール研究でリスク比とオッズ比で使い分ける必要があるから、そしてもう１つ、オッズ比では危険の大きさは分かりますが「何倍危険か」という表現をしてはいけないからです。

ところで、この項を一気に理解するためには、コホート研究とケースコントロール研究の概要をイメージができる必要があります。私のこの記事を参考にしてください。その記事の後半の、③Types of studiesが参考になります。
オッズ比は後回しにして結局よく分からないままという人が多い単語です。このページに来てくれた機会に理解してしまいましょう！

ではまずはリスクとオッズの定義からです。
リスクは、「その集団の陽性者➗その集団全員」です。
オッズは、「その集団の陽性者➗その集団の陰性者」です。

図解すると、

リスクはA / A+B、オッズはA / B。
これは定義ですし、直感的にもそういうもんかと分かる単語ですよね。リスク比とオッズ比について話して行きます。
ここからが本番で数式も出ますが、ついて来て下さい。３つのサイトを見て、統計の大学院に行っている同僚にも聞きましたが、全員が数式を使っていましたので、イメージだけで直感的な理解とはいかない単語です！

まずはリスク比。リスクの比なので、２つのリスクを用意して割ります。つまり喫煙あり群のリスクを喫煙なし群のリスクで割りす。喫煙あり群のリスクはA / A+B、なし群のリスクはC / C+D。
つまりリスク比は、（A / A+B）➗（C / C+D）です。整えるとA(C+D) / C(A+B)ですね。

オッズ比はというと、オッズの比なので同様に、喫煙ありのオッズを喫煙なしのオッズで割ります。
喫煙あり群のオッズはA / B、なし群のオッズはC / D。
つまりオッズ比は、（A / B）➗（C / D）です。整えるとAD / BCですね。

ここまでは、単純に定義を式でなぞっただけです。しかしここは後の理解にとても重要で、リスク比がA(C+D) / C(A+B)であること、オッズ比がAD / BCであることが、これ以降の理解を助けてくれます。

次のステップに進む前に、コホートとケースコントロールのおさらいです。

喫煙の有無（要因）で群を分けて比較をし、発癌の有無（アウトカム）に差があるのか調べるのがコホートでした。
発癌の有無（アウトカム）で群を分けて比較をし、喫煙の有無（要因）に差があるのか調べるのがケースコントロール。

コホート研究では、例えば「2022年から2025年までの3年間の対象患者全例」などと、期間を決めればその全例を対象にします。ケースコントロール研究は基本的にアウトカムが少ない事例（上の図のAとCが少ない事例）を研究するため、「出血率0.1%の手術におけるメス１とメス２の差」などという研究になります。アウトカム陽性が希少ゆえ、基本的にはアウトカム陽性者は全例試験に組み込みます（上の図のAとC）。しかしアウトカム陰性者（上の図のBとD）はこちらが恣意的に設定できます。アウトカム陰性者を全例試験に組み入れたら膨大な数になります。全例でできるならコホートやればいいんですね。これは重要なポイントです。恣意的なものはバイアスを増やしますので試験の質を落とします。なので基本的にはコホート研究が選ばれるわけですね。そして本日の本題を理解するためにも重要なポイントになります。

さてもう１つ必要な知識を提示します。研究の型によって使える危険度の指標に違いがあるのです。
このことも合わせて、この次に説明していきます。

ここからは記号よりも具体的な数字の方が分かりやすいです。
２つの仮想のケースコントロール研究のデータを提示します。採取したデータは左半分で、いつもの表ですね。右半分の赤字は、リスクとオッズを計算したものです。

A「がん未発症者を250人に設定したもの（ケースコントロールスタディだからいじれる項目）」

ケースコントロール研究なので、「がん発症の有無で群を分け、過去の喫煙歴を調べた」ものと読みます。

リスク比＝0.75/0.33=2.25
オッズ比=3/0.5=6
です。

B「がん未発症者を500人に設定したもの（ケースコントロールスタディだからいじれる項目）」
（がん未発症の症例で喫煙ありなしの比率は、理想的に患者背景の偏りなく症例を集められたとしてAの試験と同じにしています）

リスク比＝0.6/0.2=3
オッズ比=1.5/0.25=6
です。

AとBの試験で、リスク比は違いますがオッズ比は同じです。
ケースコントロール研究では、研究者がある程度自由に設定できるアウトカム陰性の症例数によって、リスク比が簡単に変わってしまうんです。対してオッズ比は一定です。これが、ケースコントロール研究ではオッズ比しか使えない理由ですね。リスク比は信用できないんです。

ではリスク比とオッズ比はどう分けてイメージしておけばいいでしょうか。
次で、イメージ的にはほぼ同じと思って良いですということと、オッズがリスクを越えられない壁があるという話をします。

冒頭で説明したように、リスク比＝A(C+D) / C(A+B)で、オッズ比＝AD / BCでした。

ケースコントロール研究は、基本的にはアウトカム陽性が希少な事例に対して行う研究なので、AとCが限りなく０に近いと近似できます。A(C+D) / C(A+B)において、C+D≒D、A+B≒Bという近似ができるのです。するとA(C+D) / C(A+B)≒AD/BCです。アウトカム陽性が希少であるほど、オッズ比とリスク比が近づくのですね。これが直感的にはリスク比とオッズ比がほぼ同じと思って良い言った理由です。あくまでもアウトカムが希少であるという条件付きで。

ではもう１つの越えられない壁とはなんでしょうか？
それは、「オッズ比が６だから喫煙ありの場合は喫煙なしの場合の6倍発癌しやすい」と言ってはいけないことです。こういった研究を行う動機は、喫煙が発癌の危険因子であることを検証することと、どれほど大きな危険因子であるかを知りたいためですよね。リスク比もオッズ比も、危険因子であるかどうかは確認できる、しかしオッズ比はその大きさの表現に制限があるのです。
cf.「リスク比が６だから喫煙ありの場合は喫煙なしの場合の6倍発癌しやすい」と言うのは正解です。

ここは直感的に理解しましょう。リスク比の場合は、喫煙あり全例の発癌リスクを喫煙なし全例の発癌リスクで割ったものでした。当然ですが、全例で割れば喫煙なし1人あたりの発癌リスクになります。これならば何倍という表現になんら問題はありません。
しかしオッズは、喫煙ありの中でがん未発症全例に対するがん発症を、喫煙なしの中でがん未発症全例に対するがん発症で割ったものでした。割っているものががん未発症者全例なので、言葉にするなら「喫煙なしの中でがん未発症者１人あたりの、、、」という表現になります。喫煙がない集団全体の中での1人としては見ていないのですね。なので、喫煙がない症例１人あたりの発癌危険度が何倍かという表現はできないのです。
しかし例えば、この研究の中で飲酒の発癌危険度についても同時に調べていた場合、飲酒の発癌に対するオッズ比も出てきます。それが10であった場合、飲酒の方が大きな危険度であるということは言えます。大きさは比べられます。

本題は以上になります。分かりにくくていや〜な気分になったかもしれません。とにかくここまで読んで頂いてお疲れ様でした。私が今回使った表と数式をご自身で1回でいいので書いて見て下さい。1回で理解できると思います。放置して今後数年理解しないままになるよりは、今数時間かけて理解しましょう！

ここからは余談です。後回しでいいので、まずは1回私の表と数式を書き出して下さい！！お願いします。

では余談に入ります。リスク差とオッズ差についてです。
リスク比は、さっき説明した通り、"喫煙なし１人あたりに対する喫煙ありの発癌リスク"になります。
リスク比が、例えば喫煙群のリスクが0.005で、非喫煙群のが0.002だとすると、リスク比は0.002/0.005=0.4です。相対的リスク減少=1-0.4=0.6=60%になります。これは1人あたりのリスクが60％減少したということです。

では、リスク差はどうでしょうか。リスク差は0.005-0.002=0.003です。ここでNNT（Number Needed to Treat)という概念を知ってください。1/リスク差で定義されます。これは「1つのoutcomeを出すのに必要な治療の数」です。この場合のNNTは1/0.003で300以上ですね。1人のoutcome（発癌なし）を出すのに300人以上の非喫煙が必要となります。これは、非喫煙など生活指導程度の結果であればいいのですが、侵襲のある治療となると300人やって1人にしか結果が出ないのでは困る数字でしょう。

このように、リスク比は1人あたりに注目した危険度で、リスクは差は集団に注目した危険度を表すことになります。

下の表を見て下さい。上段が相対リスク減少(リスク比から導く数値)、下段がNNT(リスク差から導く数値)です。左にはベースラインのリスクが載っています。相対リスク減少が50％の列を見てみましょう。ベースラインのリスクによって、NNTが大きく変わることが分かります。なので論文を読むときはリスク比だけでなく、リスク差にも注意しましょう。

https://pubmed.ncbi.nlm.nih.gov/3374545/

オッズ差は、何度も出している表でいうAD-BCになります。しかしケースコントロール研究では、この表のBとDが、研究者の意図で簡単に変わってしまうのでした。そのためAD-BCの値も研究者の意図で変わるため、オッズ差は信用できる数値ではありませんね。そのため、計算はできるが意味のない数字ということになります。

2022年10月21日2023年8月1日

Posted by ガイドワイヤー部長