これからの臨床研究に求められる統計手法②

論文というものをやり始めた頃は症例報告すら大変で、慣れてきたら英文にチャレンジしてまた大変で、それに慣れた頃に原著論文をやってみるけどまた大変な壁があって、今度は原著論文のレベルを上げることになりまた壁が!このように成長が続くことは、満足感を得続ける1つの形だと感じています。

では前回の続きです。

ある程度統計が分かってきたら、こちらの本を、折を見て複数回読み直すことをお勧めします。自分の統計レベルが上がってから読み直すことで、毎回新たな発見があると思います。

⑥感度分析(sensitivity analysis)

確かめ算のようなイメージです。研究方法や統計手法を変えてみて主解析と同様の結果がでれば、主解析のデータは「頑健(robust)」と言えます。これは観察研究に対する声明(STROBE)でも行うべきと記載があります。
実際は、①②③PECOの一部を変えて主解析と同様の統計解析をする(対象集団(P)を変える、暴露群(E)と対象群(C)を変える、アウトカム(O)を変える)、④未測定交絡因子(観察研究なら必ずあるはず)の影響を測定し、それが主解析の結果を覆すほどかという計算をする、⑤統計手法を変えてみる、⑥欠測データに対して統計解析を行う場合の扱いを変えるということをします。

イメージしにくいのは、④交絡因子の影響を見る方法/⑥の欠測データの扱いでしょうか。
では④から。未測定の交絡因子が分かっているが測定できていなかった場合はArray approach、未測定交絡因子が不明な場合はrule-out approachを用います。

Array approachですが、例えば飲酒の有無で肺癌リスクを調べたい場合に喫煙の情報が測定されていなかった場合などです。この場合、飲酒群で喫煙者の割合を10-70%で動かしてみて、その喫煙の肺癌発生リスクを1-5くらいで動かしてみて、その両者が動いた時のハザード比がどうなるかを算出します(ハザードとは、まだ発症していない人が次の瞬間で発症する確率です。ハザード比とは、2群でのハザードの比ですね)。そのハザード比が、ある条件では1を下回る場合、未測定交絡因子の条件によっては研究結果が覆る可能性があるということです。条件を変えてもハザード比が大きく変わらなければ、その研究結果は信用できます。
rule-out approachですが、何が未測定交絡因子かも分からない状況ですので、まずはその未測定因子が集団の何%に存在するか仮定します(例えば20%)。その上で、こちらではArrayとは違い暴露とアウトカムにどれだけ影響するか(オッズ比とリスク比)を変動させます。そうするとハザード比が1になるような組み合わせが算出されます。例えば、ハザード比が1になるような組み合わせの1つとして、未測定交絡因子が暴露に与える影響がオッズ比3.7、アウトカムに与える影響がリスク比5.0という組み合わせが得られたら、同時にそれらを超えるような影響力がある未測定交絡因子があるのかを考えます。論文を書く場合には、この未測定交絡因子が影響するであろう暴露へのオッズ比とアウトカムへのリスク比を提示した上で、想定される未測定交絡因子(性別、年齢、飲酒、喫煙、肥満などなど)がそれらを超えるとは思えません、などと追記することになります。

⑥の欠測値についてですが、データが得られている症例だけでの解析を完全ケース解析、統計的に欠測を埋めて解析するのが多重補完法といいます。例えば主解析では多重補完法を用いて、感度分析として完全ケース分析をするなどというやり方があります。

⑦生存時間分析における競合リスクモデル(survival time analysis と competing risk)

生存時間とは、“観察期間内でアウトカムが発生せずに追跡できている時間"のことです。
生存時間分析とは、この時間を比較する方法です。生存時間に関する単変量解析がカプランマイヤー法、多変量解析がCox回帰分析とポアソン回帰分析です。

ところで時間の比較とはどのようにするのでしょうか?カプランマイヤー法では、単純にアウトカム発生までの時間の中央値を比較します。しかし多変量解析であるCox回帰分析やポアソン回帰分析では、時間そのものではなく、"時間を分母にした速度"の有意差を求めます。

以下の図で速度の説明をします:

まずは割合と率の違いですが、日本語では普段は同義として使いますね。しかし統計用語としては、割合は速度ではなく率は速度です。上の図においては、それぞれ以下のようになります。

死亡の発生割合=3人/5人=0.6(60%)
死亡の発生率(死亡率)=3人/14人年=21%/年(0.21/年)

発生割合は観察期間内に起こるアウトカムの確率、発生率は単位期間あたりに起こるアウトカムの確率です。発生率は、単位期間あたりに起こる"アウトカムが起こる平均速度"と言い換えることができます。
ちなみにハザードという言葉がありますが、ハザードとは、アウトカムを起こしていない人が次の瞬間にアウトカムを起こす確率です。"アウトカムが起こる瞬間速度"と言い換えることができます。Cox回帰分析はハザードを、ポアソン回帰分析は発生率を対象にします。

この後は、生存時間分析における競合モデルの説明になりますが、競合モデルを考慮する場合はCox回帰分析を使用します。そのためCox回帰分析の前提についてもう少し説明します。
ハザード自体は時間とともに変化しますが、Cox回帰分析では2群間におけるハザードの比は一定であることを前提にしています。そのため比例ハザードモデルと呼ばれることもあります。ハザード比が一定であることは、二重対数プロット(log-log plot)やシェーンフィールド残差(Schoenfeld residual)という方法で確認できますが、ここでは名前の紹介だけ。

では競合リスクとは何かです。
アウトカムとして興味のあるイベント(例えば死亡)以外のイベントを競合イベント(例えば腎移植)といいます。
競合イベントが起こることで興味あるイベントが観察できなくなることを、競合リスクがあるといいます。透析患者は腎移植を受けることで死亡率が下がりますから、腎移植は透析患者の死亡に対する競合イベントです。
この腎移植のように、「それが競合イベントであり、今やっている研究の競合リスクになるか」は、先行研究と臨床的感覚に基づき私たちが決定します。

競合リスクがある場合の対処方法ですが、大きく分けると2つあります。
1. 競合イベントを興味あるイベントとまとめて複合エンドポイントにする
2. 統計解析で対処する
複合エンドポイントは、統計的な検出力を上げることを目的だと思われると批判の的になりますが、競合リスクに対処しているという側面があります。
統計解析での対処は、原因別ハザード(競合イベントの発生は"打ち切り"として扱う)を用いる方法と、部分分布ハザード(競合イベントの発生でも打ち切らず、統計解析上は興味あるイベント発生までの観察が続いているとして扱う)を用いる方法があります。これらを用いた場合の単変量解析は、前者ではlog-rank検定(競合リスクのない生存時間解析の場合と同じ)、後者ではGray検定を選択します。多変量解析の場合は、前者では原因別Cox回帰分析(cause-specific Cox regression analysis)、後者ではFine and Gray modelを選択します。

⑧欠測データの取り扱い

まず、データセットの中の空欄を、欠測データとするかどうかの検討からです。
例えば、ほとんど女性にしか発生しない疾患のデータで、性別の行には男性という記載がちらほらあり残りは空欄だったとしたら?その空欄は女性で埋めればいいですよね。このように2値変数やカテゴリ−変数は、そのデータセットが記録された背景や研究の対象となる疾患などについて詳しい臨床家のみが判断できます。対して連続変数の場合は、空欄はすべて欠測として扱います。
欠測データを取り扱うためには、どのような理由で欠測が起こったのかを考察することが必要になります。

1. ランダムではない欠測(missing not at random, MNAR)
欠測したデータを、その変数自体で説明できる状況。
例えば、肥満がありそうな患者に対してBMIを測定するクリニックがあると、BMIが低い患者ではBMIのデータが欠測しやすい。この欠測はBMI自体で説明できる。
2. ランダムな欠測(missing at random, MAR)
欠測したデータを、それ以外の変数で説明できる状況。
例えば、心筋梗塞の既往があれば血圧を測定するクリニックがあると、心筋梗塞がない患者は血圧のデータが欠測しやすい。つまり血圧データの欠測は、心筋梗塞の有無という2値変数で説明できる。
3. 完全にランダムな欠測(missing completely at random, MCAR)
その欠測を説明できる変数がない。
例えば、患者全員に血圧を測定するクリニックで、ある日血圧計が壊れた。

このどれに該当するかは、そのデータセットが記録された背景を知る臨床家が決めるしかないです。つまり我々。また欠測データを含めた統計解析をする場合は、統計家に相談することが推奨されているようです。

では実際の解析方法はというと、完全ケース分析と多重補完法の2つです。
完全ケース分析は、欠測がない症例のみで解析する方法です。MCARには妥当な方法ですし、MARでは欠測を説明する変数を多変量解析に含めればOKです。MARでも、欠測を説明する変数がアウトカムに影響しない場合も、完全ケース分析は正確です。
多重補完法において最も臨床論文で使用されるのは、多重代入法と言われ、統計ソフトでも実行できます(統計家への相談は推奨されます)。多重代入法は、MCARとMARに用いられます。解析ソフトが行うステップを説明すると、欠測データがない完全な症例だけから回帰モデルを作成し、そこから欠測データ推定値を算出し、さらに分散の情報を加えて、ランダムな補完値を生成します。これを当てはめた疑似完全データセットを20−100個作成し、それぞれ主解析を行います。その結果を平均したものを最終結果とします。ちなみに欠測データが複数の変数である場合には、連鎖式による多重代入(multi imputation using chained equationss, MICE)を選択します。これは医学論文でも度々使用されるようです。


ちなみにMNARに対しては有効な解析方法はなく、現状はMNARと仮定して多重代入法を行い、感度分析として完全ケース分析を行うしかないようです。

感度分析は、PECOの一部の定義を変更したり、統計解析手法を変更しても同じ結果になるかという頑健性(robust)を示す方法でした。

生存時間解析(興味あるイベントが発生していない時間の解析)においては、競合イベントがあると、ない場合に用いる単変量解析のログランク検定をGray検定に変更すべき場合がある。また多変量としてのCox回帰分析は、原因別Cox回帰分析またはFine and Grayモデルに変更すべきである。

欠測データがある場合は、完全ケース分析、多重代入法、または両者(片方は感度分析として)を実行する。

Posted by ガイドワイヤー部長