複数の統計手法の使い方の勉強になる論文

2023年5月6日

RCTであればシンプルな統計解析になりますが、RCTができないようなテーマでは観察研究を行います。そして観察研究では交絡因子に群間で偏りが出ることは必至で、それを調整するために統計解析に頭を悩ませ、時に複数の解析を組み合わせ、そして今でも統計手法は進化しています。

今回は、統計手法自体というよりはその用い方の勉強のために良い論文を見つけましたので紹介します。
大規模データベース(いわゆるリアルワールドデータ)による観察研究に、複数の統計手法を用いて結論を導いた論文です。"RJと部長のやれる統計"で紹介してきた統計手法が複数出てきます。

では統計の話の前に、この論文をざっくり紹介しておきますね。プロカルシトニン(PCT)を使用した症例とPCTを使用しなかった症例で、アウトカムに差があるかを調べています。結果として、PCTの使用は死亡率に影響がなく、入院日数とCD腸炎を増加させました。結論として、PCTの臨床導入には、"その使用に対する適応や結果による方針転換についてなど"の戦略を考え直しましょうということでした。

では統計の話になります。

まず本文Methodの統計解析部分を提示します(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5434362/):



主解析として、マッチドペアコホートとマルチレベル分析を用いています(これからの臨床研究に求められる統計手法③)。
マッチドペアコホートで調整した背景因子は、「モデルは、患者の人口統計学、患者の併存疾患、入院時に存在する急性臓器不全、感染部位、病院の特徴および主治医の専門性、患者の併存疾患、急性臓器不全で調整した」と記載があります。
マルチレベル(施設と患者の階層があること)に対する調整としては、「各病院をランダム切片とする階層的回帰モデル(切片は変数だが相関関係を直線で表すモデル)を用いて、個々の病院のリスク調整PCT率(PCT検査を受けた患者数/敗血症患者数として定義)を算出した」と記載があります。

アウトカムの解析方法としては、
・抗菌薬投与期間に関しては時間依存性を考慮したポアソン回帰分析を用いています。
・CD腸炎発生についてはロジスティック回帰分析を用いていますね。
・死亡に関しては、「不死時間」を考慮した"PCT命令の時間変化仕様を考慮したCox比例ハザードモデル“というものを使っています。不死時間に関しては、昭和大学のリウマチ科の先生がブログで解説されていて分かり易かったです(文責者は、昔の知り合いでちょっとびっくり笑)。簡単に言うと、PCTを測定された人は、測定されるまで生存がしていたことが大前提です。裏を見ると、PCTをオーダーしても早期に死亡した症例は、PCT非測定群に入るわけです。つまりPCT非測定群には、本来はPCT測定群に入ったはずだが"早期に死亡したたために非測定群となった"重症例が多く混入した可能性があるわけですね。観察研究における交絡因子の1つです。この不死時間を考慮した解析方法が、時間変化仕様を考慮したCox比例ハザードモデルです(解析方法よりも、ここでは不死時間というものだけ理解してください)。


以上が主解析で使われた統計手法でした。
以下は感度分析(これからの臨床研究に求められる統計手法②)に使われた統計手法を提示します。本研究の感度分析は論文の補足ファイルにあり、それを以下に提示します(openなので誰でも無料で見れます):

Supplemental Methods
We performed a number of sensitivity analyses to re-evaluate the results of our primary analysis. First, we evaluated multivariable-adjusted associations between PCT use and outcomes in the full cohort of hospitals, including hospitals not using PCT in any patients. Second, we evaluated the association between PCT use and antibiotic DOT without length of stay as a covariate, to assess for the possibility that length of stay may act as an intermediary between PCT use and antibiotic DOT. Third, to account for the possibility that hospitals that utilized PCT in 2012 may not have had access to PCT testing for the entire calendar year of 2012 or were less familiar with its use, we examined the subgroup of hospitals that had previously utilized PCT in 2011 and continued use into 2012. Fourth, as a surrogate marker for hospitals that may have algorithms regarding use of PCT and early cessation of antibiotics, we analyzed hospitals where PCT was checked sequentially in at least 1 patient. Additionally, we included hospital-level serial PCT rates as a primary exposure variable in a model with patient level outcomes and covariates, with mortality assessed as in the primary analysis using a time-varying PCT order in a Cox proportional hazards model. Fifth, to determine if there was a subgroup of patients with a specific site of infection that may have benefitted from PCT use, we analyzed for potential interactions between PCT use, site of infection, and outcomes of interest. Sixth, in order to attenuate unmeasured, patient-level confounding by indication for PCT testing, we performed three analyses using hospital-level PCT utilization as an ecological instrumental variable[30-33]. Use of hospital-level PCT rates as a measure of PCT exposure in models using patient-level outcomes and covariates provides advantages of a) reduced confounding by indication from individual treatment decisions and b) avoidance of the “ecological fallacy” that may occur from using hospital-level exposures and outcomes. We conducted three analyses using hospital-level PCT rates: 1) we used hospital-level PCT rates as our primary exposure variable in a model with patient-level outcomes and covariates; 2) we included hospital-level PCT availability (any hospital PCT use) as our primary exposure variable in a model with patient-level outcomes and covariates; 3) we assessed Spearman correlation of hospital-level PCT rates with risk-adjusted hospital outcomes derived from the random effects output of hierarchical regression models[34] with linear regression used to visualize the relationship. In order to attenuate effects of unmeasured confounding that may have been present in patient-level analyses, and also to reduce the risk that ‘reverse causality’ might account for our results (i.e., hospitals with higher antibiotic utilization preferentially adopted PCT) we performed a difference-in-differences analysis[35] (planned a posteriori) to compare changes in outcomes between hospitals who did not use PCT in 2011 and 2012 to hospitals that did not use PCT in 2011, but adopted PCT in 2012.

①まずは、PECOのP(=Patient)を変更しても結果が同様になるかを評価しています。ここでは、Pに含める条件を緩和し、より多くの症例を含めたPとして同様の解析していますね。

②次に、多変量解析に含める独立変数(=共変量)を変更しても結果が同様かを評価しています。ここでは、入院期間を共変量から外して再解析をしていますね。

③さらに、PCTを扱う慣れを考慮し、試験期間だけPCTを使用していた病院ではなく、それ以前にもPCTを使用していた病院に絞ったサブグループで主解析と同様の解析を行なっています(①とは逆に症例を限定)。

④さらに、抗菌薬中止の判断のために、PCTを連続的に測定する病院レベルについて考慮しています。つまり抗菌薬中止のためにPCT連続測定を測定した割合(抗菌薬中止にPCT連続測定を用いた患者数/全抗菌薬中止患者数)を新たな共変量として、多変量解析に投入しました。日常診療としてPCTの扱いに慣れているかどうかが、抗菌薬投与期間に関与するかどうかを考慮したのですね。

⑤特定のサブグループに絞っても同様の結果になるかを判断するために、感染臓器ごとなどで層を分けて、主解析と同様の解析を行なった。

⑥病院ごとのPCT測定率を操作変数とした、操作変数法を行なっています(これからの臨床研究に求められる統計手法①)。

⑦試験前年にはPCTを用いていなかった病院で、試験年に用いるようになった病院と用いないままだった病院でアウトカムの差の差分析を行なっています(これからの臨床研究に求められる統計手法①)。
これは、例えば試験年に敗血症ガイドラインが改訂されたなど、PCT測定以外に抗菌薬投与期間に影響する世の中のトレンドが抗菌薬投与期間(アウトカムの1つ)に影響した可能性を考慮するためです。元々PCTを用いていた病院ではなく、用いていなかった病院が用いるようになるとアウトカムはどうなるのかを解析したのですね。


出てきた統計手法は、

マッチドペアコホート、マルチレベル分析、多変量解析(ポアソン回帰分析、ロジスティック回帰分析、時間変化を考慮したCox回帰分析)、感度分析としてのPECOや共変量の変更、操作変数法や差の差分析

でした。この論文が結論したことにどれだけ頑健性があるかを独力で理解するには、これだけの統計解析を理解することが必要ということです!えぇ〜!!そんな論文書かないでーって感じますよね。私もです私
しかしこれは実際にアクセプトされた論文ですし、今後こういったものが増えてくる可能性があります。そして統計的な理解がないままにこの論文を読むと、結論は理解できるけれどもその頑健性が理解できない(この論文の弱点が理解できていない)ということになり、例えば本論文と同様のPICOを用いたRCTの結論や、本論文と同じPECOだが劣る統計解析手法を用いたと比較し、結論の頑健性(強弱)が判断できなくなります。
似たようなPICOの論文があればまだマシです。比較することで弱点に気づけることもありますから。しかしこの論文しかない場合、この論文自体のデザインや統計手法を理解し、この論文の結論の信憑性を判断しなくては、間違えた臨床適応につながるかもしれないのです。

2023年5月6日

Posted by ガイドワイヤー部長