1. 臨床研究の目的を整理する
臨床研究のアイデアが浮かんだら、それを臨床研究という形に落とし込むために整理しないといけません。臨床研究の目的は大別して4つあります(人によって3つだったり5つだったりします)。
- 研究対象がどのような疾患や集団で、どんな特徴があるかを示す記述研究
- 年齢・性別・バイオマーカーなどとアウトカムが関係あるかどうかをみる関連性の探索
- 治療や介入の効果を見る因果推論
- 診断や予後を予測する研究
例えば、このうち臨床研究の花形でもあるランダム化比較試験は治療や介入の効果を見ているので3の因果推論に該当します。イメージとしては下記佐藤先生のツイートが分かりやすいでしょう(佐藤先生は診断と予測を分けています)。
A. 記述研究
得られたデータを記述し分析する研究で、症例報告や症例集積などもここに含まれます。例えばCOVID-19が登場した時、どんな病気でどんな特徴があるのか誰もわかりませんでした。そこで症例を集めた結果が報告され、そこから様々な研究に繋がっています。自施設のデータを分析してその特徴を知りたい、あるいは年度による分布の違いを見たい、など様々な研究のスタートとなる研究です。発展的な話になりますが、phenotypingなども得られたデータをサブグループに分けているだけなので、記述研究の範囲とされることが多いです。
B. 関連性の探索
例えばワクチン未接種や喫煙者であることはコロナ感染のリスク因子である、バイオマーカーとアウトカムに関連がある、呼吸数を患者死亡には関連がある、など「ある因子とアウトカムとの関係性」を見る研究です。また、複数の患者属性や採血結果をロジスティック回帰モデルに入れて有意に関連していた因子を報告する研究も、これまで数多く報告されています。記述研究に加えて関連性の探索を行うことも多いでしょう。
注意点として、得られた結果はあくまで「関連があった」というだけであり、「原因と結果であった」かどうかは不明です。その場合は次に示す因果推論の手法を用いて検討しなければいけません。関連性の探索はあくまでそのための前段階です。また、関連性があることを利用して診断・予測モデルの構築に進む場合は診断や予測研究のガイドラインに従う必要があります。
C. 因果推論
ある治療・介入がアウトカムにどのような影響を及ぼしているのか?を見た研究であり、代表的なものがランダム化比較試験です。ただランダム化比較試験は時間もお金もかかる大掛かりな試験であり、極めてハードルが高かったり倫理的に許されない場合もあります。そこで観察研究のデータから「どうやったらランダム化比較試験を模倣できるか?」「どうすれば原因と結果の関係であると導き出せるか?」を示したのが観察研究における因果推論です。回帰分析や傾向スコアマッチング、操作変数法や差の差分析など様々な疫学統計学的手法を駆使して検討します。因果推論を本気で勉強するなら次の二つの資料はぜひ目を通して欲しいです。
UNBOUNDEDLY:ハーバード疫学PhDから現在はボストン大で助教をされているKRSK先生の因果推論ブログです。あまりにも有名なので知らない人はいないかもしれません。
What If勉強会:長崎大学の佐藤先生が主催された、因果推論の教科書であるWhat Ifを有志が集まって翻訳した勉強会動画です。臨床研究における因果推論はこれを通して見れば十分と言えるレベルです。
D. 診断・予測
患者の疾患を診断したり、予後を予測するための研究です。診断研究と予測研究はEquatorのガイドライン上も異なるのですが、インフルエンザの迅速診断のように単体検査の研究を用いることは比較的少なく、多くの場合回帰モデルや機械学習モデルなのでモデルを作成し検証するというプロセスは概ね同じなのでまとめています。
取り組みやすい研究でもあり、近年は機械学習/AIを用いたモデル開発も盛んに行われています。関連性の研究ではオッズ比やハザード比を出しておしまいのことが多いですが、診断予測研究では、感度特異度、AUROCなどの指標を提示する必要があります。最も大事なのはモデルの開発ではなく、その妥当性の検証である点には注意が必要です。
下記岡田先生のNoteが分かりやすく非常によくまとまっていると思います。
2. 研究執筆のためのガイドライン
Enhancing the QUAlity and Transparency Of health Research (Equator Network)が各種論文執筆のためのガイドラインを作成しています。これらのガイドラインを遵守しているかどうかは確認されますので、提出するようにしましょう。
多くの場合において、このマニュアルを参考にする諸学者が用いるであろうガイドラインは下記です。「どれが該当しているのかわからない」という方もいると思うので、ざっくりとした割り切りをすると下記です。
STROBE:下記のいずれにも該当しない観察研究(記述研究、関連性の研究、因果推論)
TRIPOD:予測の研究
STARD:診断の研究
CARE:症例報告
また最近では下記のようなチェックリストも使われています。
・サーベイ研究(アンケートなど)を行うためのCROSS
・データベース研究を行うためのRECORD
困ったらとりあえずSTROBE…というのは言い過ぎかもしれませんが無難かも。