妥当性研究 Validation study
定義
薬剤疫学分野での一般的な妥当性研究(Validation study)は、興味のある健康アウトカム(Health outcomes of interest, HOIs)を特定するためのアルゴリズム(医療情報データベース内の情報を用いた定義やその組み合わせ)の性能を,真と判定できる情報源や方法(gold standard/ reference standard)を用いて定量的に評価する研究である。
実診療下の医療情報データベースを用いて薬剤疫学研究を実施する際には、当該のデータベースの情報(例: 病名、処方薬剤、医療行為、検査値や入退院・受診回数等)から設定した曝露やアウトカムなどの定義やアルゴリズムを用いるが、それらは潜在的に誤分類の可能性がある。誤分類による影響を受け、研究結果(例:発生率やオッズ比)が歪められる可能性があるため、妥当性が確認されている定義やアルゴリズムを用いて研究を行うことが望ましい。
妥当性研究では、評価対象のHOIs特定のアルゴリズムの性能を検証する完全な基準(gold standard)として、当該のアウトカムを真と判定できる情報源や方法(例: 疾患登録や検査結果、カルテレビュー、医師への質問票)を設定する。利用可能な最良の方法としてreference standard(不完全なgold standard)が設定されることもある。HOIs特定のアルゴリズムは,当該の医療情報データベースの情報(例: 病名、処方薬剤、医療行為、検査値や入退院・受診回数)に基づく定義やその組み合わせによって作成する。その性能はアルゴリズムを満たす患者数とgold standard(またはreference standard)の定義を満たす患者数から指標を算出して評価する。性能指標には、感度(sensitivity)、特異度(specificity)、陽性的中度(positive predictive value, PPV)、陰性的中度(negative predictive value, NPV)があり、これら全ての指標の算出が望ましい。妥当性指標を安定して推定するためには、十分な症例数を確保することも重要である。
対象データ全ての確認が困難な場合など、簡易的にPPVのみを算出した妥当性研究も多くみられる。アウトカム定義を満たす患者のみをサンプリングするデザインでは、PPVは算出できるが感度・特異度は算出できない。また、PPVは当該集団の有病割合(有病率、prevalence)に影響され、有病割合が低[高]いときは、PPVは低[高]くなる。

実例
日本のがん診療拠点病院かつDPC対象病院の2011年1月から12月までのレセプト(診療報酬明細書)データを対象とし、乳がん傷病名の妥当性を評価した。乳がんの定義は、傷病名に薬剤処方や医療行為、レセプト上の診断回数を組み合わせて14定義作成し、同病院のがん登録データをgold standardとして、各定義の感度、特異度、PPVの3指標とその95%信頼区間を算出することにより妥当性を評価した。
対象病院の対象期間中にレセプトデータがあった患者は50,056人、乳がんのがん登録データがあった患者は633人だった。14定義の3指標を算出した結果、感度は32.4-98.7%、特異度はいずれも99%以上、PPVは65.8-90.7%だった。14定義中で最も高いPPVが得られたのは傷病名と手術の組み合わせによる定義であり、PPVは90.7%(95%信頼区間[95% CI], 88.1–93.2)、この定義の感度は73.6%(95% CI, 70.2–77.1)だった。
参考資料
- Strom BL, Kimmel SE, Hennessy S. Pharmacoepidemiology. Chichester, West Sussex, U.K.: Wiley-Blackwell, 2012.
- Weinstein EJ, Ritchey ME, Lo Re V 3rd. Core concepts in pharmacoepidemiology: Validation of health outcomes of interest within real-world healthcare databases. Pharmacoepidemiol Drug Saf 2023; 32: 1–8.
- 岩上将夫, 青木事成, 赤沢学ら. 「日本における傷病名を中心とするレセプト情報から得られる指標のバリデーションに関するタスクフォース」報告書. 薬剤疫学 2018; 23: 95–146.
- Sato I, Yagata H, Ohashi Y. The accuracy of Japanese claims data in identifying breast cancer cases. Biol Pharm Bull 2015; 38: 53–7.
- Ehrenstein V, Hellfritzsch M, Kahlert J, et al. Validation of algorithms in studies based on routinely collected health data: general principles. Am J Epidemiol 2024; 193: 1612–24