AML/MDS PR

なぜ有望な抗がん剤開発は失敗するのか? 高リスク骨髄異形成症候群(HR-MDS)の臨床試験から学ぶ5つの教訓

記事内に商品プロモーションを含む場合があります

Stahl, Maximilian F, and Amer M Zeidan. “The conundrum of drug development in higher-risk MDS: Lessons learned from recently failed phase 3 clinical trials.” Blood, blood.2025029727. 1 Nov. 2025, doi:10.1182/blood.2025029727

はじめに:血液がん治療における進歩のパラドックス

近年、急性骨髄性白血病(AML)の領域では、2017年以降に12もの新薬が承認されるなど、治療法の開発が急速に進んでいます。しかしその一方で、高リスク骨髄異形成症候群(HR-MDS)の治療は、過去15年間ほとんど進展が見られません。HR-MDSの標準治療である低メチル化剤(HMA)が承認されたのは2004年から2006年のことであり、それ以降、治療成績を大きく向上させる新薬は登場していません。

この新しい治療法の停滞は、単に治療が難しいからだけではありません。HMA単剤療法は、AZA-001という臨床試験では生存期間中央値(OS)24.5ヶ月を示したものの、実臨床のデータでは11〜19ヶ月という厳しい現実が報告されています。この大きな乖離は、より優れた治療法が喫緊の課題であることを浮き彫りにしています。

一方で数々の有望な薬剤が、第3相臨床試験で次々と失敗に終わってきました。この記事では、最近相次いだ第3相試験の失敗事例を分析し、そこから得られる5つの重要な教訓を開設します。これらの教訓は、単なる失敗の記録ではなく、未来の成功に向けたカギとなるはずです。

  • 生物学的特性に基づく患者選択: 患者選択は、疾患リスクだけでなく「疾患の生物学的特性」に基づいて行う必要がある。
  • 特異的サブグループの分離: 予後が極めて不良なTP53不活化異常を有するMDSは、別の臨床試験で評価するか、試験に含める場合はTP53変異の有無で患者を層別化すべきである。
  • 初期の毒性シグナルの重視: 初期段階の試験で見られた毒性の兆候は、その後の大規模試験で深刻な問題になり得るため、決して軽視してはならない。
  • 現代的な評価基準の採用: 古い評価基準は治療効果を誤って評価する可能性があり、より臨床的に意味のある新しい基準の採用が不可欠である。
  • 徹底した透明性の確保: 失敗した試験から学ぶために、患者レベルのデータへの迅速なアクセスと透明性の確保が業界全体の課題である。

教訓1:重要なのはリスクスコアではなく、疾患の生物学

臨床試験の成否を分ける最も重要な要素の一つが、適切な患者選択です。従来、HR-MDSの試験では、IPSS-Rのような予後予測スコアリングシステムを用いて患者を層別化するアプローチが一般的でした。しかし、この方法ではもはや不十分であることが明らかになっています。

今後の臨床試験は、単なるリスクスコアや恣意的な芽球比率のカットオフ値ではなく、共通の疾患生物学に基づいてデザインされるべきです。HR-MDSは単一の疾患ではなく、臨床的にも分子的にも非常に多様な疾患群の集合体です。この点を浮き彫りにするのが、最新の分子遺伝学的予後予測スコア(IPSS-M)です。IPSS-Mが開発された際、従来のIPSS-Rで分類された患者の46%が再分類されたという事実は、古いシステムがいかに不完全であったかを物語っています。

HR-MDSとAMLの境界線が曖昧であることも、この問題の核心にあります。例えば、CPX-351という薬剤の臨床試験では、同じような芽球比率の患者群に対し、AMLの評価基準を適用した場合の完全寛解(CR)率が52%であったのに対し、MDSの基準を適用すると23%にまで低下しました。これは、用いる基準によって薬剤の評価が大きく変わってしまうことを示しており、恣意的な分類ではなく、疾患の生物学に基づいたアプローチがいかに重要であるかを物語っています。

教訓2:「リンゴとオレンジ」を混ぜるな—特異な患者群を一緒にすることの危険性

一つの臨床試験の中で多様な背景を持つ患者を管理することは、戦略的に非常に困難です。特定のサブグループが、試験結果全体に不釣り合いなほど大きな影響を与えてしまうことがあるからです。

その典型例が、TP53遺伝子に変異を持つMDSです。これは、もはやHR-MDSの一種ではなく、独立した疾患単位と見なすべき存在であり、予後は極めて不良です(生存期間中央値は9〜12ヶ月)。新規MDS患者全体におけるTP53変異の頻度は5〜10%に過ぎませんが、近年の主要な第3相試験では、この変異を持つ患者が24〜27%も含まれていました。この患者群の登録が過剰な場合、試験結果の解釈が著しく歪められます。というのも、この患者群では寛解率の向上が生存期間の延長に結びつかないことが多いためです。

同様に、慢性骨髄単球性白血病(CMML)もMDSとは異なる疾患であり、HR-MDS試験に含めることは結果に悪影響を及ぼす可能性があります。FailしたPANTHER試験(azacitidine+/-pevonedistatの検証試験)のサブグループ解析では、CMMLとAMLに近い患者を除外してHR-MDS患者のみを対象とした場合、ペボネジスタット併用群のOSは21.6ヶ月、アザシチジン単独群は17.5ヶ月(ハザード比0.785, p=0.092)となり、より統計的有意差に近づきました。このデータは、CMMLの存在が治療効果を希釈し、有望なシグナルを覆い隠した可能性を示唆しています。

教訓3:警告サインを見逃すな—初期の毒性シグナルが重要な理由

薬剤開発において、安全性評価は有効性評価と同等に重要です。特に、初期の臨床試験で観察された毒性のシグナルは、より多様な患者が参加する大規模な第3相試験では増幅される可能性があります。

CD47を標的とする抗体薬マグロリマブの開発は、この教訓を象徴する事例です。第1b相試験では、高頻度の貧血が報告されましたが、経験豊富な専門医療機関で管理されていたため、管理可能な有害事象と見なされていました。しかし、より広範な医療機関が参加した第3相ENHANCE試験では、マグロリマブ群の方が対照群よりも重篤な有害事象(43% vs. 20%)、有害事象による投薬中止(24% vs. 12%)、有害事象による死亡(15% vs. 10%)の割合が著しく高い結果となりました。

この結果は、初期試験の報告書で「忍容性のある」「管理可能」といった曖昧な表現を使うことの危険性を示唆しています。初期試験の報告書では、「忍容性のある」といった定型的な要約ではなく、有害事象の質、重症度、持続期間、そして臨床的影響に関する詳細な分析が求められます。それこそが、第3相試験の成功確率を現実的に評価するための、唯一の方法なのです。

教訓4:本当に意味のあることを測定せよ—時代遅れの評価基準がもたらす誤解

治療の成功を測るためには、適切な評価項目(エンドポイント)を用いることが不可欠です。しかし、HR-MDSの臨床試験では長年、「IWG 2006」という古い評価基準が使われており、これには重大な問題がありました。この基準は、薬剤の真のベネフィットを過大評価過小評価の両方向にミスリードさせる可能性があります。

過大評価の主な原因は、「血球数の回復を伴わない骨髄寛解(CR)」を有効な奏効と見なす点にあります。この評価項目は、全奏効率(ORR)の数値を押し上げますが、生存期間の改善とは明確に関連付けられていません。ベネトクラクスの第1b相試験のデータがこの問題点を明確に示しています。「血球回復を伴うCR」を達成した患者のOS中央値は27.2ヶ月でしたが、「血球回復を伴わないCR」を含めたCR全体のOS中央値は21.4ヶ月に過ぎませんでした。実際、マグロリマブ、エプレネタプト、ベネトクラクスはいずれも初期試験で高いORRを示しましたが、第3相試験では失敗に終わっています。

この問題を解決するため、より患者中心の新しい「IWG 2023」基準が提案されました。この新基準では、「血球数回復を伴わないCR」が奏効から除外され、CRには至らないものの臨床的に意義のある改善を示す「less-than-CR(CR+CRh+CRL)」という新たなカテゴリーが導入されました。これにより、治療効果をより正確に評価することが可能になります。

教訓5:失敗から学ぶ—徹底した透明性の緊急な必要性

失敗した臨床試験から学ぶことは、単なる科学的な理想ではなく、同じ過ちを繰り返さないための倫理的かつ経済的な責務です。しかし、残念ながら製薬企業が主導する試験では、結果が否定的だと公表やデータ共有の優先順位が下げられ、大幅な遅延が生じるのが一般的です。

その典型例が、TP53変異MDSを対象としたAPR-246の第3相試験です。この試験のトップライン結果がプレスリリースで発表されてから5年近くが経過していますが、2025年現在に至るまで学会での完全な発表や論文公表は行われていません。

このような状況は、科学コミュニティが失敗の原因を分析し、将来の試験デザインを改善する機会を奪っています。試験結果の迅速かつオープンな公開、そして可能であれば患者レベルのデータ共有を促進する文化を醸成することが急務です。これにより、研究者たちは二次解析を行い、より深い洞察を得ることが可能になります。

結論:失敗の瓦礫の中から成功を築く

HR-MDS領域で相次いだ臨床試験の失敗は、確かに失望をもたらすものでした。しかし、これらの経験は、単なる後退ではなく、未来の成功に向けた貴重な教訓の宝庫です。

今後の成功は、疾患の生物学に基づいた、よりスマートな試験デザイン、TP53変異のような特異的な患者群を慎重に層別化する戦略、初期の安全性シグナルに対する誠実な評価、臨床的に意義のある現代的な評価基準の採用、そして成功と失敗の両方から学ぶための徹底した透明性へのコミットメントが重要なカギとなります。

これらの教訓は、多大な時間とリソース、そして何よりも患者さんたちの貢献の上に成り立っています。私たちは次のことを自問すべきです。「企業、研究者、規制当局は、これらの苦労して得た教訓を確実に実践し、治療法を切実に必要とする患者たちに真に有効な治療を届けるために、どうすればより効果的に協力できるのだろうか?」