ジェンダー医療研究会:JEGMA

ジェンダー医療研究会は、 ジェンダー肯定医療に関して、エビデンスに基づいた情報を発信します。

質の高い臨床実践ガイドラインの基準とは何でしょうか?

☝️多くの人は、コンセンサス(合意)とはガイドライン(指針)のようなものだと考えています。コンセンサスとは、文献を体系的に審査することもなく、テーブルを囲んで何をすべきかについて話し合う人々の談話にすぎません。

こんにちは。イヴァン・フローレスと申します。私は研修を受けた小児科医です。
私は10年以上ガイドラインの研究に携わっており、現在は、ここにあるようにコロンビアの大学で正教授を務めていますが、私が博士号を取得したマクマスター大学でも非常勤教授を務めています。また、皆さんが退屈しないように読むつもりはないのですが、追加のポジションが少々あり、そしてガイドラインに特化した新しいジャーナルの編集長も務めています。

今日は「信頼できるガイドラインとは何か?」ということについてお話しします。これは、ガイドラインを作成する上で非常に重要なことです。方法論者としての私たち、そしてガイドラインのテーマに関係なく、ガイドラインを使おうとしている人々のために。

私の利益相反は、むしろ先ほど述べたこと、つまり私の立場に関係しています。私が今指導しているジャーナルの関係で、ガイドライン・インターナショナル・ネットワークにも雇用されています。私が持っているプロジェクトの資金はすべて、カナダ保健研究所かコロンビア科学省が関係しています。誤解しないでください。
ここから始めましょう。

CPG ( Clinical Practice Guidelines )、つまり臨床実践ガイドラインやエビデンスに基づくガイドラインと呼ばれるものがすべて本当のガイドラインであるとは限りません。それについて少しお話します。
これはInstitute of Medicine(現在の米国医学アカデミー)によれば、信頼できる、本物の臨床実践ガイドラインの定義ということです。

ガイドラインとは「患者ケアを最適化するための勧告を含む声明」なんです。ガイドラインは「エビデンスの体系的レビューと、代替医療の選択肢の有益性と有害性の評価によって決定される」。つまり、そこで強調されているように、ガイドラインはシステマティック・レビュー(体系的な審査)に基づく必要があり、また「どのような有益性と有害性があるか?」といった、バランスをとる必要があります。
これは、ガイドラインとは何かについて、世界的に最も受け入れられている定義です。この目的のために、IoM(現在の米国医学アカデミー)は、臨床実践ガイドラインとみなされるよう、ガイドラインが持つべき基準を設定しました。
そこには8つの基準があります。他にも触れておきたい基準があるので、すべてを読むつもりはありませんが。

重要なことは、

1.ガイドラインの透明性
2.利益相反の管理
3.学際的なガイドライン・グループの構成
4.システマティック・レビュー(体系的審査)に基づくガイドラインであること

今述べたように、
5.推奨の強さを評価するためのエビデンス基盤を確立すること

また、
6.勧告が、それが実施されようとしている背景の中で、どのようにプロセスと結びついているのか。

7.外部からの審査を受け、
8.更新されるべきでもあります。

これはIoMに書かれていることで、現在も最新ですが、IoMの基準の1年後に発表されたガイドライン国際ネットワーク基準もあります。
そして、すべてを読み上げはしませんが、ガイドライン、意思決定プロセス、COIメソッド、エビデンス、ガイドラインの推奨事項、エビデンスと推奨事項の評価方法、外部レビュー、財政的支援の透明性、利益相反、および最新情報という構成があります。ですから、お分かりのように、この規格は多かれ少なかれ同じ点をカバーしています。そのどちらかを満たすことが重要なのです。

しかし、明日ご一緒するRomina Brignardelloや、2年前にGordon GuyattとAlonso CarascoがJAMA(The Journal of the American Medical Association)に発表したようなツールもあります。これは私たちユーザー、主に臨床医が関心を持ち、信頼できるガイドラインを確認する際に注意を向けるべき質問です。

そしてそこには5つの質問があり、サブ質問があります。読み上げませんが、多かれ少なかれ同じような内容です。

1:勧告は明確で実行可能であるべき
2:エビデンスの要約が必要である
3:ガイドラインは重要な転帰をすべて考慮すべき
4:判断が考慮されるべき
5:価値観や好み…、そして
6:特定の患者に適用される勧告

つまり、これは、私たちが人々に文献を批判的に評価することを教えるときに行う、通常のプロセスに従ったものなのです。

この基準はガイドラインだけでなく、他の種類の研究にも適用できます。このように、ガイドラインが質の高いものであるかどうかを判断するには、いくつかの方法があります。
では、要約すると、質の高い臨床実践ガイドラインの基準とは何でしょうか?
この基準に書かれていることを要約してみましょう。

第1番:透明性のある資金調達と支援
ガイドラインに対してその資金がどこから来ているのか、明確であるべきです。また、それだけでなく、ガイドラインに資金を提供している組織も、最終的な勧告に影響を及ぼすべきではありません。ですから、開発者は資金提供者から独立していなければなりません。

第2番:グループの多領域的なバランスと代表的な構成
つまり、すべての潜在的な利害関係者と参加者、…もちろん専門家と患者、そして子どもの場合は親や介護者が、勧告を行う人々の席に招かれるべきだということです。バランスが取れていて、良き代議制度である必要があります。もちろん、常に論題によります。論題によって、いるべき最適な人物を選ぶ必要があります。

第3番:患者の価値観や好みを考慮する
ガイドライン・グループは、患者さんに何を好むかをただ尋ねるだけでなく、患者さんの好みに関する文献を探す必要があります。1人や2人の患者さんに意見を聞くだけでなく、体系的な審査を行う必要があるんです。我々は、ガイドラインの開発者に、関心を抱いている特定の疾患に対する価値観や好みを扱った研究のシステマティック・レビューを行うよう提案しています。

第4番:利益相反の開示と対応
利益相反の開示と対応とは、ご覧の通り、単に開示するだけではありません。多くのガイドラインでは、ガイドラインの一番下の参考文献の前にあるように、ただ開示するだけです。我々は、A、B、C が何らかの製薬会社から資金提供を受けていること、そしてもう1人も別の製薬会社から資金提供を受けていることを公表しています。そしてただそれだけで、皆、そのことについて何もしません。我々は、ガイドライン・グループが、それに対して何をしたかを述べる必要があります。というのも、金銭的な利害関係があり、そして今回のジェンダー違和(性別違和)案件の場合は重要な知的利益相反に対処する必要があるのです。

私が言う「対処」とは、このような利益相反があるために、グループのメンバーとしてふさわしくない人もいるということ、つまり、利益相反が非常に強く、非常に深い場合は、そのグループや特定の推奨事項から外す必要がある人もいるということです。

場合によっては、グループの一員である人々が、特定の質問、特定の治療法、または特定の介入に関してのみ対立している場合、その特定の質問では外される可能性があり、なおかつ、グループ全体の一員であり続ける可能性があります。それはガイドラインに記載する必要があり、我々はガイドラインが、具体的な衝突に対して何をしたのか、すべての情報を提供するよう要求しています。

第5番:事前に設定された範囲と関心事項の開発
つまり、各グループはガイドライン作成プロセスにおいて、どのような問題を扱うかについて合意する必要があります。私たちが言っただけで勧告が出たわけではありません。我々は、システマティック・レビューに入る前に、あらかじめ疑問点を明確にしておくべきなのです。

国際的な取り組みとして、ガイドライン作成者がガイドラインを登録し、ガイドラインが発表される前にすべての情報を入手できるようにしようというものがあります。これは、臨床試験が行われる前に登録が行われるのとよく似ています。これは国際的な取り組みで、私たちは皆さんにそれを奨励しようとしています。ですから、これは私たちが調整し、変化させているもので、今はまだ十分な数のガイドラインが登録されていませんが、将来的には充実させていく予定です。

第6番:体系的かつ透明性のある…
1つは、エビデンスの検索、つまりすべてのプロセス、システマティックレビューのプロセス…、どこで検索するか、どのデータベースを検索するか、どのように選択するか、適格性基準はどのように検討されたのか、そして、エビデンスの質、あるいは確実性の評価方法についてです。私たちは、人々がエビデンスの質を評価するために、広く受け入れられている様々なプロセスを使用するよう期待しています。

私たちは、GRADE ( Grading of Recommendations, Assessment, Development, and Evaluations )システムという、最も受け入れられているシステムを使用することを奨励しています。残念ながら、すべてのガイドラインがGRADEを採用しているわけではありません。ですが、GRADEを使えば、この基準を確実に満たすことができるのです。

最後の箇条書きにある、エビデンスから推奨に至るプロセスは、非常に重要な過程です。というのも、私たちはエビデンスだけに基づいて勧告を出すつもりはないからです。私たちは更なる要素を考慮する必要があります。というのも、つい最近も議論したようにエビデンスは重要な要素のひとつですが、しかしコスト、価値観、好み、実現可能性、適用可能性なども考慮する必要があります。

そして最後に、

第7番:CPG (Clinical Practice Guidelines:診療ガイドライン)は次のようなものであるべき

  • 非常に明確な提言:実行可能で、皆が勧告を読み、何をすべきかを知れること。
  • 実行可能性を高めるツール:つまり、勧告を実践するのに役立つ具体的なツール、例えば、業務や思考の進行表のような、勧告を実践するのに役立つ特定のツールがあることです。
  • コストへの配慮:多くのガイドラインはコストをまったく考慮していません。特定の医療制度にどのような影響があるのかも考慮することが重要です。
  • 公平性の問題:勧告を行う場合、健康における不平等を拡大する勧告になるのか、それとも不平等を縮小する勧告になるのか、というのも、勧告の中には、特定の人しかアクセスできないものもあるからで、例えば、より多くの資金を持ち、より手頃な価格で医療を受けられる人たちもいれば、低所得の人たちが医療を受けられなくなることもあり、不公平が生じてしまいます。

我々は、ガイドラインが出版される前に外部の専門家による審査を受けていること、つまり外部レビューであること、そして最後に明確な更新プロセスが存在することを考慮する必要があります。つまり、そのグループは、ガイドラインを、いつ、どのように更新する必要があると考えるかを明確に示す必要があるのです。

基準が多すぎでは?
基準が多すぎなんです。

そう、振り返って見て、皆さんが以前読んだガイドラインの中で、これらの基準をすべて満たすものはいくつありましたか?
分からないですよね。

つまり、これらの基準をすべて満たすガイドラインは、結局は高価で時間がかかり、かなりの専門知識とトレーニングが必要なのです。ですから、ほとんどのガイドラインは質が低いんです。というのも、特別なことではないのですが、どこの国でも多くの専門知識が必要で、その方法を知っているすべての人がそのガイドライン作成に参加できるわけではないからです。 

多くの人は、コンセンサス(合意)とはガイドライン(指針)のようなものだと考えています。コンセンサスとは、文献を体系的に審査することもなく、テーブルを囲んで何をすべきかについて話し合う人々の談話にすぎません。ですから、質の高いガイドラインを作成することが難しいのです。そのため、ガイドラインを作成する開発者は、多くの場合このような専門知識を持っておらず、これを作成する能力も資金も持っていないのです。

多くのグループは、自分たちにはこのような能力がないことを知っています。彼らは体系的な審査を行うよう外部グループに委託していますが、それでいいでしょう、彼らが善きプロセスを全てきちんと踏んでいる限りは。

では、利用者はどうでしょうか?
皆さんのような方々や、ただガイドラインを読んでいる他の多くの人たちはどうでしょうか?通常、ほとんどの人々は、ガイドラインの質が高いか低いかを区別する専門知識を持っていません。

一般的に、ユーザーは作成者の評判をアテにしています。

そのガイドラインを作成した団体はどこ?
…ああ、それなら信頼できるね!…と。

そこが問題なのです。というのも、非常に多くの学会がガイドラインについて良い仕事をしていないからです。そのため、あまり良くないガイドラインが、利用者に勧められる可能性があるんです。

・効果のない治療。
・費用対効果がなく、医療費の増加につながる治療
・実施不可能で 医療格差や不平等を生む治療…そして、
・患者が受け入れられないような治療、あるいはアドヒアランス(患者の積極参加)の欠如や治療の放棄につながりかねないような治療。

ただ勧めるだけでこうなってしまうような質の低いガイドラインは大抵、こういったことを考慮していない可能性があるのです。だからこそ、私たちは細心の注意が必要なのです。それがAGREEの存在理由です。

AGREEは、ガイドライン作成を支援するツールやリソースを作成することを目的とした、国際的な研究者の共同計画です。その目的は、ガイドラインの質を最適化し、バイアスを最小化し、有用性を確保することです。

AGREE Ⅱは2003年に初版が発行され、2010年に更新されました。そしてAGREEの第3版も計画していますが、まだプロセス設計の途中です。しかしそのアイデアは、これらのツールがガイドラインの品質を評価し、開発とレポートの青写真として機能するのに役立つというものです。

すべてのAGREEツールは、このような複雑なプロセスを経て、新しい有効なツールを作成しています。項目の生成から、項目の削減、スケーリング、クラスタリング、信頼性と妥当性のプロセスまで、段階を踏んで行われます。そして、このプロセスはすべて有用性に関わるものです。私たちは、ユーザーにツールを「使いやすい」と思ってもらう必要があるのです。

AGREEのツールはすべてこの道をたどってきたので、ツールを検証するために、ツール検証の最良の標準に従って開発されています。そのため、AGREE II は臨床診療ガイドラインの品質を評価するための唯一の検証されたツールであり、世界中で最も使用されています。

AGREE II 測定…もちろん、すべての手順を説明するには時間が足りません。
しかし、AGREE II には6つの領域と23の項目があります。

最初の領域は「範囲と目的」です。要約すれば、ガイドラインは目的を明確にし、検討する問題と対象集団を明確にすべきであるということです。

前にも述べたように、利害関係者の参加とは、関連する専門家、専門職グループ、個人の、全てからなる学際的なチームを持つことです。患者の意見や好みが考慮され、ガイドラインの対象ユーザーが明確に定義されます。

開発の厳密性は第3の領域で、世界的に最も重要な領域と考えられています。なぜなら、優れた体系的審査のすべてのステップをカバーする8つの項目があるからです。それは、体系的な検索、文献を含める基準、一連のエビデンスの強度と限界、推奨事項を策定する方法と副作用の考慮に関するものです。そして、推奨と裏付けとなるエビデンス、さらには前述した外部審査と更新プロセスの間には明確な関連性があります。

提示の明確さとは、勧告がどれだけ明確であるかということであり、勧告が具体的で、曖昧さがなく、状態を管理するためのさまざまな選択肢が提示され、主要な勧告が容易に確認できることを意味します。

適用可能性とは、その実施についてです。勧告はどの程度適用できるのでしょうか。ガイドラインは促進要因と障壁を考慮すべきです。

このガイドラインは、前にも述べたように、フローチャートのようなツールを提供し、助言しています。潜在的な資源への影響、つまりコストを考慮することもガイドラインのプロセスの一部なのです。そして、ガイドラインはモニタリングと監査基準を提示します。つまりアドヒアランス(患者の治療に対する積極参加)をモニターするための指標を作成します。

そして非常に重要なことは、編集の独立性、 つまり、まず資金源はどこか?
これはガイドラインにも明記されています。

また、先ほど申し上げたような競合する利害関係についても宣言され、対処されています。これが23の項目とそれぞれの領域で、申し訳ありませんが、AGREEには他にもツールがあります。

これは、AGREEについて少し知っていただくためのものですが、ガイドラインの他の側面をカバーするツールは他にもあります。例えば、AGREE Surgeryは、手術に関するガイドラインのみを評価するAGREEです。AGREE II にはマニュアルがあり、今述べたすべての項目が順を追って説明されています。各項目の定義と例が、20カ国語に翻訳されていますので、先ほど申し上げたように世界的に使用されています。

皆さんがより多くの情報を得ることができるウェブサイトがありますので、どうぞ「agreetrust.org」をご覧ください。翻訳やツール、すべてのリソースを自由にダウンロードすることができます。

また、AGREE PLUSというサイトがあり、オンラインで品質評価を行い、公式レポートを入手できます。そして、6つの領域があるので、領域ごとに0点から100点までのスコアを得ることができます。それぞれの領域で0~100%を獲得できるんです。

ガイドラインが高品質であるという特定の魔法の基準値があるわけではなく、これはツールに対する批判、より一般的な批判の道具の1つです。

最もよく使われる基準値は60%と70%です。もし6つの領域のうち、特定の領域で60%以上、もしくは70%以上の結果が得られたら、そのガイドラインはその特定の分野を本当によくカバーしているということになります。

最も重要な領域は、先ほど述べたように、開発の厳密性です。これは、審査やエビデンスの過程が、どれだけ体系的であったかということです。

これは4つのガイドライン(CPG)の例です。
これは非常に教訓的な例で、4つのガイドラインがあり、先ほど述べた6つの領域のそれぞれでスコアが異なっています。

ご覧のように、ここには様々な数字がありますが、もし60%を高品質と定義するための基準値とするならば、例えばCPG1の「開発の厳密性」が65%であることがお分かりいただけると思います。

もし基準に60%を選んだとしたら、前述のCPG(ガイドライン)は質が高く、4番目のCPGは60%以下なので質が非常に低いということになります。

60%を使わない組織や研究者もいます。彼らは70%をクオリティの基準値としており、そして、「開発の厳密性」を最も重要な領域として選んだ場合、この基準値の元では、1番目のガイドラインはもはや質の高いガイドラインではなくなることがお分かりいただけるでしょう。

ただ、ガイドライン2番と3番が「開発の厳密性」で60%以上(訳者注:70%以上の言い間違いと思われる)を獲得しており、それらは質の高いガイドラインだと言えるでしょう。

しかし、ご覧のように、「編集の独立性」ですと、CPG2では非常に良いスコアですが、CPG3はあまり良くありません。つまり、このガイドラインは利益相反の管理がうまくいっておらず、資金提供のプロセスも透明性に欠けるということになります。

この場合、4つのCPGがほぼ同じであれば、臨床実践ガイドライン(CPG)2を使って判断した方が確実かもしれません。

これが私たちの仕事です。AGREEのトレーニングを受けている人なら、ガイドラインを評価することができるでしょう。少なくとも2人の評価者が点数をつけることが必要で、このようなAGREEの点数が、どのガイドラインを最も信頼すべきかという最終的な判断の役に立ちます。

というわけで、今回の会議では以上のようなことをお話ししました。ご質問がありましたら、後ほどお答えします。失礼しました。

www.youtube.com