【鍼灸研究の裏側】なぜ「効果が強いのにエビデンスが低い」のか

鍼灸の効果

〜盲検化と割付隠蔽の落とし穴〜


はじめに

「鍼は効く。でもエビデンスレベルは低い。」

この矛盾、よく耳にしませんか?
実際、2023年に発表されたメタ解析(Feng et al., Frontiers in Neurology)では、
神経障害性疼痛(neuropathic pain)に対して鍼治療が有意に痛みを軽減していました。
効果量は中等度(SMD −0.59, p=0.001)──つまり、体感的には「痛みが1〜2段階減る」レベルです。

それでもエビデンスレベルは“Very Low”(とても低い)。
一体なぜか?


研究の質を決める二つの要素

① 割付隠蔽(allocation concealment)

② 盲検化(blinding)

論文の質を決めるのは、結果の派手さではなく「設計の堅さ」です。
この2つが甘いと、どんなに効果が出ても“信用度がガタ落ち”になります。


割付隠蔽とは?

ざっくり言えば、

「誰がどの治療を受けるかを、割り当てが終わるまで誰にもわからないようにする仕組み」

もしこれを怠ると、
研究者が意図せず「効きそうな人を鍼群に入れる」などバイアス(偏り)が生まれます。

実際、このメタ解析で調べた16本のRCTのうち、
封筒法などで適切に隠蔽していたのはたった3件(約19%)
残りは曖昧または完全オープン。
つまり、割り当てが事前にバレていた可能性が高いのです。


盲検化とは?

被験者・施術者・評価者の誰が“どの群”かわからないようにすること。
鍼研究ではこれが最も難関です。

種類説明鍼研究での実情
被験者盲検患者がどの群かわからないシャム鍼を使えば可能だが、体感でバレやすい
施術者盲検鍼を打つ人がどの群かわからない100%不可能(自分で刺すから)
評価者盲検結果を測る人がどの群かわからない半分以下しか実施されていない

結果、ほとんどの研究で「評価者が群を知っていた」「患者が刺激の違いで察していた」──
つまり、プラセボ効果と期待バイアスの温床になっている。


💥 なぜ致命的なのか

被験者が「自分は本物の鍼を受けている」と思えば、
脳が“鎮痛スイッチ”を入れてしまう。
評価者が「鍼群だ」と知っていれば、無意識にスコアを甘くつける。

これが積み重なると、
実際の効果以上に良く見えてしまう
そのため、メタ解析ではどんなに統計的に有意でも、
「信頼性(信じていいか)」の評価はVery Lowに下げられます。


具体的な例

  • Iravani et al., 2020(化学療法性末梢神経障害)
    → 評価者は盲検化済みだが、電気刺激の感覚で患者にバレやすい。
  • Yang et al., 2009(手根管症候群)
    → 盲検化の記述なし、評価者も非盲検。VASスコア中心で主観バイアス強め。
  • Habibabadi et al., 2021(耳鍼による片頭痛)
    → 単盲検(評価者のみ)。被験者・施術者はどちらも群を把握。

結果としての評価

項目評価問題点
ランダム化一応実施(多くは抽選)OK
割付隠蔽不十分(3件のみ適正)
被験者盲検半数以下
施術者盲検不可
評価者盲検一部のみ

→ 総合的に 「高リスク(High risk of bias)」 と判断。
これが GRADE “Very Low” の主因です。


結論:エビデンスは低くても、臨床的価値は高い

薬のRCTが100年以上の歴史を積み上げてきたのに対し、
鍼灸のRCT文化はここ20〜30年の話。
ようやく「エビデンスの言語」で語り出した段階だ。

だから、現時点では「そんなんばっかり」と言われても仕方ない。
でも裏を返せば、

それでも結果が出続けるということは、臨床的な本質があるという証拠。

「科学的な厳密さではまだ発展途上。だが、臨床的な“実用性”はすでに十分に証明されている。」


今後への提言

  • シャム鍼の質を高め、体感差を減らす
  • 評価者を第三者に固定する
  • 割付は電子化・自動化で完全ブラインド化
  • 症状スコアだけでなく、神経伝導やfMRIなど客観指標を導入

──これらを満たすRCTが増えれば、
鍼灸の「結果の強さ」と「エビデンスの強さ」が、ようやく一致してくる。


まとめ

  • 鍼は神経障害性疼痛に対して中等度の鎮痛効果を示す。
  • だが研究デザインの甘さ(盲検化・割付隠蔽の不十分さ)が信頼度を下げている。
  • 現場では“効くけど信じられていない”という状態。
  • 今後は「質の高いRCT」で、このギャップを埋めることが鍵になる。

コメント

タイトルとURLをコピーしました