〜盲検化と割付隠蔽の落とし穴〜
はじめに
「鍼は効く。でもエビデンスレベルは低い。」
この矛盾、よく耳にしませんか?
実際、2023年に発表されたメタ解析(Feng et al., Frontiers in Neurology)では、
神経障害性疼痛(neuropathic pain)に対して鍼治療が有意に痛みを軽減していました。
効果量は中等度(SMD −0.59, p=0.001)──つまり、体感的には「痛みが1〜2段階減る」レベルです。
それでもエビデンスレベルは“Very Low”(とても低い)。
一体なぜか?
研究の質を決める二つの要素
① 割付隠蔽(allocation concealment)
② 盲検化(blinding)
論文の質を決めるのは、結果の派手さではなく「設計の堅さ」です。
この2つが甘いと、どんなに効果が出ても“信用度がガタ落ち”になります。
割付隠蔽とは?
ざっくり言えば、
「誰がどの治療を受けるかを、割り当てが終わるまで誰にもわからないようにする仕組み」
もしこれを怠ると、
研究者が意図せず「効きそうな人を鍼群に入れる」などバイアス(偏り)が生まれます。
実際、このメタ解析で調べた16本のRCTのうち、
封筒法などで適切に隠蔽していたのはたった3件(約19%)。
残りは曖昧または完全オープン。
つまり、割り当てが事前にバレていた可能性が高いのです。
盲検化とは?
被験者・施術者・評価者の誰が“どの群”かわからないようにすること。
鍼研究ではこれが最も難関です。
| 種類 | 説明 | 鍼研究での実情 |
|---|---|---|
| 被験者盲検 | 患者がどの群かわからない | シャム鍼を使えば可能だが、体感でバレやすい |
| 施術者盲検 | 鍼を打つ人がどの群かわからない | 100%不可能(自分で刺すから) |
| 評価者盲検 | 結果を測る人がどの群かわからない | 半分以下しか実施されていない |
結果、ほとんどの研究で「評価者が群を知っていた」「患者が刺激の違いで察していた」──
つまり、プラセボ効果と期待バイアスの温床になっている。
💥 なぜ致命的なのか
被験者が「自分は本物の鍼を受けている」と思えば、
脳が“鎮痛スイッチ”を入れてしまう。
評価者が「鍼群だ」と知っていれば、無意識にスコアを甘くつける。
これが積み重なると、
実際の効果以上に良く見えてしまう。
そのため、メタ解析ではどんなに統計的に有意でも、
「信頼性(信じていいか)」の評価はVery Lowに下げられます。
具体的な例
- Iravani et al., 2020(化学療法性末梢神経障害)
→ 評価者は盲検化済みだが、電気刺激の感覚で患者にバレやすい。 - Yang et al., 2009(手根管症候群)
→ 盲検化の記述なし、評価者も非盲検。VASスコア中心で主観バイアス強め。 - Habibabadi et al., 2021(耳鍼による片頭痛)
→ 単盲検(評価者のみ)。被験者・施術者はどちらも群を把握。
結果としての評価
| 項目 | 評価 | 問題点 |
|---|---|---|
| ランダム化 | 一応実施(多くは抽選) | OK |
| 割付隠蔽 | 不十分(3件のみ適正) | ✗ |
| 被験者盲検 | 半数以下 | △ |
| 施術者盲検 | 不可 | ✗ |
| 評価者盲検 | 一部のみ | △ |
→ 総合的に 「高リスク(High risk of bias)」 と判断。
これが GRADE “Very Low” の主因です。
結論:エビデンスは低くても、臨床的価値は高い
薬のRCTが100年以上の歴史を積み上げてきたのに対し、
鍼灸のRCT文化はここ20〜30年の話。
ようやく「エビデンスの言語」で語り出した段階だ。
だから、現時点では「そんなんばっかり」と言われても仕方ない。
でも裏を返せば、
それでも結果が出続けるということは、臨床的な本質があるという証拠。
「科学的な厳密さではまだ発展途上。だが、臨床的な“実用性”はすでに十分に証明されている。」
今後への提言
- シャム鍼の質を高め、体感差を減らす
- 評価者を第三者に固定する
- 割付は電子化・自動化で完全ブラインド化
- 症状スコアだけでなく、神経伝導やfMRIなど客観指標を導入
──これらを満たすRCTが増えれば、
鍼灸の「結果の強さ」と「エビデンスの強さ」が、ようやく一致してくる。
まとめ
- 鍼は神経障害性疼痛に対して中等度の鎮痛効果を示す。
- だが研究デザインの甘さ(盲検化・割付隠蔽の不十分さ)が信頼度を下げている。
- 現場では“効くけど信じられていない”という状態。
- 今後は「質の高いRCT」で、このギャップを埋めることが鍵になる。


コメント