평가배경
성대근내 보툴리늄 독소 주입술은 내전형 경련성 발성장애 환자를 대상으로 증상개선을 위해 근전도 유도하에 성대근내에 보툴리늄 독소를 주입하는 기술이다. 2007년에 클로스트리디움 보툴리늄 독소 주사제에 대한 요양급여의 적용기준 및 방법에 관한 세부사항내에 연축성 발성장애가 포함되었으며, 2009년 3월에 성대근내 보툴리늄 독소 주입술이 비급여 항목으로 등재되었다. 이후 성대근내 보툴리늄 독소 주입술은 내부모니터링을 통해 재평가 대상 주제로 발굴되어 우선순위 심의를 통해 재평가 대상으로 선정되었다. 2023년 제2차 의료기술재평가위원회 (2023.2.10.)에서 성대근내 보툴리늄 독소 주입술의 평가계획서 및 소위원회 구성안을 심의한 후 임상적 안전성 및 효과성을 평가하였다.
평가방법
성대근내 보툴리늄 독소 주입술이 내전형 경련성 발성장애 환자에서 임상적으로 안전하고 효과적인지 평가하기 위해 체계적 문헌고찰을 수행하였다. 모든 평가방법은 평가목적을 고려하여 “성대근내 보툴리늄 독소 주입술 소위원회(이하 ‘소위원회’라 한다)”의 논의를 거쳐 확정하였다. 소위원회 구성은 이비인후과 3인, 재활의학과 2인, 근거기반의학 1인의 전문가 총 6인으로 구성하였다.
평가의 핵심질문은 ‘성대근내 보툴리늄 독소 주입술은 내전형 경련성 발성장애 환자에서 임상적으로 안전하고 효과적인가?’이다. 안전성은 시술 관련 이상반응 또는 부작용, 효과성은 음향학적 평가, 공기역학적 평가, 청지각적 평가, 주관적 평가결과를 주요 지표로 보았다.
체계적 문헌고찰은 위의 핵심질문을 토대로 국외 데이터베이스 3개(Ovid MEDLINE, Ovid EMBASE, Cochrane Central Register of Controlled Trials) 및 국내 데이터베이스 3개(KoreaMed, 의학논문데이터베이스, 한국교육학술정보원)를 이용하여 문헌을 검색하였으며, 문헌 선정기준 및 배제기준 적용을 통한 문헌선택과 비뚤림위험 평가는 모두 2명의 평가자가 독립적으로 수행하였고, 의견 불일치가 있을 경우 제3자와 함께 논의하여 합의하였다. 문헌의 비뚤림위험 평가는 연구유형에 따라 무작위배정 비교임상시험(randomized controlled trial, 이하 ‘RCT’)은 Cochrane의 Risk of Bias (이하 ‘RoB’), 그 외에 비무작위연구(non randomized study, 이하 ‘NRS’)(비무작위 비교임상연구, 코호트 연구)는 Risk of bias Assessment Tool for Nonrandomized studies (RoBANS) 2.0 국문판을 사용하였다. 자료분석은 양적 분석이 가능할 경우 메타분석을 수행하였으며, 불가능할 경우 질적으로 분석하였다. 연속형 변수에 대해 지표 단위가 동일하면 통합 평균 차이(mean difference, 이하 ‘MD’)와 95 % 신뢰구간(confidence interval, 이하 ‘CI’)을, 지표 단위가 다를 경우 통합 표준화된 평균 차이(standardized mean difference, 이하 ‘SMD’)와 95 % CI를 제시하였다.
평가결과
체계적 문헌고찰 결과 선택된 문헌은 총 32편이었다. 연구 유형별로는 RCT 2편, 전후연구 30편으로 RCT는 모두 위약군과 비교하였다.
비뚤림위험 평가결과 RCT (2편)의 경우 무작위배정순서 생성에서 ‘불확실’이 50 %, 불완전한 결과자료에서 ‘불확실’이 100 %, 기타 민간연구비 지원에 대한 비뚤림에서 ‘불확실’이 50 %로 평가하였다. 전후연구(30편)에 대해 비뚤림위험은 대상군 선정에서 ‘높음’이 3.3 %, 불확실이 80.0 %, 교란변수에서 ‘높음’이 3.3 %, ‘불확실’이 83.3 %, 평가자의 눈가림에서 ‘불확실’이 83.3 %, 결과평가에서 ‘불확실’이 13.3 %, 불완전한 결과자료에서 ‘높음’이 13.3 %, ‘불확실’이 56.7 %, 선택적 결과보고에서 ‘높음’이 7 %이었다.
안전성
안전성 결과 기식음 발생은 RCT(1편)에서 29 %(2주 지속), 전후 연구(7편)에서 17.9 %~ 76.9 %(평균 11일 지속), 연하곤란(삼킴장애)은 전후연구(2편)에서 각각 4.7 %, 14.2 %(1편에서 1주 ~ 2주 지속), 흡인은 전후연구(4편)에서 15 %~ 76.9 %(3일 ~ 7일 정도 지속), 호흡곤란은 전후연구(1편)에서 2 %(평균 12일 지속) 발생하였다. 대부분 이상반응은 일시적으로 발생했다가 회복되었고, 영구적으로 후유증이 남은 사례는 보고되지 않았다.
효과성
효과성 결과는 음향학적, 공기역학적, 청지각적 및 주관적 평가지표에 대해 연구유형별로 구분하여 분석하였다.
RCT 2편의 연구결과는 다음과 같다.
음향학적 및 공기역학적 평가결과는 1편에서 중재군과 위약군간 비교시 유의한 차이가 없었다. 청지각적 평가결과는 1편에서 중재군과 위약군간 쥐어짜는 음성(strain) 항목(0-3 척도로 평가, 숫자가 클수록 증상 심함)의 변화량을 비교시 중재군에서는 보툴리늄 독소 주입 전, 8주 후 유의하게 감소하였으며, 위약군은 전후 감소하였으나 감소차이에 대한 통계적 유의성을 보고하지 않았다. 12주 변화량을 비교했을 때 중재군은 평균 0.36, 위약군은 0.27로 중재군이 더 많이 감소하였으며, 변화량에 대한 군간 차이에 대한 통계적 유의성은 보고하지 않았다.
주관적 평가결과는 2편에서 보고하였다. 이 중 1편은 중재군과 위약군간 음성장애지수(voice handicap index, 이하 ‘VHI’)와 음성장애(dysphonia) 중증도를 비교하였으며 두개 지표 모두 중재군이 위약군에 비해 더 많은 개선을 보였다. 이 중 VHI는 중재군이 보툴리늄 독소 주사 전후 유의한 개선을 보였으며, 그룹 간 변화량에 대한 통계적 유의성은 보고하지 않았다. 1편은 주관적 평균 개선 정도를 중재군과 위약군간 비교하였을 때 중재군이 더 유의하게 개선하였다.
전후연구 30편의 연구결과는 다음과 같다.
음향학적 평가항목에 대한 메타분석 결과, 기본주파수(7편)는 통합 MD 4.05 Hz(95 % CI -7.37, 15.47, I2 = 66 %)로 시술 전후 유의한 차이는 없었다. 기본주파수 표준편차(5편)는 통합 MD -5.71 Hz(95 % CI -9.43, -1.98, I2 = 60 %)로 시술 전후 유의하게 감소하였으며, 이질성은 높았다. 주파수 변동률은 단위(%, ms)에 따라 구분해서 메타분석하였을 때 시술 전후 유의한 차이가 있거나 유의한 차이가 없는 결과가 혼재해 있었다. 진폭 변동률(8편)은 통합 MD -2.18 %(95 % CI -4.93, 0.58, I2 = 53 %)로 시술 전후 감소하는 경향은 보이나 유의한 차이는 없었다. 잡음 대 신호비(7편)는 통합 MD 3.14(95 % CI 1.36, 4.93, I2 = 84 %)로 시술 전후 유의하게 증가하였으나 이질성이 높았다.
공기역학적 평가항목에 대한 메타분석 결과, 평균 호기율(6편)은 통합 MD 79.50 mL/s(95% CI 33.35, 125.66, I2 = 74 %)로 시술 전후 유의하게 길어졌으나 이질성은 높았다. 최장발성 지속시간(7편) 및 음성 효율성(2편)은 시술 전후 유의한 차이가 없었다.
청지각적 평가항목에 대한 메타분석 결과, 조조성(roughness)(4편), 음성의 중증도(5편), 쥐어짜는 음성(strain)(3편) 모두 시술 전후 유의한 차이가 없었다.
주관적 평가항목에 대한 메타분석 결과, VHI(6편)는 통합 SMD -18.59(95 % CI -39.56, 2.38, I2 = 96 %)로 시술 전후 개선된 경향은 보였으나 유의하지 않았고 이질성이 높았다. 정상기능 비율(percentage of normal function, 이하 ‘PNF’)(3편)은 통합 MD 35.10 %(95 % CI 25.41, 44.79, I2 = 65 %)로 시술 전후 유의하게 개선하였으며 이질성은 높았다. 음성상태에 대해 자기보고한 연구는 4편으로 이 중 2편은 시술 전후 유의한 개선을 보였으며, 2편은 개선된 경향을 보였으나 주사 전후 차이에 대한 통계적 유의성을 보고하지 않았다. 보툴리늄 독소 주사 효과기간은 6편에서 약 2.6개월 ~ 4.3개월로 보고하였다. 메타분석결과 통합 평균 3.55개월(95 % CI 2.80, 4.29, I2 = 98 %)로 이질성이 높았다.
근거수준은 RCT에서 비뚤림위험 및 비정밀성을 고려했을 때 중등도에서 낮음, 전후연구는 비뚤림위험, 비일관성 및 비정밀성을 고려해서 매우 낮음으로 평가하였다.
결론
성대근내 보툴리늄 독소 주입술 소위원회는 현재 평가결과에 근거하여 다음과 같이 제언하였다.
성대근내 보툴리늄 독소 주입술은 내전형 경련성 발성장애 환자를 대상으로 증상 개선을 목적으로 수행시 대부분의 이상반응은 보툴리늄 독소 주사 후 일시적으로 발생했다가 회복되어 영구적으로 후유증이 남은 사례는 보고되지 않아 안전한 기술로 판단하였다. 효과성은 비교연구가 부족하고, 전후연구의 경우 높은 이질성과 비뚤림위험으로 인해 근거수준은 낮았다. 그러나 대부분의 문헌에서 음향학적, 공기역학적, 청지각적 및 주관적 평가영역 중 1개 이상의 영역에서 시술 후 개선된 결과가 확인되어 동 기술을 효과적인 기술로 판단하였다. 또한 대상 환자의 유병률이 낮아 비교연구 수행이 어렵고 교과서 및 가이드라인에서 내전형 경련성 발성장애의 일차치료로 보툴리늄 독소 주입술을 제시하고 임상에서도 그에 따라 수행하고 있다는 의견이 있었다.
2023년 제10차 의료기술재평가위원회(2023.10.13.)에서는 소위원회 결론 및 분과 의견을 검토하여 다음과 같이 심의 의결하고 권고등급을 결정하였다.
소위원회는 성대근내 보툴리늄 독소 주입술이 내전형 경련성 발성장애 환자를 대상으로 증상 개선을 목적으로 수행시 대부분의 이상반응은 보툴리늄 독소 주사 후 일시적으로 발생했다가 회복된 내용으로 영구적으로 후유증이 남은 사례는 보고되지 않아 안전한 기술로 판단하였다. 효과성은 비교연구가 부족하고, 전후연구의 경우 이질성 및 비뚤림 위험이 높아 근거수준은 낮았으나, 대부분의 문헌에서 음향학적, 공기역학적, 청지각적 및 주관적 평가영역 중 1개 이상의 영역에서 동 시술 후 개선된 결과가 확인되어 효과적인 기술로 판단하였다. 또한 대상 환자의 유병률이 낮아 비교연구 수행이 어렵고 교과서 및 가이드라인에서 내전형 경련성 발성장애의 일차치료로 보툴리늄 독소 주입술을 제시하고 임상에서도 그에 따라 수행하고 있다는 의견이 있었다.
의료기술재평가위원회는 임상적 안전성과 효과성의 근거 및 유병률이 낮은 질환 특성 등을 종합적으로 고려하였을 때, 국내 임상상황에서 내전형 경련성 발성장애 환자에서 성대근내 보툴리늄 독소 주입술의 사용을 ‘조건부 권고함’으로 심의하였다(권고등급: 조건부 권고함).
주요어
내전형 경련성 발성장애, 성대근내 보툴리늄 독소 주입술, 안전성, 효과성
Adductor spasmodic dysphonia, Botulinum toxin injection, Safety, Effectiveness
Laryngeal Botulinum Toxin Injection
Background
Laryngeal botulinum
toxin injection is used to alleviate symptoms in patients with adductor
spasmodic dysphonia. It involves the injection of Botox directly into the vocal
cord muscles under electromyography guidance. In 2007, spasmodic dysphonia was
added to the list of conditions with health insurance coverage by Clostridium
botulinum toxin injection, and the injection of Botox into the vocal cord
muscles was listed as a non-reimbursable item in March 2009. Subsequently, laryngeal
botulinum toxin injection was identified as a candidate for re-assessment
through internal monitoring and selected for re-assessment after a priority
review. In the second 2023 Health Technology Re-Assessment Committee meeting
(February 19, 2023), the assessment plan and subcommittee composition for laryngeal
botulinum toxin injection were reviewed, and its clinical safety and
effectiveness were assessed accordingly.
Method
The clinical safety
and effectiveness of laryngeal botulinum toxin injection were assessed through
a systematic review. All assessment methods were finalized upon discussion by
the “Subcommittee for Laryngeal Botulinum Toxin Injection” (Hereinafter the
“Subcommittee”). The Subcommittee consisted of six experts, namely three
otolaryngologists, two rehabilitation medicine experts, and one evidence-based
medicine expert.
The key assessment
question was “Is Laryngeal Botulinum Toxin Injection clinically safe and
effective for patients with adductor spasmodic dysphonia?” Safety was assessed
based on procedure-related adverse events or complications and effectiveness
was assessed based on acoustic, aerodynamic, psychoacoustic, and subjective
assessments.
Literature searches
were conducted using three international databases (Ovid MEDLINE, Ovid EMBASE, and
Cochrane Central Register of Controlled Trials) and three Korean databases
(KoreaMed, KMBase, and RISS). The selection of literature based on the
inclusion and exclusion criteria and the risk of bias assessment were
independently performed by two reviewers. Disagreements were resolved through a
discussion with a third reviewer. Risk of bias was assessed using the Cochrane
Risk of Bias (RoB) tool for randomized controlled trials (RCTs) and Korean
version of the Risk of Bias Assessment Tool for Nonrandomized Studies 2.0 for
nonrandomized studies. Data were analyzed using a meta-analysis if quantitative
analysis was feasible and qualitative analysis if not. For continuous
variables, the mean difference (MD) and 95% confidence interval (CI) were used
when units were the same. When units differed, the standardized mean difference
(SMD) and 95% CI were reported.
Results
In total, 32
studies were selected through a systematic review (two RCTs and 30
pretest-posttest studies). Both RCTs compared the intervention with a
placebo.
For the RCTs (two studies),
the risk of bias was: 50% “unclear” for random sequence generation, 100% “unclear”
for incomplete outcome data, and 50% “unclear” for other biases such as private
funding sources. For the pretest-posttest studies (30 studies), the risk of
bias was: 3.3% “high” and 80.0% “unclear” for participant selection, 3.3% “high”
and 83.3% “unclear” for confounding variables, 83.3% “unclear” for blinding of
outcome assessment, 13.3% “unclear” for outcome assessment, 13.3% “high” and
56.7% “unclear” for incomplete outcome data, and 7% “high” for selective
reporting.
Safety
Regarding safety
outcomes, the incidence of aspirated sound was 29% in RCTs (one study; lasting
2 weeks) and 17.9%–76.9% in pretest-posttest studies (seven studies; lasting an
average of 11 days). The incidence of dysphagia (difficulty swallowing) was
4.7% and 14.2% in two pretest-posttest studies, respectively (lasting 1–2 weeks
in one study). The incidence of aspiration was 15%–76.9% in pretest-posttest
studies (four studies; lasting 3–7 days). The incidence of dyspnea (difficulty
breathing) was 2% in a pretest-posttest study (one study; lasting 12 days).
Most adverse events were temporary and resolved without lasting
complications.
Effectiveness
Effectiveness was
analyzed based on acoustic, aerodynamic, psychoacoustic, and subjective
outcomes and categorized by study type.
The results from
two RCTs are as follows:
Acoustic and
aerodynamic assessments did not differ significantly between the intervention
and placebo groups in one study. For psychoacoustic assessment, one study
showed that the "strain" voice parameter (rated on a scale of 0 to 3,
with higher numbers indicating worse symptoms) significantly decreased in the
intervention group after 8 weeks, whereas the placebo group also showed a
decrease, with statistical significance not reported. At 12 weeks, the mean
change was 0.36 for the intervention group and 0.27 for the placebo group, but
the statistical significance of between-group differences was not
reported.
Subjective
evaluation outcomes were reported in both studies. One study compared the voice
handicap index (VHI) and severity of dysphonia between the intervention and
placebo groups, with the intervention group showing greater improvement in both
measures. Particularly, the intervention group showed a significant improvement
in VHI after Botox injection, but the statistical significance of between-group
differences was not reported. The other study reported a significant
improvement in the subjective mean improvement score for the intervention group
compared with the placebo group.
The results from 30
pretest-posttest studies are as follows:
For acoustic
measures, a meta-analysis showed that fundamental frequency (seven studies) did
not significantly differ after the procedure compared with the baseline, with a
pooled mean difference (MD) of 4.05 Hz (95% CI -7.37 to 15.47, I2 = 66%). The
standard deviation of fundamental frequency (five studies) significantly
decreased post-procedure, with a pooled MD of -5.71 Hz (95% CI -9.43 to -1.98,
I2 = 60%). However, heterogeneity was high. Rate of change of frequency was analyzed
separately based on units (%, ms). The results were mixed, with some studies
reporting significant differences pre- and post-procedure, whereas others showed
no significant differences. The rate of change of amplitude (eight studies)
tended to decline after the procedure compared with the baseline, with a pooled
MD of -2.18% (95% CI -4.93 to 0.58, I2 = 53%), but the change was not
significant. The signal-to-noise ratio (seven studies) significantly increased
after the procedure compared with the baseline, with a pooled MD of 3.14 (95%
CI 1.36–4.93, I2 = 84%), but heterogeneity was high.
For aerodynamic
parameters, a meta-analysis showed that the mean expiratory rate (six studies)
significantly increased after the procedure compared with the baseline, with a
pooled MD of 79.50 mL/s (95% CI 33.35–125.66, I2 = 74%), but heterogeneity was
high. Maximum phonation time (seven studies) and vocal efficiency (two studies)
were not significantly different after the procedure compared with the
baseline.
For psychoacoustic
parameters, roughness (four studies), severity of voice disorder (five studies),
and strain (three studies) were not significantly different after the procedure
compared with the baseline.
For the subjective
parameters, the VHI (six studies) tended to improve, with a pooled SMD of
-18.59 (95% CI -39.56 to 2.38, I2 = 96%), but the result was not statistically
significant and heterogeneity was high. The percentage of normal function (three
studies) significantly improved after the procedure compared with the baseline,
with a pooled MD of 35.10% (95% CI 25.41–44.79, I2 = 65%), but heterogeneity
was high. In the four studies reporting self-reported vocal status, two showed
significant improvements after the procedure compared with the baseline. In
contrast, the other two showed a trend toward improvement, but statistical
significance was not reported. The duration of the effect of Botox injections
was reported as 2.6–4.3 months in six studies. A meta-analysis confirmed the
duration to be an average of 3.55 months (95% CI 2.80–4.29, I2 = 98%), with
high heterogeneity.
The level of
evidence was rated as moderate to low for RCTs owing to the risk of bias and
imprecision and very low for pretest-posttest studies owing to the risk of
bias, inconsistency, and imprecision.
Conclusion
Based on the
assessment results, the Subcommittee presented the following recommendations
for laryngeal botulinum toxin injection:
Laryngeal botulinum
toxin injection is deemed safe in patients with adductor spasmodic dysphonia when
used for the purpose of symptom improvement, as most adverse events were
temporary and resolved without leaving any permanent sequelae. Regarding
effectiveness, there was only a limited number of comparative studies, and the
level of evidence from pretest-posttest studies was low owing to high
heterogeneity and risk of bias. However, as most studies indicated improvements
in at least one area of acoustic, aerodynamic, psychoacoustic, or subjective
assessment after the procedure, the Subcommittee determined that the technique
is effective. Additionally, there were opinions that comparative studies are
difficult owing to the low prevalence of the disease and that textbooks and
guidelines recommend botulinum toxin injection as the primary treatment for adductor
spasmodic dysphonia, which is consistent with current clinical practice.
At the 10th Health
Technology Reassessment Committee meeting on October 13, 2023, the Committee
reviewed the conclusions and sub-division opinions of the Subcommittee and
finalized the decision and grade of recommendation as follows:
Laryngeal botulinum
toxin injection is deemed safe in patients with adductor spasmodic dysphonia when
used for the purpose of symptom improvement, as most adverse events were
temporary and resolved without leaving any permanent sequelae. It is also
considered effective despite the limited number of comparative studies and low
level of evidence of pretest-posttest studies owing to high heterogeneity and
risk of bias, as most studies indicated improvements in at least one area of
acoustic, aerodynamic, psychoacoustic, or subjective assessment after the
procedure. Additionally, there were opinions that comparative studies are
difficult owing to the prevalence of the disease and that textbooks and guidelines
recommend botulinum toxin injection as the primary treatment for adductor
spasmodic dysphonia, which is consistent with current clinical practice.
Based on a
comprehensive consideration of the evidence for the clinical safety and
effectiveness of the technique and low prevalence of the disease, the Health
Technology Reassessment Committee “conditionally recommended” the use of laryngeal
botulinum toxin injection for patients with adductor spasmodic dysphonia in the
Korean clinical setting (Grade of recommendation: Conditional recommendation).
Key words: Adductor spasmodic
dysphonia, Botulinum toxin injection, Safety, Effectiveness