의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의...

274
연구보고서 의약품 경제성평가지침 개정방안 마련 위탁 연구용역 2019년 12월 건강보험심사평가원 서울대학교 산학협력단 경상대학교 산학협력단

Upload: others

Post on 11-Jul-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

연구보고서

의약품 경제성평가지침 개정방안

마련 위탁 연구용역

2019년 12월

건강보험심사평가원

서울대학교 산학협력단

경상대학교 산학협력단

Page 2: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

제 출 문

건강보험심사평가원장 귀하

이 보고서를 “의약품 경제성평가지침 개정방안 마련 위탁 연구용역”

과제의 최종 보고서로 제출합니다.

2019년 12월

■ 주관 연구 기관명 서울대학교 산학협력단

경상대학교 산학협력단

■ 연 구 책 임 자 이 태 진 (서울대학교 보건대학원)

배 은 영 (경상대학교 약학대학)

연 구 원 강 은 정 (순천향대학교)

(가나다 순) 배 승 진 (이화여자대학교 약학대학)

안 형 진 (고려대학교 의과대학)

조 민 우 (울산대학교 의과대학)

한 서 경 (서울대학교 의과대학)

홍 지 형 (가천대학교)

연 구 보 조 원 이 영 실 (서울대학교 보건대학원)

Page 3: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

목 차

1. 서론 ······································································································································· 1

가. 연구의 배경 및 목적 ········································································································ 1

나. 연구내용 및 방법 ·············································································································· 2

2. 지침 개정의 범위 ················································································································· 7

가. 경제성평가소위원회 워크샵 논의결과 ············································································· 7

나. 국내외 지침 개정 현황 ··································································································· 11

다. 기제출 경제성평가 보고서 검토 ····················································································· 14

라. 이해관계자 의견 수렴 결과 ···························································································· 15

마. 개정범위 ·························································································································· 20

3. 항목별 개정안 마련 ············································································································ 21

가. 관점 ·································································································································· 22

나. 분석기간 ·························································································································· 32

다. 분석대상 인구집단 ·········································································································· 42

라. 분석기법 ·························································································································· 50

마. 비교대상 선정 ················································································································· 57

바. 자료원(간접비교) ············································································································· 69

사. 비용 ·································································································································· 87

아. 효용, 건강 관련 삶의 질 ································································································ 94

자. 통계적 고려사항 ············································································································ 157

차. 할인율 ···························································································································· 182

카. 모형 구축 ······················································································································· 190

타. 진단검사 동반 약물 ······································································································· 203

파. 불확실성 ························································································································· 210

하. 부록: 전문가의견 도출 방법 ························································································· 220

4. 결론 ··································································································································· 228

부록 1. 상호의존 의료기술에 대한 세부 지침 (호주) ························································· 230

부록 2. 진단검사의 경제성평가와 관련한 체크리스트 ························································ 235

부록 3. 이해관계자 설문조사지 ···························································································· 241

5. 참고문헌 ···························································································································· 253

Page 4: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

요 약

1. 서론

가. 연구의 배경 및 목적

❍ 2011년 개정 이후 이루어진 경제성평가 방법론의 발전상과 평가 경험을 반영하기 위

해 지침 개정이 필요하다는 의견이 제기됨

- 그간 지침 제·개정의 주요 참조국이었던 영국, 호주, 캐나다도 2011년 이후 가이드라인

을 전면 개정한 바 있음

- 국내에서도 평가 과정에서 새로이 등장하거나 쟁점화된 사항들을 반영하기 위해 지침을

최신화할 필요가 있다는 의견이 이해관계자로부터 제기된 바 있음

❍ 이에 그간 의사결정과정에 적용되어 온 세부 평가기준을 공식화하고, 개정이 필요한

사항은 개정하는 등 지침 전반의 내용을 최신화하고 구체화하고자 함

나. 연구 내용 및 방법

1) 연구 내용

[그림] 지침 개정 과정

2) 연구 방법

☐ 지침 개정안을 마련하기 위해 먼저 그간 국내에서 진행된 논의 현황과 제외국 가이드라

인을 검토하여 잠정적 개정범위를 선정한 후 이해관계자 조사 및 전문가 자문회의 결과

Page 5: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

를 반영하여 최종 개정범위를 선정함

❍ 기존 논의로는 2015년 12월 이후 6차례에 걸쳐 이루어진 경제성평가소위원회 워크샵

결과와 2017-2018년 동안 제약업계와 건강보험심사평가원 간에 이루어진 TF 활동을

정리한 보고서를 검토하였음

❍ 제외국 가이드라인으로는 캐나다, 호주, 영국의 가이드라인을 검토하였음

❍ 이해관계자 설문조사

- 조사 기간: 2019년 7월말~9월초

- 조사 대상: 제약사(한국글로벌의약산업협회(KRPIA), 한국제약바이오협회, 한국바이오의

약품협회), 환자/시민단체(한국소비자단체협의회, 녹색소비자연대, 한국소비자원, 건강

보험가입자포럼단체, 한국환자단체연합회), 연구자(한국보건의료기술평가학회(KAHTA))

- 이메일을 통해 설문지 배포 +응답 회수. 현 지침을 요약하여 제시하고 개정이 필요하다

고 생각하는 항목에 체크하도록 함. 개정이 필요하다고 응답한 항목은 그 이유와 희망

개정 방향, 근거를 서술하도록 함

- 최종적으로 제약사 9부, 환자/시민단체 0부, 연구자 3부 회수됨

❍ 전문가 자문회의

- 지침에 따른 경제성평가를 수행한 경험이 있는 전문가들을 대상으로 자문회의를 개최하

여 지침 개정범위와 방향을 논의하였음.

☐ 최종적으로 개정이 필요한 것으로 확인된 항목들에 대해서는 다음의 과정을 거쳐 개정

안을 마련함

❍ 현 지침에 대한 분석을 통해 개정이 필요한 부분을 확인함

❍ 기존 제출 자료에 대한 분석을 통해 지침 준수 정도, 방법론 적용의 변이, 제출자료의

투명성, 타당도, 불확실성 수준 등에 대해 살펴보고, 지침 변경 혹은 상세 지침이 제

공되어야 할 부분을 확인하였음

- 기 제출자료로는 2013년부터 2018년 사이 경제성평가소위원회에서 검토된 약제 50건의

최초 제출 자료를 검토 및 고찰하였음.

❍ 제 외국 가이드라인을 분석하였음

- 캐나다, 호주, 영국의 가이드라인 외에 EUnetHTA 파트너 국가들의 지침을 분석하여 정

리한 EUnetHTA 보고서, 그 외 항목에 따라 다른 국가의 가이드라인을 분석하였음

❍ 경제성평가 지침 외 ISPOR 발간 문서 등 경제성평가 방법론 상의 쟁점과 관련한 기

타 문헌도 함께 고찰하였음

❍ 이해관계자 의견 검토

- 그간 진행된 논의 보고서, 이해관계자 설문조사에서 제시된 의견을 바탕으로 이해관계

자의 의견을 정리하였음

Page 6: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

❍ 전문가 자문회의

- 항목별 개정안을 마련하는 과정에서 관련 전문가들이 참석하는 자문회의를 개최함

- 잠정 개정 방향에 대해 관련 전문가들이 참여하는 확대 전문가회의를 거쳐 개정 방향에

대한 의견을 구함

2. 지침 개정의 범위

☐ 위의 과정을 거쳐 다음 항목에 대해 개정안을 마련하기로 결정함.

<표> 개정안 제시 항목

항목 개정 여부 항목 개정 여부

관점 V 비용

V분석기간 V 비용 항목

분석대상 인구집단 V 비용 산출

분석기법1) V 결과 -

분석결과 제시 - 결과지표 -

보고 - 효용,건강관련삶의질2) V

비교대상 선정 V 할인율 V

자료원(간접비교)

V

모형 구축 V

자료 검색 불확실성 V

자료 선정 일반화 -

자료의 추출 및 평가 형평성 -

메타분석 재정영향 삭제

장기효과 추정(외삽), 처치전환(cross over), 진단검사 동반약제에 대한 평가지침 추가

주: 1) CMA에 대한 지침; 2) Evidence의 위계, tariff, mapping관련 세부지침, 직접측정자료의 평가방법,

3. 항목별 개정안 마련

가. 고려사항

☐ 각 항목별 개정안을 마련함에 있어 연구진이 고려한 사항은 다음과 같음.

❍ 지침의 구체성, 명료성 확보

❍ 2011년 개정 이후 이루어진 방법론상의 진보와 합의수준 반영

❍ 경제성평가 자료를 준비해야 하는 국내 기업과 연구자의 수용태세 고려

❍ 일관된 의사결정을 뒷받침할 수 있어야 함

Page 7: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 7 -

❍ 평가결과를 둘러싼 불확실성 최소화

☐ 제시된 안은 지침 개정의 방향을 나타낸 것으로 구체적인 지침(안)은 별도 제출함

❍ 지침(안)에서는 ~한다, ~하여야 한다, ~권장한다, ~선호한다, ~할 수 있다 등의 지시적

표현을 2011년 개정판에서 정의한 것과 같은 의미로 사용함

❍ 지침 개정 방향과 관련하여 서로 이견이 있을 수 있는 내용이나 추후 보다 적극적 의

견 수렴이 필요한 부분은 1안과 2안으로 구분하여 제시하였음

나. 항목별 개정안

☐ 각 항목별 개정안 마련의 구체적 과정과 결과는 본문을 참조하도록 함.

☐ 항목별 개정방향

❍ 분석관점

- 현 제한적 사회적 관점을 보건의료체계 관점으로 변경하며, 직접비의료비용을 기본분석

에서 제외하는 것을 골자로 함

❍ 분석기간

- 선정 원칙은 유지하되, 분석기간 선정시 고려 요소, 모형 시뮬레이션을 통해 결정된 분

석기간의 불확실성 문제를 언급함

❍ 분석대상인구집단

- 세부집단분석 관련 세부 지침을 제공하는 안임

❍ 분석기법

- 비용-효과분석보다 비용-효용분석을 선호함을 명확히 함. 비용최소화분석에 대해서는

2가지 개정안을 제시함

❍ 비교대안

- 비교가능한 대안들 중 시장점유율이 가장 높은 대안이 아닌 다른 대안이 비교대상으로

고려될 수 있는 경우에 대해 언급함(현 지침 유지 안과 변경안이 모두 제시)

❍ 간접비교

- 현 지침에서는 간접비교 수행 방법에 대해 별도 출판된 지침을 언급하고 있을 뿐 구체적

지침은 제공하고 있지 않으나, 개정안에서는 타당한 간접비교임을 소명하기 위하여 제

출해야 하는 자료를 개략적으로 제시함, 현재 사용되는 간접비교 지침과의 연계성 언급

❍ 비용

- 비용 및 자원사용량에 대한 자료원 중 전문가 의견이 갖추어야 할 요건을 언급하고, 투

약 폐기분(wastage)을 고려하는 것에 대해 제안함

❍ 효용

- 효용측정방식의 우선순위, HRQoL 도구 및 tariff 선정, 산식(mapping) 관련 세부지침, 직

Page 8: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

접측정 관련 세부지침을 제안함

- 효용측정방식과 관련하여서는 선호에 기반한 일반도구로 임상시험에 포함된 환자의 건

강상태를 측정하고, 이 자료에 국내 일반대중으로 대상으로 도출된 tariff를 적용하여 질

가중치를 산출하는 간접방식을 선호함을 명시함.

- 선호에 근거한 일반도구로 측정된 자료가 없을 경우에는 다른 방식도 수용가능하나 이

에 대한 충분한 정당화 및 설명, 불확실성 검토가 필요함을 강조

❍ 통계 관련 이슈

- 외삽에 대한 일반적 내용이나 생존분석 모형 구축, 처치전환 보정, 비열등성 평가 등 통

계적 이슈에 대해 고려사항 언급

❍ 할인율

- 현재 비용과 결과 모두 5% 할인율을 적용하고 있으나, 추후 기재부 예비타당성조사에

사용하는 할인율(4.5%)과 일치시키는 안을 제안함

❍ 모형 구축

- 현 지침과 기본 방향은 달라지지 않으나 AdviSHE 등 기존 타당도 평가 도구 등을 참조한

체계적 타당도 평가를 유도함

❍ 진단검사 동반 약물

- 비교대안, 고려할 요소 등 진단검사를 동반한 맞춤형 의약품에 대한 지침 제시

❍ 불확실성

- 구조적 불확실성과 모수적 불확실성을 구분하고, 모수적 불확실성의 경우 확률적 민감

도분석 수행을 요구함(이전 지침에서는 권장사항)

4. 결론

❍ 본 연구에서 제안한 내용, 그리고 이 보고서와 함께 제시하는 지침 초안은 추후 다양

한 이해관계자의 의견수렴 과정을 거쳐 최종 개정 지침으로 확정될 예정이며, 이 보

고서는 추후 발표될 지침의 배경 정보를 제공하는 역할을 함.

❍ 지침 개정안을 마련하는 과정에서 일부 추가 연구가 필요한 부분이 확인된 바, 추후

이들 연구가 진행되고 나면 이에 맞추어 부분 개정이 필요할 수 있음.

❍ 변화하는 상황에 보다 유연하게 대처하기 위해서는 전면 개정뿐 아니라 수시 개정 또

한 진행할 필요가 있음.

❍ 이 지침의 개정과 더불어 관련 지침도 함께 개정될 필요가 있고, 비용매뉴얼이나 통

계방법론에 대한 매뉴얼도 추가로 제공될 필요가 있음.

Page 9: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 1 -

1. 서론

가. 연구의 배경 및 목적

현재 사용하고 있는 의약품 경제성평가 가이드라인은 2006년에 발표되었고, 선별등재제도

도입 이후 신청 약의 경제성을 평가하는 방법론적 지침으로 활용되고 있다.

초판의 경우 주로 제외국의 가이드라인과 경제성평가 방법론에 대한 문헌적 근거를 토대

로 그 내용이 개발되었다. 그러나 초판 발행 이후 국내 경제성평가 관련 환경이 급변하였고,

이에 국내 사용 경험을 반영한 가이드라인 개정이 요구되어 2011년에 개정판이 발간되었다.

그러나 그 이후에도 전세계적으로 효과와 비용을 추정하는 방법론의 발전이 있었고, 가이

드라인 제정과 개정에 있어 중요한 참고 국가였던 영국, 호주, 캐나다도 2011년 이후 가이드

라인을 업데이트 하였다. 국내에서도 다양한 약제들의 효과와 비용에 대한 평가 경험이 축적

됨에 따라 가이드라인을 최신화할 필요가 이해관계자로부터 제기된 바 있다.

개정판 발행 이후 이해관계자로부터의 문제제기가 있었거나 평가 과정에서 쟁점으로 부각

된 부분들 중 일부에 대해서는 경제성평가 소위원회 내부적으로 평가 방향에 대한 합의를

이루고, 실제 평가과정에서 이를 적용하기도 하였다. 당시 합의된 내용은 대부분 기존 가이

드라인의 틀 내에서 세부 지침을 명확히 하는 성격의 것이었다.

그러나 최근 제기된 할인율의 변경 등은 내부 평가 기준을 정비하는 것에서 나아가 가이

드라인 자체에 대한 개정을 필요로 하는 사항이다. 따라서 그간 적용되어 온 세부 평가기준

을 공식화하고, 개정이 필요한 사항은 개정하는 등 가이드라인 전반적으로 그 내용을 최신화

하고 구체화할 필요성이 있다.

이에 본 연구에서는 첫째, 개정이 필요한 가이드라인 항목을 선정하고, 둘째, 항목별로 국

내 평가경험, 이론적 고찰, 제외국의 경험, 전문가 의견 등을 수렴하여 개정안을 마련하는 것

을 목적으로 한다.

Page 10: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 2 -

나. 연구 내용 및 방법

1) 연구 내용

☐ 개정이 필요한 항목 선정

주요 국가(영국 NICE, 호주 PBAC, 캐나다 CADTH)의 최신 경제성평가 가이드라인을 검토

하여 현 가이드라인과의 유사점 및 차이점을 확인하고, 그간 급여결정신청 서류의 일부로 제

출된 경제성평가 자료에 대한 경제성평가소위원회의 논의 결과를 검토하였다.

또한 경제성평가제도 개선 TFT와 경제성평가소위원회 워크숍 결과를 토대로 기존 지침의

수정이나 세부 지침이 필요한 항목을 발굴하였고, 지침 사용자(제약사, 연구자, 심평원 검토

자)를 대상으로 지침 개정이 필요한 부분 및 그 사유 등에 대한 의견을 수렴하여 개정이 필

요한 항목을 선정하였다.

☐ 항목별 지침 개정안 마련

개정이 필요한 것으로 선정된 항목은 관점, 분석기간, 분석대상 인구집단, 분석기법, 비교

대상 선정, 자료원, 비용 항목, 효용(건강관련삶의질), 할인율, 모형 구축, 불확실성, 재정영향

이었다. 이들 항목에 대해 국내외 지침 및 문헌 검토, 이해관계자 의견 수렴을 거쳐 항목별

개정안을 마련하였다. 주요 개정 항목과 대략적인 개정방향은 아래와 같다.

❍ 효용

효용 추정을 둘러싼 불확실성을 고려하여 효용 추정 관련 지침을 보다 명확히 하고자 하

였다. 효용의 개선 여부에 대한 판단 기준, 선호하는 효용 측정 도구, 서로 다른 효용 자료에

대한 선호 위계, 기본분석에 사용할 tariff, 맵핑 자료에 대한 평가 지침, 최소한의 개선 정도,

임상근거-효용-모형의 연계문제, 기타 효용 자료 사용시 유의할 지침 등을 제시하였다.

❍ 할인율

현 지침에서 사용하고 있는 할인율은 2000년대 중반에 결정된 것으로, 그 이후 할인율 결

정과 관련한 조건들이 변화한 바, 할인율의 수정이 필요하다는 의견이 지속적으로 제기된 바

있다. 이에 할인율에 대한 이론적 검토와 전문가 자문 등을 거쳐 적정 할인율을 도출하였다.

❍ 효과 추정

장기 효과 추정에 따르는 통계학적 이슈 등을 검토하고, 관련 지침을 정비하였다. 장기 생

존 추정을 위한 외삽 방법, 효과의 통계적 보정(처치전환 보정) 방법, 간접비교, 관찰기간 이

후 효과 추정방법 등에 대한 지침을 제시하였다.

❍ 불확실성 평가

불확실성 평가 및 불확실성 평가 결과를 제시할 방안에 대한 지침을 제시하였다.

❍ 기타

Page 11: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 3 -

그 외 비교대상, 분석기간, 비용 추정, 모형 구축 등에 대해 세부 지침 필요 여부를 확인하

고 개정안을 마련하였으며 현행 가이드라인에 제시된 문헌 근거를 최신화하였다.

항목별로 전문가 자문을 거쳐 가이드라인 개정방향에 대한 안을 제시하였고, 이를 종합한

가이드라인 개정방향에 대해 전문가 자문을 거쳐 수정 과정을 거친 후 최종적인 가이드라인

개정방향을 제시하였다.

이상 지침 개정 프로세스를 그림으로 나타내면 아래와 같다.

[그림 1] 지침 개정 과정

2) 연구 방법

☐ 문헌고찰

주요 외국(영국 NICE, 호주 PBAC, 캐나다 CADTH)의 경제성평가 가이드라인을 비교 고찰

하였다. 항목별로 관련 문헌 근거 수집 및 고찰을 수행하였고, ISPOR good practice guideline

과 EUnetHTA 가이드라인을 참고하였다.

☐ 외국 주요 기관의 경제성평가 자료 검토 현황 조사

❍ 관련 기관의 웹사이트를 통해 기본적인 제도 운영현황 조사(영국, 호주, 캐나다)

❍ 영국 NICE, DSU (decision support unit) 방문 및 운영현황 조사

❍ 호주 PBAC (Pharmaceutucal Benefit Advisory Committee)과 PBAC산하 경제성평가 소

위원회 (Economic Sub-Committee) 대상 운영 현황 조사 (이메일 조사)

☐ 기존 논의결과 고찰

2015~2016년 경제성평가소위원회 워크숍 논의 내용을 회차 및 쟁점별로 나누어 고찰하였

Page 12: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 4 -

다.

☐ 기제출 경제성평가 보고서 검토

그간 급여결정신청 서류의 일부로 제출된 경제성평가 자료(보고서) 50건에 대한 정보를 심

사평가원에서 제공받아 검토하고 항목별 제출 현황 혹은 경향을 고찰하였다.

☐ 이해관계가 의견 수렴

❍ 경제성평가제도개선 TF 운영 결과

2017~2018년 운영된 경제성평가제도개선 TF의 논의내용을 검토하였다.

❍ 이해관계자 설문조사

2019년 7월말부터 9월초까지 제약사1), 환자·시민단체2), 연구자3)들을 대상으로 지침 개정

범위에 대한 의견조사를 실시하였다. 관련 단체를 통하여 이메일로 설문지를 배포하고 연구

보조원의 이메일로 응답을 회수하는 방식으로 진행하였고, 현 의약품 경제성평가 지침을 아

래와 같이 요약하여 제시하고 개정이 필요하다고 생각하는 항목에 체크하도록 하였다. 개정

이 필요하다고 응답한 항목의 경우 개정이 필요한 이유와 희망하는 개정 방향, 근거를 함께

서술하도록 하였다. 설문지 전문은 부록에 수록하였다.

1) 한국글로벌의약산업협회(KRPIA), 한국제약바이오협회, 한국바이오의약품협회의 협조를 통해 진행되었다.

2) 한국소비자단체협의회, 녹색소비자연대, 한국소비자원, 건강보험가입자포럼단체, 한국환자단체연합회에 협조를 요청하였다.

3) 한국보건의료기술평가학회(KAHTA) 회원들을 대상으로 하였다.

번호 항목 내용

평가의 일반사항

1 관점 제한적 사회적 관점

2 분석기간 주요 임상결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장

3분석대상 인구집단

Ÿ 비용과 결과가 도출된 인구집단 명시Ÿ 급여대상 인구집단으로 일반화 가능한지 근거 제시

4 분석기법 CEA 또는 CUA. 최종지표 사용 권장

5 분석결과 제시 ICER. 총비용과 총효과 별도 제시

6 보고 단계별 결과와 분석에 포함된 자료들을 구체적으로 제시

평가 방법

7 비교대상 선정등재의약품이 있는 경우는 이들 중 가장 많이 사용되는 것. 동일성분의 의약품이 다수 있는 경우는 시장점유율을 이용한 가중평균가격을 비교약의 단위비용으로 이용

8 자료원 Ÿ 비뚤림의 가능성이 낮은 자료원(예, RCT) 우선선택

<표 1> 기존 의약품 경제성평가지침안 요약

Page 13: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 5 -

Ÿ 신청약과 비교약을 직접 비교한 자료원 선호Ÿ 직접비교 자료원이 없는 경우 공통대조군을 이용한 간접비교도 허용

9 자료검색 포괄적 검색. 검색 전략 상세히 제시

10 자료선정자료 선정작업 시작 전 포함·배제기준 정립. 보고서에 상술. 배제문헌 목록 및 배제 근거 제시

11자료의 추출 및

평가최종 선정자료에 대해 각 자료의 특징 및 결과를 요약·제시. 질평가 결과도 제시

12 메타분석 이질성 고려

13 비용 비용항목 열거 → 자원소모량 측정 → 단위비용 적용 → 최종 비용 산출

14 비용항목

Ÿ 제한적 사회적 관점을 취함에 따라 직접 보건의료비용, 환자 및 가족(또는 간병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 포함

Ÿ 생산성 손실 비용 및 해당 질병의 치료와 관련되지 않은 미래 의료비용은 기본분석에 포함하지 않음

Ÿ 보험자 관점에서 분석할 경우 비급여 항목은 기본분석에서 제외

15 비용산출각 항목의 사용량 측정과 단위비용 산출 과정을 자세히 기술. 단위비용과 자원사용량의 자료원은 국내 자료 이용

결과

16 결과지표 최종결과(final outcome) 사용 권장

17효용,

건강관련삶의질

Ÿ QALY 사용. 질가중치는 선호도 반영한 것. 외국에서 개발된 도구를 사용할 때는 국내에서 타당도 검증이 된 것 사용. 선택도구를 지침의 별첨 3, 표4에 근거하여 정당화하고 민감도 분석을 통해 질가중치의 불확실성이 결과에 미치는 영향 검토.

Ÿ 기본분석에서는 선호도에 근거한 일반도구의 사용이 권장됨. 건강상태의 선호도 측정 대상은 국내의 대표성 있는 일반대중을 선호. 기존문헌에서 질가중치 값을 인용하는 경우 자료원의 포함·배제 기준을 상세히 설명하고 근거를 제시하는 등 선정과정을 투명하게 보고. 또한 해당 건강상태에 적용가능한 지 여부를 논의하고 불확실성 평가

18 할인율 5% 기본, 0%, 3%, 7.5% 민감도 분석

19 모형구축

Ÿ 모형에 대한 상술Ÿ 모형 분석 단계마다 해당 질병 상태에 있는 사람(코호트 시뮬레이션인

경우)들의 수, 비용 등을 기술Ÿ 다른 나라에서 개발된 모형의 경우 국내 상황에도 이를 적용할 수

있는지 검토

20 불확실성

Ÿ 경제성평가과정에서 사용한 모든 가정과 기타 불확실성을 초래하는 원천에 대하여 임상적, 통계적으로 타당한 범위에 걸쳐 일원민감도분석 실시. 모수에 관련된 불확실성은 PSA 권장.

Ÿ 급여를 제한하여 신청하는 경우, 식약처 허가사항까지 대상이 확대되는 경우에 대한 민감도 분석 추가 제시

21 일반화

Ÿ 단위비용 및 자원사용량 자료는 국내 자료 이용Ÿ 국내 유병률이나 진료패턴이 외국과 크게 차이가 나서 결과의 국내

적용이 문제될 수 있는 경우는 국내 자료를 토대로 분석 실시, 이를 임상시험 자료에 기초한 분석결과와 함께 제시

Ÿ 다국가 임상시험의 경우 내국인 피험자수가 통계적으로 의미있는 결론을 내릴 수 있을 정도로 충분하다면 내국인 피험자의 시험결과를 기본분석, 전체피험자의 시험결과로 민감도 분석 실시. 그렇지 않은 경우는 전체 피험자의 임상시험결과를 기본분석으로 실시.

22 형평성 형평성 관련하여 어떤 가정을 하였는지 기술. 급여결정의 수혜집단 기술

23 재정영향 도입 후 3-5년간 보험재정에 미치는 영향 분석

Page 14: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 6 -

❍ 전문가 자문회의

가이드라인 항목별로 전문가 자문 그룹을 운영하여 항목별 가이드라인 개발 과정에서 자

문을 구하였다. 또한 가이드라인 사용 경험이 많은 전문가들을 중심으로 전문가 패널을 구성

하여 가이드라인 개발 단계별(개정 범위 설정, 개정방향 초안 결정)로 의견을 조회하였다.

Page 15: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 7 -

2. 지침 개정의 범위

가. 경제성평가소위원회 워크숍 논의결과

2015년 12월부터 총 여섯 차례에 걸쳐 경제성평가소위원회 워크샵이 개최되었다. 워크샵의

목적은 기존 심의 사례에 대한 분석과 쟁점 정리를 통해 경제성평가자료 검토 및 심의의 일

관성을 확보하는 것이었다. 이는 경제성평가 소위원회가 만들어진 후 처음 시도된 작업이었

다. 비록 출판가능한 형태의 판례집이 만들어지지는 않았지만, 그간 심의 과정에서 쟁점으로

부각되었던 부분들을 총 정리하고 소위원회 내부적으로 심의방향을 재확인하는 의미있는 자

리였다. 첫 3회의 워크샵은 2015년 12월부터 2016년 2월까지 진행되었으며, 1차 통계적 쟁점,

2차 건강관련삶의질 추정, 3차 상대적 임상적 유용성 등 기타 쟁점으로 나누어 논의가 진행

되었다. 이후에는 좀 더 세부적인 쟁점 사항들을 중심으로 워크샵이 진행되었는데, 처치전환

보정, 국내 EQ-5D 가치평가연구, 할인율을 단일 이슈로 하여 회의가 진행되었다. 각 워크샵

에서 논의된 내용을 간단히 살펴보면 다음과 같다.

1) 통계적 쟁점 (제1차, 2015.12.29.)

장기효과 추정을 위한 외삽, 처치전환이 발생한 임상연구에서의 효과 추정, 효과 추정과

상대적 임상적 유용성의 판단, 간접비교를 통한 효과 추정 등이 논의되었다.

장기효과 추정을 위한 외삽의 경우 임상연구계획에 따른 최종결과까지 확인하는 것이 바

람직하고 최신 자료까지 확인하는 것이 타당하다. 외부자료원은 주요 자료원이 아니더라도

참고 근거가 될 수 있으며, 외부자료원과 비교한 external validity를 확인하여 수용 여부를

판단하는 과정이 활성화될 필요가 있다. 군간 생존곡선이 만나는 현상이 확인된 경우 이후

시점에서 신청약의 추가적 생존 이익을 가정하는 외삽은 과대추정 우려가 있다.

모수적 분포함수를 통해 효과를 추정하는 경우 현재 가장 많이 사용되고 있는 방법은 육

안검사와 criteria 통계량(AIC/BIC)이었고, log cumulative hazard plot 등을 통해 proportional

hazard 가정의 만족 여부를 확인하는 과정을 추가하여 선정하는 방법으로 타당성을 증가시

킬 수 있다.

처치전환의 경우 cross over 또는 교차투여라는 용어보다 혼동이 없는 처치전환이라는 용

어로 구별하여 사용할 것이 제안되었다. 현재로서는 보정하지 않은 결과와 보정한 결과를 모

두 참고할 수밖에 없으나 향후 반복적으로 제기되거나 빈번해질 수 있는 쟁점이므로 심도

있는 논의를 위해 외부전문가가 참여하는 논의가 고려되었다.

치료효과의 추정 시 치료제간 상대적 임상적 유용성에 대한 판단이 함께 논의되어야 할

Page 16: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 8 -

것이며, 특히 간접비교를 통한 효과 추정 시 개선 또는 비열등성 인정 여부에 대한 논의가

중요할 수 있다. 간접비교 시 인정 기준에 대해서는 상대적으로 엄격한 기준과 완화된 기준

이 제시될 수 있다.

2) 건강관련 삶의 질 추정 (제2차, 2016.1.13.)

비용-효용 분석의 대상과 건강관련 삶의 질의 측정이 논의되었다. 비용-효용 분석의 대상

은 삶의 양 또는 삶의 질 개선이 있어야 하며 가장 바람직하게는 해당 임상연구에서 선호도

기반의 건강관련 삶의 질(HRQoL) 도구로 삶의 질을 측정한 결과를 갖는 자료원으로 개선 여

부를 판단하고, 그 근거수준과 적용 방식의 적절성을 평가할 수 있도록 제시하는 것이 바람

직하다.

이상반응, 증상, 투약편의성, 복약순응도 개선 등을 삶의 질 개선으로 주장하는 경우에는,

임상연구에서 해당 지표들의 개선이 있고, 최소한 이 지표들이 건강관련 삶의 질(HRQoL)에

영향을 미친다는 연관성이 있어야 할 것이다.

건강상태 시나리오를 구성하여 효용을 측정 시, 시나리오 구성의 근거로 다양한 자료원이

사용될 수 있으나 타당성을 제시하여야 하고 특히 중재군간 차이를 과장하지 않도록 주의하

여야 한다.

내국인의 삶의 질 자료라 함은 직접법으로 효용을 측정한 경우만이 아니라 임상연구에서

간접법으로 측정한 결과에 내국인 Tariff를 적용하는 것을 포함하는 내용이다. 문헌인용 방식

으로 제출하는 경우 체계적문헌고찰과 민감도분석을 강조할 필요가 있다. 매핑 방식의 경우,

제외국 지침 등을 참고하여 매핑을 제시할 때 갖춰야 할 최소 요건을 정의할 수 있다.

3) 상대적 임상적 유용성 등 (제3차, 2016.2.16.)

상대적 임상적 유용성을 판단할 때는 상대적 효과(comparative effectiveness)와 상대적 안

전성(comparative safety)을 종합적으로 고려하여야 한다. 효과와 안전성을 각각 우월

(superior), 비열등(noninferior), 불확실(uncertain), 열등(inferior)으로 구분하여 경제성평가 분

석 유형을 분류하고 있는 외국 사례를 참고하여(호주), 국내 지침 운영에 있어서도 분류해

볼 수 있다.

예를 들어, 효과는 우월하나 안전성이 열등할 때 비용효용분석 대상으로 볼 것인지, 효과

가 불확실하고 안전성이 우월한 경우 비용효과/효용분석 대상으로 볼 수 있는지 등이 논의될

수 있다. 과거 사례 검토 결과 주요 효과지표의 비열등성 여부가 불분명한 경우 비용최소화

분석 대상으로 보기 곤란할 것이나 필요 시 소명 내용과 근거 자료를 확인할 수 있다.

비교대안을 선정할 때는 비교할만한 등재의약품을 후보군으로 하므로 허가범위 초과나 비

Page 17: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 9 -

급여 대안은 고려하지 않으나, 항암제의 경우 공고요법은 포함하고 있다. 학회의견 등을 통

해 선정된 비교대안이 extended dominance로 보이는 경우, 선정 배경에 대한 근거를 확인한

다.

모형의 가정은 일반화하여 원칙을 논의하기 어려운 쟁점으로, 임상적 현실과 부합하는지

여부의 확인, 외부타당도를 강조할 필요가 있다. 외국에서 개발된 모형을 내국인 환자에게

적용 시 역학적 특징, 치료 행태 등을 확인해야 한다.

4) 처치전환 보정

처치전환 발생시 생존 기간에 대하여 ITT 분석을 수행하는 경우, 새로운 치료법의 편익이

과소 추정되는 bias가 발생하여 적절치 않다. 영국, 호주 등에서 발표된 가이드라인 등에서도

처치전환 보정의 필요성을 명시하고 있고 영국의 최근 평가사례에서도 보정 방법이 인정된

사례가 다수에 해당하고 있다.4)5)

그간 처치전환 보정방법의 불확실성을 고려하여 보수적 관점인 ITT를 기본 분석으로 하고

처치전환 보정 결과를 의미 있는 민감도 분석으로 제시한 바 있으나 앞으로는 제시한 보정

방법의 적절성 및 결과 제시, 그 외 가용한 보정방법의 결과(적용이 적절치 않은 경우 해당

사유 제시)에 대해 명확한 소명이 제시되는 경우 보정방법을 기본분석으로 수용하는 것이 보

다 바람직 할 것으로 논의되었다.

자료 제출과 관련해서는 현재로서는 의사 결정시의 내부적인 판단 기준이나 자료 제출 목

록을 세부적으로 정하기는 어렵고, 건건이 자료를 판단하되 검토 경험이 축적된 향후 가이드

라인을 제시할 수 있을 것이다. 구체적인 검토 방향을 제시하기 보단 호주 가이드라인(2016)

을 참고하여 제약사에서 보정방법의 타당성을 입증할 자료를 제시토록 하는 것이 적절할 것

으로 보인다.

제약사에서 적절하다고 주장하는 보정 방법 이외에도 simple methods 중에서는 ITT 분석,

censoring 분석, complex methods 중에서는 IPCW, RPSFT, IPE, two-stage의 보정 방법은 최

소한 포함하여 민감도 분석으로 제출해야 한다. 각 보정 방법이 기반하고 있는 가정과 관련

하여 선정한 방법의 적절성을 소명하고, 선정하지 않은 방법이 적절하지 않다고 판단한 사유

에 대해서도 충분히 소명해야 한다.

per protocol 분석은 selection bias가 명확히 발생하므로 일반적으로 기본 분석보다는 참고

적으로 고려할 수 있다.

처치전환과 관련하여 자료 보완을 요청할 시 실무에서 체크해야 할 사항들은 아래와 같다.

4) Latimer NR et al. Adjusting survival time estimates in the presence of treatment switching. NICE DSU Technical Support Document 16, 2014

5) Guidelines for preparing a submission to the pharmaceutical benefits advisory committee. Version 5.0 September 2016.

Page 18: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 10 -

- 처치전환 허용 기준, 각각의 기준에 해당하는 처치전환 환자 수

- 시점별 처치전환 환자 비율

- 임상 프로토콜에서 사전에 정의된 보정 방법의 유무

- 민감도 분석 결과(ITT 분석, censoring 분석, IPCW, RPSFT, IPE, two-stage 분석 포함)

모두 제시. 이 외에 새로운 보정 방법이 사용된 경우, 보정방법 특성에 대한 상세한 설명

필요

- 혼란변수부재, 동일치료효과, two-stage methods에서 필요한 2차 기저선 존재 등 보정

방법의 주요 가정을 평가하여 적절한 혹은 적절하지 않은 사유(가설 검정 방법에 대하여

임상시험 또는 외부 자료원에 대한 고찰과 임상 자문 등을 포함)를 충분히 소명

5) 국내 EQ-5D 가치평가 연구

국내 tariff 연구 간에 건강상태 각각의 효용값은 다소 차이가 있어 보이나, 경제성평가에

서 실제로 활용되는 건강상태 간 효용값 차이(difference)는 영국 tariff에 비하여 비교적 일

관되게 나타나고 있다. 즉, 2가지 건강상태에 대한 한 사람의 평가는 연구 간에 어느 정도

일관된 차이를 보이는 바, 국내 연구 간에 나름의 correlation이 있어 보이며, 「의약품 경제

성평가지침」에 명시된 바와 같이 국내의 대표성 있는 일반 대중으로부터 산출된 선호도 결

과가 선호된다.

EQ-5D-3L 가치평가 연구 중에서는 가장 표본의 대표성이 있고, 타 연구에 비하여 많은 건

강상태(101개)에 대해서 평가한 Lee et al. (2009) 연구를 기본분석으로 하는 것이 타당하다.

EQ-5D-5L 가치평가 연구 중에서는 EuroQoL 그룹이 정한 표준 프로토콜에 따라 valuation

study를 수행하였으며, 보다 표본의 대표성이 있는 Kim et al. (2016)을 기본분석으로 하는 것

이 타당하다.

6) 할인율

‘의약품 경제성평가 제도 개선 TFT' 추진에 따라 경제성평가 검토 절차 및 경과의 투명

성 제고 방안 마련 및 신속한 평가를 도모하고자 의약품 경제성평가 제도 전반에 대해 업계

요청사항 중 중점 검토 항목6) 선별 및 심층 검토를 위한 근거 연구 및 의견을 공유하여

「의약품 경제성평가 지침」에서 할인율의 변경 필요성 및 가능성을 검토한 결과 할인율 변

경에 대한 부분은 지침 개정 시 해당 항목을 포함하여 관련 전문가들의 충분한 의견수렴을

바탕으로 절차를 진행하는 것이 타당한 것으로 논의되었다.

2006년부터 적용해온 현 지침의 할인율은 그 조정이 필요하다고 판단되며 할인율의 전반

적인 부분에 대해서 이론적 고찰 및 현실적인 적용 문제에 대한 논의의 필요성이 있다.

6) 비교약제, ICER 임계값 범위, 효용(삶의 질), 할인율

Page 19: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 11 -

나. 국내외 지침 개정 현황

현 지침을 개정할 당시 참조하였던 주요 국가들은 2011년 이후 모두 가이드라인을 개정하

였다. 호주는 2016년, 캐나다는 2017년에, 그리고 영국은 2013년에 각각 가이드라인을 개정하

였다. 영국의 경우 현재 전면 개정 작업이 진행중이고 2020년 7월 경에 개정 가이드라인 초

안이 회람될 예정으로 있다. 3개국의 최신 가이드라인에 대한 검토를 통해 현지침에서 개정

이 필요한 부분, 잠정적 개정방향을 확인하였다.

☐ 호주

- Guidelines for preparing a submission to the Pharmaceutical Benefits Advisory

Committee version 5.0 (2016년 9월)

- 상세한 자료 제출 지침. Part A(section 1,2,3,4), B, 부록으로 구성. Part B의 section 2는

clinical evaluation, section3는 economic evaluation

- 2006년 version 4.0발표 이후에도 version 4.1~4.5까지 발표 (minor update).

☐ 영국

- Guide to the methods of technology Guide to the methods of technology appraisal 2013

(2013년 4월)

- 부속문서, 혹은 Decision Support Unit의 보고서 형태로 방법론에 대한 가이드가 계속되

고 있음. 본 가이드라인 자체도 지속적으로 업데이트됨

- 현재, 개정 작업 진행중이며 2020년 여름에 초안 발표 예정임.

☐ 캐나다

- Guidelines for the Economic Evaluation of Health Technologies: Canada 4th Edition

(2017년 3월)

- 우리 가이드라인과 포맷 유사. 부속문서 다수.

영국, 호주, 캐나다의 개정 가이드라인을 검토한 결과, 대체로 이전 버전에 비해 지침의 구

체성이 강화된 것으로 보인다. 가이드라인의 구체성이 돋보인 대표적 국가는 호주로, 기본

방향에 대한 설명 뿐 아니라 보고서에 포함하여 제출할 내용을 표의 형태로 예시하는 등 매

우 상세한 지침을 제공하고 있었다. 또한 방법론만이 아닌 신청서 제출과 관련한 제반 사항

을 가이드라인 안에 포함하고 있었다. 내용적으로는 캐나다와 영국이 유사한 지침을 제공하

고 있었고 다소 이론적 설명이 많은 편이라면, 호주는 그간의 제출 건에 대한 검토 경험이

많이 반영된 것으로 보인다. 예를 들어 영국과 캐나다는 비용-최소화분석에 대한 언급 자체

가 없지만, 호주는 비용-최소화분석의 이론적 한계는 인정하면서도 비용-최소화분석 건에 대

해 별도 지침을 제공하고 있었다. 분석 관점은 세 국가 모두 유사하였으며 제한적 사회적 관

Page 20: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 12 -

점을 채택한 우리나라와는 달리 보건의료체계 관점을 채택하고 있었다(표현은 조금씩 다르지

만). 분석기간 선정과 관련한 원칙적 표현은 동일하지만 호주는 분석기간의 불확실성에 대해

좀 더 우려하는 표현이 많았다. 효용과 관련하여 세 국가 모두 간접측정을 선호함을 명시하

였으나 선호하는 도구와 tariff를 특정한 영국과 달리 캐나다, 호주는 특정 도구를 선호한다

고 제시하지 않았다. 불확실성은 세 국가 모두 강조하는 영역이나, 영국과 호주가 확률적 분

석을 요구하고 결정론적 민감도 분석에 대해 부정적으로 언급하였다면, 호주는 여전히 결정

론적민감도분석을 중요하게 언급하는 것을 확인할 수 있었다. 다음 표는 지침의 일부를 비교

한 것으로 이 표에 포함되지 않은 자세한 지침의 내용은 뒤에 이어지는 항목별 개정 논의에

서 확인할 수 있다.

우리나라 영국 호주 캐나다

분석기간

주요한 임상결과를 확인할 수 있을 정도로 충분히

길게 할 것을 권장

sufficiently long to reflect all important

differences in costs or outcomes

captures all important

differences in costs and

outcomes…but does not extend unnecessarily beyond this

long enough to capture all relevant

differences in the future costs and

outcomes

비교대안

비교할 만한 등재 의약품이 있는 경우는 이들 중

가장 많이 사용되는 것

As listed in the scope.

comparator의 적절성을

평가시진료관행고려

등재약이있는 경우 대체가능성이 가장 높은 약. 비교 약 선택의 알고리즘 있음. 약리 기전, 투여 경로 고려.

현재 사용중이고대체될 가능성이 있는 약, 가까운 미래에

진입할 약도 고려. 등재약이주로

고려됨건강상태측정 언급없음 환자 언급없음 언급없음건강상태선호도

측정대상국내 대표성 있는

일반대중영국 일반대중 호주 일반대중 캐나다 일반 대중

직접 vs. 간접측정 선호 언급없음간접 측정

권장(EQ-5D선호)(일차적) 간접 측정 권장

간접 측정 권장

직접측정시방법

특정 도구에 대한 선호 없음. 대신 선택에 기초한 도구 사용

권장하지 않음(간접측정 불가 시 제한적으로 이용)

간접측정 대안으로 제시. 단계별로

자세히 기술. 편향 최소화 필요.

간접측정방식 권장

tariff

특정 tariff에 대한 언급은 없음.

Tariff가 여러 개 존재할 경우

최신값 사용제안

단일 UK EQ-5D tariff

특정 tariff에 대한 언급은 없음

특정 tariff에 대한 언급은 없음

기존값인용필요시 사용 가능. 포함/배제 기준 명확히 명시.

필요시 사용 가능하나, 정당화 및 불확실성 검토

필요시 사용 가능하나, 정당화 및 불확실성 검토

필요시 사용 가능. 목적, 신뢰성,

일관성 측면에서

<표 2> 국내외 지침 비교

Page 21: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 13 -

투명하게 보고. 불확실성 평가

필요 필요선택. 선택 과정 자세히 기술 필요.

산식(Mapping)언급하였으나, 대부분 한계 및 문제점 지적함

EQ-5D 자료 없을 경우 맵핑을 통해 EQ-5D로 변환

가능(충분한 설명, 민감도 분석 필수)

MAUI 사용하지 않은 이유 제시. 맵핑 통해 호주 일반대중 선호

반영.

권장하지 않음. 맵핑을 통해서만 효용 추정이 가능한 경우는

불확실성을 충분히 분석 제시

불확실성일원민감도분석

필수. 다변량분석권장

확률적 분석을 권고 (결정론적 민감도 분석은 권고하지 않음)

univariate sensitivity and

scenario analyses.(모두) &

relevant multivariate

analyses and any probabilistic

sensitivity analysis

확률적 분석을 권고 (결정론적 민감도 분석은 권고하지 않음)

Page 22: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 14 -

다. 기제출 경제성평가 보고서 검토

2013년부터 2018년 사이 경제성평가소위원회에서 검토된 약제 50건의 최초 제출 자료를

검토 및 고찰하였다. 적응증을 살펴보았을 때 항암제 23건(46%), 희귀난치성질환치료제 9건

(18%), 일반약제 18건(36%)으로 항암제의 제출 건수가 가장 많았다. 소위원회 심의횟수는 평

균 2.2회로 1회 검토 16건(32%), 2회 검토 19건(38%), 3회 검토 4건(8%), 4회 검토가 11건

(22%)이었다. 항목별 자세한 사항은 ‘3. 항목별 개정안’ 파트에서 각 항목별로 다루었다.

[그림 2] 분석대상 제출자료의 적응증 및 심의횟수 분포

Page 23: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 15 -

라. 이해관계자 의견 수렴 결과

1) 경제성평가 제도개선 TF 운영 결과

2017.6 ~ 2018.12 심평원과 업계 대표 중심으로 구성되어 운영되었다. 검토항목별 업계, 심

평원 의견은 아래와 같다.

비교약제 선정 기준과 관련하여 업계에서는 “오래된 약과 비교하지 말아달라”, “치료적

위치가 동등한 약제들끼리 비교하라.”, “가용한 근거가 있는 약제 vs. 가장 많이 사용되는

약제”, “특허만료약의 경우 최초 등재가로 비교해달라.”, “First in class(높은 ICER 적용,

오래된 약 비교대상에서 제외, 최초등재가와 비교, 원가기반산정 등)”,“ 대체약제가 없는

첨단바이오의약품(별도 트랙)” 등의 의견을 제기하였다. 심평원 측 검토의견은 “국내외 지

침이 다르지 않은 바, 변경 사유 없음”이었다.

ICER 범위는 논의대상에서 제외되었다.

할인율과 관련해서는 할인율 하향 조정(외국의 할인율을 참조하는 경우 1.5~5%까지 가능.

사회적 할인율의 수준을 참고하여 낮게 설정할 경우 2.5% 내외의 할인율도 가능)이 제약사

측에서 제기되었다. 심평원 측 검토의견은 “예타연구에서 사용하는 사회적 할인율 4.5%를

고려하여 조정의 필요성은 인정함”이었다.

효용과 관련해서는 국내 tariff에 대한 장단점 비교 및 우선순위에 대한 의견(자료원, 도구,

측정방법, 측정대상 및 국내여부 등)이 제기되었고 제약사 측에서는 여러 상황을 고려하여

유연하게 할 것을 요구하였다. 심평원(경평소위) 검토의견은 “tariff는 국내의 대표성 있는

일반 대중으로부터 산출된 것을 선호하며 EQ-5D-3L 가치평가 연구중에서는 Lee et al.

(2009)을, EQ-5D-5L 가치평가 연구 중에서는 Kim et al. (2016)을 기본분석으로”였다.

2) 이해관계자 설문조사 결과

가) 제약사

총 9부가 회수되었고 국내사가 한 곳, 외국계가 여덟 곳이었다. 개정이 필요한 항목으로는

‘할인율’이 가장 많이 꼽혔고(7개사), 그 다음으로는 ‘비교대상 선정’(5개사), ‘비용 항

목’, ‘효용/건강관련삶의질’(이상 4개사), ‘관점’(3개사)에 대한 의견이 많았으며 ‘분석

기간’, ‘분석대상 인구집단’, ‘자료원’(이상 2개사), ‘재정영향’(1개사) 순이었다. 각

항목에 대하여 개정이 필요하다고 응답한 이유와 희망 개정 방향은 아래와 같다.

할인율은 경제성평가 도입 당시의 할인율이 10년 넘게 적용되고 있고, 최근의 저성장 추세

를 감안할 때 대략 3% 수준으로 인하를 희망하는 의견이 많았다.

비교대상 선정의 경우 회사 입장에서 시장점유율을 정확히 알기 어렵고, 동일한 치료적 위

Page 24: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 16 -

치를 갖는 약이 없거나 직접적인 임상적 근거를 확보할 수 없는 경우가 있고, 오래된 비교약

제의 경우 약가가 매우 저렴한 경우가 있어 회사가 가용한 자료 범위를 고려해달라는 의견

이 있었고, 오래된 비교약제는 제외하거나 가격인하분 보정, 원가기반 산정, ICER threshold

탄력 적용 등을 검토해달라는 의견도 있었다.

비용 항목의 경우 질환의 특성에 따라 생산성손실비용, 부작용 관리비용 등이 중요한 경우

가 있음에도 불구하고 반영이 되지 않으므로 이를 포함하는 방향으로 개정을 희망하는 의견

이 많았다.

효용(건강관련 삶의 질)의 경우 특정 도구 및 tariff를 적용하도록 하는 것에 대한 반론이

많았으며 대체로 유연한 도구 및 tariff의 적용을 선호하였으나 tariff로 인한 불확실성이 크

므로 오히려 국내 tariff를 일원화 해달라는 의견도 있었다. 그 외에는 mapping 결과를 기본

분석으로 수용해달라는 의견과 직접 측정 수행 시 시나리오에 대한 예시를 들어달라는 의견

이 있었다.

관점에 대한 의견은 비용 항목과 유사하였다. 질병 특성에 따라 중요한 비용 항목이 제한

적 사회적 관점으로 인하여 포함되지 못하는 경우가 있으므로 관점을 확대해달라는 의견이

대다수였다.

분석기간 항목의 개정이 필요한 이유는 대체로 현재 심평원이 권고하는 분석기간에 대한

반론이였으나 희망 개정방향은 유연한 설정(짧은 방향으로)을 원하는 방향과 lifetime을 기본

분석으로 원하는 방향으로 나뉘었다.

분석대상 인구집단에 관해서는 인구집단을 제한하는 경우 RCT 근거를 활용하기 어려운

상황이 발생하므로 이런 경우에 대하여 지침에서 가이드를 제시해주었으면 한다는 의견이

있었다.

자료원의 경우 RCT 자료를 활용할 수 없는 경우 관찰연구, real world 자료를 쓰게 해달라

는 의견과 간접비교 수행방법에 대한 언급이 없으므로 수용가능성을 명시해달라는 의견이

있었다.

재정영향 항목은 약제결정신청서에도 기재하도록 되어있으므로 경제성평가 보고서에서는

삭제해달라는 의견이 있었다.

그 외 기타 의견으로 ICER 임계치 적용에 대한 의견과 실무 지침의 필요성을 주장하는 의

견, 지침 개정 주기에 대한 의견 등이 있었다.

나) 환자·시민단체

약 2주간 5개 단체에 협조를 요청하였으나 회수된 설문지가 없었다.

다) 연구자

Page 25: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 17 -

총 3부가 회수되었고 대학 소속이 2명, 연구소 소속이 1명이었다. 개정이 필요한 항목으로

는 ‘관점’과 ‘할인율’이 가장 많이 꼽혔고(3명), 그 다음으로는 ‘효용/건강관련삶의

질’, ‘재정영향’(이상 2명), ‘분석기간’, ‘분석결과 제시’, ‘비용 항목’, ‘불확실

성’(1명) 순이었다. 각 항목에 대하여 개정이 필요하다고 응답한 이유와 희망 개정 방향은

아래와 같다.

관점과 관련해서는 제한적 사회적 관점이라는 용어와 비의료비용 포함에 대한 의문이 제

기되었다. 보건의료체계 관점으로 개정을 희망하는 의견이 많았다.

할인율은 현재의 할인율을 높다고 생각하는 의견이 많았으며 예비타당성조사 할인율(4.5%)

과 일치시키거나 3% 정도로 인하하는 의견이 제시되었다.

효용의 경우 현재 불확실성이 크고 연구자들 간에도 혼란이 있으므로 선호하는 도구와 추

정방법을 명시하거나 산출방법 및 자료원에 대하여 더 명확하게 설명하자는 의견이 제시되

었다.

재정영향 항목은 환자수 추정 등 분석 시점에서 자료 확보가 어려운 것도 있고 추후 가격

협상 시 다시 논의되므로 경제성평가 지침에서는 삭제하였으면 좋겠다는 의견이 많았다.

분석기간은 현재 지침의 표현이 모호하므로 더 구체적으로 명시해달라는 의견이 있었다.

분석결과 제시의 경우 ICER 자체의 불안정성이 있으므로 net monetary benefit을 추가 기

술하는 의견이 제시되었다.

비용 항목의 경우 한국보건의료연구원의 비용 산출 매뉴얼과 비용 항목을 일치시키자는

의견이 제시되었다.

불확실성의 경우 현 지침의 불확실성 항목이 모수 불확실성에만 치중되어 있기 때문에 이

질성, 구조적 불확실성 등에 대한 언급이 확대 기술되었으면 한다는 의견이 제시되었다.

그 외 기타 의견으로 reference case, 교육용 지침, 내부 지침 등을 별도 작성하는 것을 검

토해달라는 의견과 ICER threshold의 범위를 제시해달라는 의견, 방법론적으로 사용가능한

것들의 범위를 제시해달라는 의견 등이 있었다.

라) 소결

이해관계자들을 대상으로 지침 개정 범위에 대한 의견을 조사한 결과 제약사 의견과 연구

자 의견 간에 공통되는 부분도 있었으나 대체로 관심을 가지고 있는 항목이 다른 것으로 보

여졌다.

할인율은 제약사와 연구자 양측 모두에서 가장 개정이 필요한 항목으로 꼽혔으나 인하 수

준은 제약사 측에서 기대하는 인하폭이 더 큰 것으로 보인다.

효용/건강관련삶의질과 관점도 양측 다수에서 개정이 필요하다고 응답되었으나 관점의 경

우 연구자는 용어의 변경(제한적 사회적 관점 → 보건의료체계 관점)을 언급한 것임에 반해

Page 26: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 18 -

제약사 의견은 관점을 확대해달라는 요구가 많았다.

효용/건강관련삶의질에 있어서도 희망 개정 방향이 다르게 나타났다. 제약사 측은 유연한

도구 및 tariff 선정을 희망하는 의견이 상대적으로 더 많았으나 연구자 조사결과에서는 오히

려 더 명시해달라는 의견이 있었다.

분석기간, 비용 항목, 재정영향은 다수는 아니나 양측에서 개정이 필요하다고 언급되었다.

재정영향 항목의 개정이 필요하다고 응답한 경우 대체로 해당 항목의 삭제를 제안하였다.

비교대상 선정은 제약업계에서는 개정을 요구하는 목소리가 많았으나 연구자 대상 조사에

서는 개정이 필요하다고 응답한 응답자가 없었다. 분석대상 인구집단과 자료원도 제약사 조

사에서만 언급되었고, 분석결과 제시와 불확실성은 연구자 대상 조사에서만 언급되었다.

3) 전문가 자문회의

8월초 경제성평가 연구 수행 경험이 있는 학계 연구자들을 대상으로 지침 개정 범위에 대

하여 전문가 자문회의를 진행하였다. 회의에서 제안된 의견의 요약은 아래와 같다.

지침의 기본적 방향성과 관련하여 서술의 정도에 대한 이슈가 있었다. 가이드라인을 원칙

위주로 간단하게 서술하고 디테일한 부분은 분리하자는 의견이 있었고, 너무 큰 변화를 주면

혼란스럽기 때문에 현재의 틀을 유지하자는 의견이 있었다.

관점의 경우 외국에서는 ‘제한적 사회적 관점’이란 표현을 잘 사용하지 않기 때문에 명

칭 변경의 고려가 필요하다는 의견이 있었고, 보험자 관점과 비급여비용에 대한 고민이 필요

하다는 의견이 있었다.

분석기간의 경우 “충분히 길게”라는 표현에 대해 고민이 필요하다는 의견이 있었고, 비

교대상 선정은 “가장 많이 쓰는 약”이라는 정의가 애매하므로 최대한 구체적이었으면 좋

겠다는 의견이 있었다.

자료원의 경우 임상시험 결과 사용에 대한 이슈가 있었는데 임상시험에서 도출된 결과는

최대한 사용하게 해달라는 의견이 있었다. data source와 관련해서도 이슈가 있었는데 공식

적으로 publish된 자료만 받아준다 등 수용가능한 data source를 명시해주었으면 한다는 의견

이 있었다.

비용의 경우 NECA와 외국 사례를 참조하여 비용 항목의 명칭 수정, 정리가 고려되었으면

한다는 의견이 있었다.

효용의 경우 선호하는 효용 측정방식을 명시하는 것과 관련된 이슈가 있었다. 가이드라인

에서 가장 valid한 효용 측정방식부터 차례대로 순서를 정해줄 필요가 있다는 의견이 있었던

반면 우선순위를 정하는 것은 반대한다는 의견이 있었다. 또한 현 지침은 무조건 일반인 대

상으로 측정된 것이 먼저이고 임상시험에서 나온 값은 덜 선호되는 것처럼 이해될 수 있으

Page 27: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 19 -

므로 문구의 수정이 필요하다는 의견이 있었다. 특정 도구의 권고와 관련해서는 EQ-5D-3L

외의 도구도 리스트업 되었으면 하는 의견과 특정 도구를 권고하는 것은 적절치 않은 것 같

다는 의견이 있었다.

할인율의 경우 예비타당성조사 할인율(4.5%)와 같게 갈 것인지 검토가 필요하다는 의견이

있었다.

모형 구축의 경우 외국에서 개발된 모형에 값만 한국값으로 대체하여 넣는 경우를 고려하

여 지침에 내용이 들어가야 한다는 의견과 블랙박스 모형의 가능성이 있으므로 불확실성 체

크를 더 철저하게 수행되게 하여야 한다는 의견이 있었다.

불확실성 항목은 현재 너무 모수 불확실성 위주로 수행되고 있으므로 좀 더 광범위한 불

확실성 테스트에 대한 내용이 들어갔으면 한다는 의견이 있었다.

재정영향의 경우 계속 가이드라인에 들어가야 할지 의문이며 계속 들어간다면 더 깊이

develop하고 제외해도 된다면 제외하는 것이 나을 듯하다는 의견이 있었다.

기타 의견으로 체계적 문헌고찰의 범위가 가이드라인에 제시되었으면 한다는 의견이 있었

다. 자료(SAS코드 등) 제출의 범위/수준을 미리 정해줬으면 한다는 의견도 있었으나 이를 지

침에 명시하는 것은 더 숙고해봐야한다는 의견도 있었다. 진단 동반 의약품의 경제성평가 문

제가 개정 지침에 포함되었으면 한다는 의견도 있었다.

Page 28: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 20 -

마. 개정범위

상술(上述)한 내용을 바탕으로 설정한 지침의 개정범위는 아래와 같다. 관점, 분석기간, 분

석대상 인구집단, 분석기법, 비교대상 선정, 자료원(간접비교), 비용 항목, 효용(건강관련삶의

질), 할인율, 모형 구축, 불확실성 항목을 개정범위로 선정하였으며 재정영향은 항목의 삭제

를 권고한다. 또한 기존 지침에는 없었던 통계적 고려사항(장기 효과 추정, 처치전환 등)과

진단검사 동반 약제에 대한 평가 지침을 새로이 추가한다.

항목 개정 여부 항목 개정 여부

관점 O 비용

O분석기간 O 비용 항목

분석대상 인구집단 O 비용 산출

분석기법 O 결과 -

분석결과 제시 - 결과지표 -

보고 - 효용,건강관련삶의질 O

비교대상 선정 O 할인율 O

자료원

O

모형 구축 O

자료 검색 불확실성 O

자료 선정 일반화 -

자료의 추출 및 평가 형평성 -

메타분석 재정영향 삭제

새로 추가되는 항목 • 통계적 고려사항(장기 효과 추정, 처치전환 등) • 진단검사 동반 약제에 대한 평가 지침

<표 3> 선정된 개정범위

Page 29: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 21 -

3. 항목별 개정안 마련

이 장에서는 이번 개정범위에 포함되는 항목들에 대해 문헌 검토 및 이해관계자 의견 청

취 결과 등을 바탕으로 개정 방향을 제시한다. 각 항목별 개정안을 마련함에 있어 연구진이

고려한 사항은 다음과 같다.

첫째, 경제성평가 수행자와 검토자가 각자의 업무를 수행함에 있어 실질적 잣대가 될 수

있는 명료한 지침을 제공한다.

둘째, 지난 2011년 개정 이후 이루어진 경제성평가 방법론의 진보와 합의수준을 충분히 반

영하되, 국내에서의 수용 가능성도 고려한다.

셋째, 평가결과를 둘러싼 불확실성을 최소화한다.

넷째, 일관된 의사결정을 뒷받침할 수 있어야 한다.

이상의 원칙을 바탕으로 각 파트별로 먼저 현 지침에서 개정이 필요한 부분을 검토하고,

이어 기존에 제출된 신청건들을 분석하여 국내 경제성평가 수행 현황을 살펴보았다. 이어,

캐나다, 호주, 영국, 그리고 그 외 국가들의 지침과 기타 문헌 검토를 통해 현재 전세계적으

로 통용되고 수용되는 방법론, 자료요구 수준을 확인하였으며, 마지막으로 이해관계자가 제

출한 의견을 고려하여 개정안을 마련하였다.

각 항목별 개정안 마련 과정과 결과는 다음과 같다.

Page 30: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 22 -

가. 관점

1) 현 지침

가) 주요 지침

의약품에 대한 경제성평가를 수행함에 있어 사회적 관점에 근거하여 비용과 결과를 평

가하지만, 이론적으로 정의된 사회적 관점에 비하여 그 영역 및 포괄성은 제한적이다.

다만, 보험 등재와 관련한 의사결정자의 판단을 돕기 위해 보험자 관점에 입각한 분석

결과를 추가로 제시하는 것을 선호한다.

나) 지침 내 추가 설명

현 지침에서는 초판 발행 당시 언급한 사회적 관점이 실제 기본분석에 포함하는 비용의

범위와 일치하지 않아 혼란을 야기하고 있는 점을 감안하여, 사회적 관점 앞에 제한적이라는

수식어를 붙였다. 물론 포함한 비용의 범위는 초판과 동일하다. 그러나 의사결정자의 주 관

심사가 보건의료 분야에 미칠 영향이라는 점을 생각하면 사회적 관점, 보건의료체계관점도

아닌 현재의 관점을 계속 유지할 것인지에 대한 검토가 필요하다.

2) 기존 제출자료 검토 결과

현재 적용되고 있는 지침이 제한적 관점을 표방하고 있고, 포함되는 비용 항목으로 직접

의료비용과 비의료비용을 모두 포함하고 있으나, 제출자료 중에서는 직접 비의료비용을 생략

하고 있는 경우가 많았다. 총 50건의 제출자료 중 교통비용을 포함한 건은 44건, 시간 비용

을 포함한 건은 16건, 간병비용을 포함한 건은 7건이었다(표 4).

교통비용 시간비용 간병비용

포함 44 16 7

포함하지 않음 6 34 43

계 50 50 50

<표 4> 교통비용, 시간비용, 간접비용 포함 여부에 따른 분류

....본 지침에서 “사회적 관점이지만 제한적”으로 용어를 명확히 한 것은 자료작성자에

게 불필요한 혼동을 줄이기 위해서이며, 결과적으로 초판과 비교하여 포함되는 항목이

변경되지는 않는다.

어떤 관점 하에서 분석을 수행하더라도 분석 전반에 걸쳐 일정한 관점을 유지해야 한다.

자료제출자가 보험자 관점에서 추가로 분석 결과를 제출하는 것은 바람직하다.

Page 31: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 23 -

교통비용을 제시한 경우 방문횟수는 주로 가정을 하거나 전문가 패널을 통해 도출하였고,

건당 교통비용은 2005년 국민건강영양조사 보고서를 참조한 후, 이에 통계청 교통부문 소비

자 물가지수를 적용하여 산출한 경우가 대부분이었다. 시간비용의 경우 2004년 건강보험심사

평가원 외래의료이용자 이용시간 조사 결과 혹은 2000년 국민보건의료실태조사를 활용하여

이용시간에 대한 정보를 구한 경우가 많았고, 시간당 임금으로는 대부분 노동부 고용형태별

근로실태조사보고서에 제시된 값을 사용하였다. 여기에 제출 건에 따라 통계청 자료를 통해

고용률을 곱한 경우가 있었다. 그 외 3기 국민건강영양조사보고서, 1차 한국의료패널조사 보

고서 등을 참조한 경우도 있었다. 간병비용을 제시한 경우 간병일수는 가정이나 다양한 자료

원을 참고하였고, 일당 간병비용은 간병협회에서 발표하는 간병료 자료를 인용하는 경우가

많았다. 세 항목의 산출 내역을 전체적으로 살펴보면, 자원 이용량과 단위 비용을 추정할만

한 직접적 자료가 없어, 기존의 조사 자료를 활용한 경우가 많았는데, 그마저도 최신의 조사

자료가 없어 과거 자료에 소비자 물가지수를 적용하여 현재 값을 구한 경우가 많았다. 대체

로 비용 추정 과정의 불확실성이 큰 편이라 할 수 있다.

3) 외국 지침

각국이 채택하는 평가 관점은 크게 보건의료관점과 사회적 관점으로 분류해볼 수 있다. 본

지침 개정과정에서 주요 참고자료로 활용하는 호주, 캐나다, 영국은 구체적 표현은 다르지만

모두 보건의료관점을 채택하고 있다고 볼 수 있다. 보건의료부문내에 발생하는 직접적 비용

과 환자/보호자에게 발생하는 건강 편익은 포함하고 있지만, 그 외 비용은 기본분석에 포함

하지 않는다. 물론 간병비용이나 정부 다른 분야에 발생하는 비용의 경우 그 크기를 측정하

여 별도 제시하도록 허용하고 있기는 하나, 기본 분석에는 포함하고 있지 않다. 그 외 국가

들 중에서는 네델란드나 스웨덴처럼 사회적 관점을 표방하며 생산성 손실까지 포함할 것을

명시한 국가도 있다. 주요 국가의 지침 내용은 다음과 같다.

가) 캐나다

캐나다는 공공재원 보건의료 지불자(Publicly funded health care payer) 관점을 채택하고

있다. 비용으로는 공공지불자에게 발생하는 비용, 성과로는 환자와 비공식 간병인의 모든 의

미있는 건강효과를 반영하도록 하고 있다. 또한 대상인구집단 밖에서 발생하는 파급

(spillover) 비용이나 효과가 있다면, 이를 non-reference case 분석으로 포함하도록 하고 있

다.

지침의 표 1에서는 채택 관점에 따른 비용과 성과의 예를 제시하고 있는데, 그 내용은 다

음과 같다.

Page 32: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 24 -

❍ 비용:

- 의약품, 의료기기(재료), 시술(Drugs, medical devices, procedures)

- 장비, 시설, 간접비(Equipment, facilities, overhead)

- 보건의료 제공자(Health care providers)

- 병원 서비스(Hospital services)

- 진단, 검사, 검진 서비스(Diagnostic, investigational, and screening services)

- 비공식 간병인의 보건의료비용(Informal caregivers’ health care costs)

- 시설 혹은 가정에서의 재활(Rehabilitation in a facility or at home)

- 홈케어나 사회적 지지와 같은 지역사회 기반 서비스(Community-based services, such as

home care, social support)

- 너싱홈에서의 장기요양(Long-term care in nursing home)

❍ 건강효과:

- 건강관련 삶의질(Health-related quality of life)

- 생존기간 연장(Life-years gained)

- 임상적 이환(Clinical morbidity)

나) 호주

호주는 보건의료체계 관점(Health system perspective)을 채택하고 있다. 호주 지침에서는

비용으로는 환자와 공공 혹은 민간 보건의료제공자에게 발생하는 모든 비용, 성과(outcome)

는 환자와 관련된 것들을 포함하도록 하고 있다. 또한 신청된 중재가 의약품을 제공받는 환

자의 건강성과와 보건의료체계를 넘어 중요한 사회적 함의를 가지고 있다면, 보충적 분석을

제시할 수 있다고도 언급하고 있다.

호주 지침에서 보건의료자원 항목으로 고려하라고 언급한 것들은 다음과 같다:

- 의약품(치료의 직접비용과 부작용을 치료하기 위한 의약품 비용)

- 시술을 포함한 의료서비스

- 병원 서비스

- 진단 및 검사 서비스

- 지역사회 기반 서비스

- 그 외 직접 의료비용

또한 호주에서는 비용 매뉴얼을 별도로 제시하고 있는데, 이에 포함된 항목들은 다음과 같

다.

Page 33: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 25 -

항목 포함되는 세부항목

Medicines, medicinal preparations or vaccines

proposed medicine, medicinal preparation or vaccinecomparator and co-prescribed medicines or medicinal

preparationsover-the-counter medicinesmedicine delivery systems

medicine administration costsMedicinal services, including investigative,

diagnostic and allied health services

Hospital servicesadmitted patient servicesnonadmitted hospital care

emergency department services

Community-based services

residential carehome care

home nursingambulance services

other community-based services

<표 5> 호주 비용 매뉴얼에 포함된 항목

다) 영국

영국은 NHS와 개인·사회서비스 관점(NHS and personal and social service; NHS and PSS)

을 채택하고 있다. NHS와 PSS 이외 부문에 발생하는 비용은 사전에 보건부가 그 비용을 포

함하기로 결정하였다면 non-reference case analysis로 제시할 수 있으나, 평가 방법이 명료

하게 제시되어야 한다. 그리고 이들 비용은 NHS와 PSS비용과 구별하여 제시되어야 하며 점

증적 비용-효과비(incremental cost-effectiveness ration; ICER)에는 포함하지 않는다.

환자가 부담하는 비용의 경우 이 비용이 NHS나 PSS에 의해 상환될 경우에는 포함할 수

있으며 상환율이 지역간, 환자 간에 차이가 있을 때는 평균값을 사용한다. NHS나 PSS에 의

해 상환되지 않는 환자 부담 비용이 있다면 이들 비용은 별개로 제시되어야 한다. 생산성비

용은 배제한다.

가족간병의 경우, 가족이 아니었으면 NHS나 PSS가 해당 서비스를 제공하였을 것이라면 간

병에 소요되는 시간비용을 고려할 수 있다. 다만 기본분석과는 별개로 해당 항목을 제시하여

야 한다. 그리고 선택한 가치평가(valuation) 방법은 분명히 기술하고, 선택한 방법과 다른 방

법을 이용한 결과도 민감도 분석으로 제시하여야 한다.

라) 기타 지침

EUnetHTA (2015)가 발표한 권고안은 파트너 국가들간 경제성평가의 이전 가능성을 높이기

위한 목적으로 만들어진 것으로, 파트너 국가들의 경제성평가 지침을 분석하여 공통 권고안

을 제시하고 있다. EUnetHTA 보고서를 보면 유럽국가들의 경우에는 보건의료체계 관점을

Page 34: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 26 -

채택한 국가도 있고, 사회적 관점을 취한 국가도 있다. EUnetHTA에서는 국가별로 채택한 관

점이 상이함을 보인 뒤, 경제성평가는 최소한 보건의료관점에서 수행되어야 한다는 점을 강

조하였다. 또한 보건의료를 넘어 사회 다른 부분에서 발생하는 비용의 경우 보충적 분석 형

태로 제시함으로써 서로 다른 관점을 채택한 국가들에서 유용하게 활용될 수 있도록 할 필

요가 있다고 조언한다. 그리고 주어진 관점하에서 자원 사용에 대한 정보는 가능한 한 상세

하게 제시할 것을 권고하고 있다.

<표 6> EUnetHTA 파트너 국가 분석 : 비용과 결과의 관점

국가 비용에 대한 관점 결과에 대한 관점

오스트리아The choice of perspective must be

justified. The choice of perspective must be

justified.

벨기에 Health care payers Effects on patients primarily

크로아티아Perspective of the Croatian Institute for Health Insurance (public payer)

All health effects on individuals. Health effects in informal

caregivers and/or family members can be reported separately

체코 Health care payers Na

덴마크 Socio-economic perspective Na

영국(England)The NHS and personal social

services

All direct health effects, whether for patients or where relevant for

caregivers

에스토니아 & 라트비아 Health care Na

핀란드 Societal Na

프랑스Collective perspective. All the

resources used in the production of interventions.

Collective perspective. All the health effects relevant of the individuals concerned (patients,

informal carers, general population)

독일SHI insurants primarily according to

Social Code SHI insurant primarily according to

Social Code

헝가리 Na Na

아일랜드The perspective of the

publicly-funded health and social care system

All health benefits accruing to individuals

이탈리아 Health care Effects on patients primarily

네덜란드 Societal Societal

노르웨이 Societal Societal

폴란드Two variants are required: Public

health care payer and public health care payer and the patient.

The patients. Societal perspective (health effects to other members of

the society) in specific cases

포르투갈Societal. This means considering the costs for the patient, for his or her family and also for third parties, i.e.

Societal. This means considering the consequences for the patient, for his or her family and also for third

Page 35: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 27 -

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, the perspective should be that of the publicly funded health care payer. The perspective of the economic evaluation

should be related to the decision problem. (p18)

공공 보건의료지불자(publicly

funded health care payer)

호주 The PBAC’s preferred health care system perspective includes health

<표 7> 분석관점 관련 해외 지침 내용

국가 비용에 대한 관점 결과에 대한 관점

public and private payers in particular. Society’s perspective should be broken down into other

relevant points of view, with special attention to the third payers if they

are the users of the study.

parties, i.e. public and private payers in particular. Society’s

perspective should be broken down into other relevant points of view, with special attention to the third payers if they are the users of the

study.

러시아

No priority for any perspective; it is only recommended that

researchers declare clearly the perspective of the study (any:

societal, healthcare, etc). For drugs submitted into the lists either

societal or health care perspective are recommended.

No priority for any perspective; it is only recommended that

researchers declare clearly the perspective of the study (any:

societal, healthcare, etc). For drugs submitted into the lists either

societal or health care perspective are recommended

영국(Scotland)

A healthcare perspective is required, but a societal perspective can be explored through sensitivity

analysis

A healthcare perspective is required, but a societal perspective

including effects on other individuals than patients (principally carers) can be explored through

sensitivity analysis

슬로바키아 Health care payers Societal

슬로베니아Health insurance; societal

perspective can be performed as well

Patients only

스페인

Societal and third-party National Health System (NHS) Societal and

that of the decision-maker (OSTEBA) The perspective of the financer – CATSALUT and as a

complement a societal perspective (CATSALUT)

Societal and third-party National Health System (NHS) Societal and

that of the decision-maker (OSTEBA) The perspective of the financer – CATSALUT and as a

complement a societal perspective (CATSALUT)

스웨덴 Societal Societal

스위스 Health care Only health effects on patients (not

utility) 출처: EUnetHTA (2015a)

Na: No information available, NHS: National health service, SHI: Social health insurance

Page 36: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 28 -

4) 기타 문헌고찰 결과

국내에서는 한국보건의료원이 발간한 비용산출 매뉴얼인 ‘보건의료분야에서 비용산출방

법’(김윤희 등, 2013)에서 분석관점을 보험자관점, 보건의료체계관점, 사회적관점으로 분류

하고 각 관점하에 포함되는 비용항목을 제시하였다. 눈에 띄는 것은 보건의료체계관점을 채

택하였을 때 포함되는 비용으로 시간비용, 교통비용뿐 아니라 비공식적 간병비용까지 비의료

비용으로 포함한 점이다. 결과적으로 이 분류는 현재 경제성평가지침이 채택하고 있는 제한

적 사회적 관점과 일치한다.

보험자 관점 보건의료체계관점 사회적 관점

의료비용

공식적 의료비용급여내 보험자부담비용

급여내 본인부담비용(비급여본

인부담비용)

공식적 의료비용급여내 보험자부담비용

급여내 본인부담비용(비급여본

인부담비용)비공식적 의료비용

공식적 의료비용급여내 보험자부담비용

급여내 본인부담비용(비급여본

인부담비용)비공식적 의료비용

비 의료비용

교통비용환자비용

장기요양서비스 비용간병비용

교통비용환자비용

장기요양서비스 비용간병비용

생산성 손실비용이환비용

조기사망비용

<표 8> 분석관점별 비용 항목

자료원: 김윤희 등(2013), 보건의료분야에서 비용산출방법, 한국보건의료연구원.

PBAC 지침

version 5(2016)

and health-related resource use (costs and cost offsets), and health-related outcomes. Costs include those incurred by the patient, and the public or private health care provider; outcomes are those associated with the patient. Do not include costs and outcomes that are not specifically

related to ‘health and/or provision of health care’ in the base case (p.65)

보건의료체계관점

영국 NICE 지침 (2013)

For the reference case, the perspective on outcomes should be all direct health effects, whether for patients or other people. The perspective adopted on costs should be that of the NHS and personal and social

services. (p34)

NHS and personal and social services

관점

EUnetHTA (2015)

the economic evaluations should at minimum be conducted from a health care perspective. However, several countries recommend a societal

perspective. Thus, presenting resource use related to other sectors of society in complementary analysis may increase the usefulness of an evaluation to other countries. Within the chosen perspective(s), it is recommended to present the resource use in as detailed a manner as

possible

Page 37: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 29 -

Zhao et al. (2018)의 가이드라인 분석결과에 의하면 14종의 가이드라인에서 사회적 관점을

권장하였고, 19종이 보건의료관점을 권장하였다. 앞서 살펴본 영국, 호주, 캐나다는 모두 보

건의료체계 관점을 채택하고 있고, 사회적 관점을 채택한 대표적 국가는 네덜란드와 스웨덴

이다. 사회적 관점을 채택하는 경우 생산성 손실과 미래 보건의료비용이 비용항목으로 포함

된다.

Neumann (2009)은 Tufts Medical Center의 CEA Registry를 분석하여, 발표된 비용-효과분

석 연구에 사용된 관점을 분석하였는데, 분석결과 발표된 연구들의 비용추정방법에 상당한

변이가 존재하였음을 확인하였다. 많은 연구자들이 그들의 연구가 사회적 관점을 취하고 있

다고 주장하지만, 실제로는 보건의료지불자 관점으로 분석을 진행한 것을 확인할 수 있었다

고 한다.

<표 9> 발표된 CUA 연구에 사용된 관점(1976-2005년)

자료원: Neumann (2009)

US panel on CEA가 발간한 지침의 1판에서는 사회적 관점을 권고하였으나, 개정판인 2판

에서는 보건의료체계관점과 사회적 관점을 모두 권고하고 있다(Neumann et al., 2017). 다수

연구가 실용적 이유로 보건의료체계 관점을 채택함을 감안한 것이다. 여기서 보건의료체계관

점으로 분석한다고 함은 보건의료 부문에 발생하는 비용만을 포함한다는 것으로 제3지불자

나 환자의 본인부담으로 지출하는 의료비용을 모두 포함한다. 사회적 관점하에서 분석하는

경우는 impact inventory를 작성하라고 권고하고 있는데, 이는 중재의 건강, 비건강 영향을

모두 나열한 것이다.

5) 이해관계자 의견

☐ 의견조사 결과

❍ 제약사 의견

- 질환의 특성에 따라 보호자의 간병 및 보호가 필수적인 경우 이를 폭넓게 인정하여야

한다는 의견이 개진되었다.

As stated by author As stated by reviewer

Societal 473 (40.6%) 341 (29.3%)

Health care payer 382 (32.8%) 799 (68.6%)

Not stated/could not be determined

298 (25.6%) 16 (1.4%)

Other 11 (0.9%) 8 (0.7%)

Total 1164 1164

Page 38: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 30 -

- 다만 관점 자체를 사회적 관점으로 변경하자는 의견보다는 질병 특성에 따라 유동적으

로 평가에 포함할 범위를 결정할 수 있도록 하자는 의견이었다. 특히 질병으로 인한 생

산성손실비용이 큰 경우 경제성평가 모델에 이를 반영하도록 하자는 의견이 제시되었

다.

❍ 연구자 의견조사

- 연구자 의견조사에서는 사회적 관점으로 확대하자는 의견보다 현재 사용하고 있는 제한

적 사회적 관점대신 보건의료체계관점으로 변경하자는 의견이 제시되었다.

- 그 이유로는 제한적 사회적 관점보다는 보건의료체계관점이 보다 널리 통용되는 용어라

는 점에서 변경 의견을 제시한 경우도 있었고, 제한적 사회적 관점에서 다뤄지는 교통

비, 시간비용 등이 불확실성이 크므로 Health Care Sector를 기본으로 하고 Societal 또는

제한적 사회적 관점을 추가적으로 제시하도록 하자는 의견도 있었다.

☐ 자문회의

- ‘제한적 사회적 관점’이란 용어가 널리 통용되는 용어가 아니므로 명칭 변경이 필요

하다는 의견이 있었다.

- 그러나 비의료비용을 제외하는 것에 대해서는 일부 반대하는 의견도 있었다.

- 또한 보험자 관점과 비급여비용의 처리에 대한 고민이 필요하다는 의견도 있었다.

6) 지침 개정방향 제언

❍ 건강보험급여결정이라는 의사결정 상황과 현실 여건을 고려하여 분석관점을 개정할

필요가 있다.

- 건강보험 급여결정자의 관심은 의사결정이 보건의료분야에 미칠 영향일 것인바, 보건의

료분야 외 분야에서 발생하는 영향은 일차적 관심 대상이 아니다.

- 기존에 제출된 평가 건들에서는 직접 비의료비용을 포함한 경우도 있었지만, 포함하지

않은 경우도 많아, 평가의 일관성 측면에서 재검토가 필요하다. 또한 이들 항목의 경우

사용량 등을 뒷받침할 수 있는 근거도 부족하여 불확실성 측면에서도 문제가 될 수 있

다.

❍ 이에 1안으로는 기존 제한적 사회적 관점을 보건의료체계관점으로 변경하면서 직접

비의료비용에 해당하는 항목을 기본분석에서 제외할 것을 제안한다.

- 비용은 직접 의료비용 중심으로 포함하되, 간병의 경우 공식부문인 장기요양보험에서

급여가 되는 경우라면 포함하는 것으로 하며, 효과는 환자에게 나타나는 건강편익을 반

영하는 것으로 한다.

Page 39: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 31 -

- 현 지침과 비교하면, 교통비용, 시간비용, 보호자 간병비용 등이 기본분석에서 제외된다.

- 다만 질환이나 치료법의 종류에 따라 비의료비용의 비중이 큰 경우는, 생산성손실비용

과 마찬가지로 이들 비용 또한 별도 자료로 제시하도록 한다.

❍ 2안은 현 지침을 유지하는 안이다.

Page 40: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 32 -

나. 분석기간

1) 현 지침

가) 주요 지침

나) 지침 내 추가 설명

...일반적으로 경제성평가를 위한 분석기간은 주요한 임상결과들을 확인할 수 있을 정도

로 충분히 긴 것이 좋다. 질병의 발생과 진행, 종결이 짧은 기간에 이루어지는 급성기 질

병의 경우에는 최종 결과를 임상시험 기간 내에 확인할 수 있으나, 그렇지 않은 질병의

경우에는 보통 임상시험 기간 내에 질병의 경과가 완료되지 않는 경우가 많다. 이 경우

모형구축을 통해 임상시험 기간 이후의 경과를 추정하기도 하는데 질병에 따라서는 환자

의 생존기간 내내 경과를 추적하여야 할 수도 있다. 그러나 분석기간을 확장할수록 불확

실성 역시 함께 커지는 문제점이 있는 바, 관찰기간이 원 자료보다 길어질 경우에는 외

삽하기 전의 원자료에 기초한 분석 결과를 추가로 제출하는 것을 권장한다. 이때 외삽한

결과와의 차이를 분석하고, 기술할 것을 권장한다.

현지침에서는 주요 임상경과를 확인할 수 있을 정도로 분석기간을 충분히 길게 할 것을

권고하고 있다. 다만, 외삽을 통해 분석기간이 길어질수록 불확실성이 커지는 것을 고려하여

관찰기간이 원 자료보다 길어질 경우에는 외삽하기 전의 원자료에 기초한 분석 결과를 추가

로 제출하는 것을 권장하고 있다. 그러나 여전히 분석 기간을 둘러싼 논란이 지속되고 있으

며, 외삽기간이 길어질수록 불확실성이 커지는 문제도 제기되고 있는 바, 분석기간 설정시

고려할 요소 등에 대한 좀 더 구체적인 지침 제시가 필요하다.

2) 기존 제출자료 검토 결과

☐ 제출자료에서 확인된 경향

대부분의 제출자료는 대상 환자의 대부분이 사망하는 기간을 분석기간으로 선택하였으며,

구체적인 기간 산정 방법은 해당 연령대의 기대여명을 고려하거나, 모형을 분석하여 신청약

군 혹은 대조약군에 포함된 환자의 00%가 생존하는 시점을 고려하는 등 다양하였다.

분석 기간은 주요한 임상 결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장한다.

모형 구축이 필요한 경우에는 분석결과와 함께 모형이 필요한 이유와 모형의 구조 등에

대한 상세한 설명을 제시한다. 만약 모형을 이용하여 장기간 외삽한 경우에는 원자료에

기초한 분석결과를 별도로 제출하는 것을 권장한다.

Page 41: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 33 -

지침에서는 관찰기간이 원 자료보다 길어질 경우에는 외삽하기 전의 원자료에 기초한 분

석결과를 추가로 제출하는 것을 권장한다고 하였으나, 실제 원자료에 기초한 분석결과를 제

출한 경우는 매우 드물었다. 명시적으로 관찰기간 동안의 자료로 민감도 분석을 한 건은 2건

에 불과하였으며, 대부분 기본분석에 사용된 기간의 전후로 일정한 간격을 두어 민감도 분석

을 하였다. 일부 1~3년을 분석기간으로 한 민감도 분석결과를 제시한 경우도 있었으나, 관찰

자료를 바탕으로 민감도분석을 하였다기보다 모델 분석기간을 다양하게 한다는 차원에서 결

과가 제시되었다.

상대적으로 짧은 분석기간을 선택한 경우는 통증경감이나 증상소실 등 비교적 단기간에

관찰 가능한 사건들을 주요 결과지표로 사용한 경우, 혹은 잔존 기대여명 자체가 짧은 경우

였다.

분석기간을 설정함에 있어 그 근거로 제시된 자료는 질병역학, 임상연구, 전문가 의견 등

다양하였는데, 대표적 예는 다음과 같다.

- 신청약의 임상연구(생존율, 평균연령, 생존차이) - 연장연구 포함

- 역학자료: 발병연령, 질환 5년/10년 생존율, 자연사망 등을 고려한 대상환자 기대여명

- 모형에서 추정된 생존율, 임상전문가 의견

☐ 개별 심의사례

❍ 신청약과 비교약의 분석기간을 각각 다르게 설정한 경우

- 분석기간을 ‘생애기간’으로 설정하되, 생애기간은 ‘모형에서 95%가 사망할 때까

지’로 정의한 경우가 있었다. 이처럼 분석기간을 모형 내에서 사망률이 일정 %가 될

때까지로 정할 경우, 신청약과 비교약의 추적기간에 차이가 발생한다. 즉, 동일한 시점

에 생존한 환자라 할지라도, 비교군에서 여명이 더 짧게 반영되는 문제점이 있다. 이 건

에 대해 경평소위에서는 신청약과 비교약의 분석기간을 다르게 설정하는 것은 타당하지

않으며, 사망률이 더 빠르게 감소하는 비교약을 기준으로 분석기간을 정하는 보수적 접

근을 선호한다는 의견을 제출하였다.

❍ 생존곡선이 만난 경우

- A약의 경우 제출된 분석결과에서는 비교약제 대비 14년 동안 지속적인 OS gain이 있는

것으로 추정하고 있으나, 경평소위에서는 36개월 시점에서 두 군의 생존곡선이 만나는

점이나 대상질환의 생존기간 등을 고려 시 효과가 과대추정되었을 가능성이 있음을 우

려하였다. 이에 경평소위에서는 두 군의 생존곡선이 만난 이후에도 치료효과가 동일하

다는 가정(hazard ratio=1)을 적용하여 분석하거나, 생존곡선이 만난 시점까지의 효과를

반영한 자료 제출이 필요하다고 권고하였다.

❍ 기대여명에 대한 판단

Page 42: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 34 -

- B약은 특발성폐섬유증 치료제로 위약 대비 분석에서 분석기간을 19년으로 설정하였다.

이는 해당 환자들의 평균연령에서의 기대여명을 근거로 한 것이다. 그러나 경평소위에

서는 특발성 폐섬유화증 환자의 기대여명이 일반 인구와 동일한 것이라는 근거가 충분

치 않음을 들어 분석기간을 이보다 단기간으로 할 것을 권고하였다 => 최종적으로 임상

연구 추적기간보다는 장기간이며 일반인의 기대 여명보다는 단기간에 해당하는 15년을

기본 분석기간으로 채택하였다.

❍ 임상전문가 의견 고려

- C치료제의 경우 만성질환인 다발성경화증의 (i) 질병특성을 반영하고, (ii) 임상시험 자료

의 외삽에 따른 불확실성을 낮추기 위해, 20년을 기본 분석기간으로 설정하였다. 그러나

경평소위에서는 기대여명에 대한 임상전문가 의견과 임상시험 참가자의 평균연령을 감

안하여 SOT군은 25년, RES군은 30년을 분석하는 것으로 하였다.

❍ 자료의 불확실성을 문제 삼은 경우

- D치료제는 ‘국소 스테로이드 치료에 반응하지 않는 성인 재발성 만성 중증 손습진

(PGA로 평가)’ 환자를 대상으로 하며, 분석기간을 10년으로 설정하였다. 그러나 경평소

위에서는 모형에 사용된 가정이 본 분석결과에 미치는 영향을 확인할 수 없으며, 임상시

험 기간 이후의 관찰자료가 부재한 바, 분석기간을 임상 자료원에 근거한 기간으로 변경

함이 타당하다는 의견을 제출하였다.

❍ 유사질환에 대한 심의사례

- 유사질환에 사용된 약제의 경우 분석기간 설정에 있어 기심의 사례를 참고하였는데, 대

표적 예는 다음 <표 10>과 같다

<표 10> 유사질환 심의사례

약품 L 약품 M 약품 O

적응증(비소세포폐

암)

이전 백금 기반 화학요법에 실패한stage ⅢB 이상

이전 EGFR-TKI 투여 후 질병 진행된 국소 진행성 또는

전이성

제외국 평가결과

5년(호주, 캐나다)20년, end of life (영국)

5년(캐나다)20년, end of life (영국)

5년(캐나다), 15년, end of life (영국)

임상시험 결과

(신청품)

(비평편세포암)mOS: 19.9개월 mPFS: 5개월

mOS: 15.8개월 mPFS: 5.2개월

mPFS: 10.4개월

경평모형의 신청품 사망률

(7년 기준)편평세포암 95.2%비편평세포암 83.1%

(7년 기준)90.8%

-

Page 43: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 35 -

☐ 심의사례 종합

기존 사례를 종합하자면 대체로 다음과 같은 요소가 분석기간 산정에 고려되었음을 알 수

있다: 환자연령(코호트 진입 연령), 일반인구집단의 기대여명, 해당 질환자의 생존율, 유사 약

제의 분석기간, 임상시험 성적(median OS), 추적관찰기간, 임상자문, 불확실성

3) 외국 지침

외국 지침들도 분석기간은 비교대안들간의 차이를 포착할 수 있을만큼 충분히 길어야 한

다는 점을 공통적으로 언급하고 있다. 다만, 외삽기간이 길어짐에 따른 불확실성을 어떻게

볼 것인지에 대한 지침이 날로 구체화되어 가고 있다.

가) 캐나다

비교대상이 되는 중재안들과 관련된 모든 미래 비용과 성과를 포착할 수 있을 만큼 분석

기간이 충분히 길어야 한다고 명시하고 있다. 그러나 QALY 증가분의 상당 부분이 치료 중단

이후에 발생했다면 분석기간과 관련한 불확실성에 대해서도 논의하라고 언급하고 있다.

나) 호주

호주의 지침 또한 다른 국가와 기본 원칙은 다르지 않으나, 분석기간 연장에 대해 주의를

환기하는 내용이 많이 포함되어 있다. 지침에서는 중재안과 비교대안 간의 비용과 성과 면에

서의 모든 중요한 차이를 포착할 수 있게끔 분석기간을 설정하라고 명시하고 있다. 그러나

불필요하게 분석기간을 확장하지는 말라는 점도 강조하고 있는데, 분석기간이 매우 길고, 외

삽된 편익이 차지하는 비중이 커지면 그만큼 불확실성이 커지게 되고, 이 경우 PBAC는 그

결과에 대해 확신을 가지지 못할 가능성이 있다는 점을 언급하고 있다.

경평소위회의결과(7년)

기본분석으로 제시된 분석기간 7년과 관련, 1상 시험에서 최대

7년까지 관찰된 자료가 추가로 제시되었으며,

기심의 유사약제 사례와 경제성평가 모형에서 7년 시점의 생존율 등을 고려 시

수용 가능함.

제약사의 추가 근거자료 및 동시 심의 약제의

근거자료를 토대로 한 재논의에서 신청품보다

상대적으로 관찰기간이 긴 자료가 제출된 동일 기전 약제와 신청품의 3상 시험 동일 관찰기간에서 생존 효과가 유사한 경향을 보이는 점 및 기심의

유사약제 사례 분석기간 등을 고려하여, 분석기간을

7년까지 인정 가능함.

신청품은 오히려 OS에 대하여 관찰된 임상 자료가 부족하여 상대적으로 이후의 효과가

불확실하다는 제한점이 있으나 임상 전문가 자문회의에서 1차 치료제의 5년 생존율 등을

바탕으로 신청품 효과 추정 시 분석 기간으로 7년 정도가 적절하다는 의견 및 기심의 약제들과 대상환자의 상태가 유사한 점을 고려하여 7년을

기본분석으로 함.

Page 44: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 36 -

그 외 중재안이 사망에 영향을 미치지 않고 일시적인 건강 개선, 삶의 질 개선 효과만을

보일 뿐이라면, 상대적으로 짧은 분석기간이 적절하다는 언급도 하고 있다. 또한 현실적이지

않은 투입자료(inputs)들은 현실적이지 않은 분석기간으로 이어질 것인바, 최종 분석기간에

도달하기까지 모형이 어떻게 곡선을 외삽하였는지를 포함하여 분석기간의 타당도(plausibility)

에 대한 평가가 필요하다는 점도 강조한다.

다) 영국

지침에서는 분석기간은 비용과 효과 면에서 비교 대상인 기술들의 모든 중요한 차이를 반

영할 수 있을 만큼 충분히 길어야 한다고 명시하고 있다.

그러나 관찰기간 이후로 자료를 외삽하는 경우 ‘차이’가 발생하는 기간이나 ‘차이’의

크기에 있어 불확실성이 커진다. 특히 외삽된 편익의 크기가 총 편익의 상당부분을 차지하는

경우라면 불확실성의 문제는 더욱 중요해진다. 이 경우 질병의 자연사(역학자료, 환자들의 생

존기간), 환자 연령, 일반 인구집단의 기대여명, 유사 의료기술과의 비교(유사 약제의 분석기

간), 임상시험 성적, 그 외 분석기간을 뒷받침하는 근거 등을 고려하여 기본분석에 사용할 분

석기간을 결정하고, 분석기간을 달리하여 민감도 분석을 실시하라고 제시하고 있다.

위원회 심의 시에는 기심의 사례 등을 검토한다. 이때 임상시험 기간 동안 직접 관찰한 자

료에 기초한 민감도 분석결과도 함께 제시한다. 자료를 관찰 기간 이후로 외삽할 때에는 효

과의 지속과 관련한 서로 다른 가정에 기초한 민감도 분석결과를 제시한다. 치료 중단 이후

효과 지속에 대한 가정으로는 이 전의 효과 차가 지속된다는 가정, 치료 중단 이후 효과 차

가 점차 줄어든다는 가정, 치료 중단과 더불어 효과 차가 더이상 발생하지 않는다는 가정에

대해 각각 민감도 분석을 실시한다. 특히 치료 중단 이후 더 이상 효과 차를 인정하지 않는

가정을 포함하여 분석결과를 제출하도록 하고 있다.

라) 기타 지침

유럽국가들의 가이드라인을 고찰하여 공통 권고안을 마련한 EUnetHTA (2015)의 문서에 의

하면 25개국중 18개국의 가이드라인에서 분석기간은 비용과 결과에서의 중요한 차이를 발견

할 수 있을만큼 충분히 길어야 한다고 권고하고 있다. 그러나 민감도 분석을 통해 다양한 기

간에 대한 분석결과를 제시할 것을 주문한 경우도 있었는데, 예를 들어 스코틀랜드의 가이드

라인에서는 관찰기간이 종료된 시점, 5년이 지난 시점, 그 이후 5년 간격으로 분석결과를 제

시하는 안을 언급하고 있다. 독일은 다른 국가와는 달랐는데, 독일은 질병의 성격에 따라 적

절한 분석기간이 선정될 수 있지만, 최소한 RCT의 기간으로 하여야 한다고 언급하고 있다.

최근 의견수렴 중에 있는 EUnetHTA의 ‘경제성평가시 고려사항(practical considerations

when critically assessing economic evaluations)’에서는 외삽된 결과의 불확실성에 주목하며,

Page 45: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 37 -

분석기간과 관련하여 다음과 같은 점들을 고려할 것을 주문하고 있다.

- 비용과 효과를 모델링하는 기간은 동일하여야 한다.

- 분석기간은 현실적인 요소(장기 자료, 질병의 자연사)를 고려하여 결정되어야 하고, 시

뮬레이션에만 기초하여 결정되어서는 안 된다. 시뮬레이션을 통해 얻어진 생애 분석기

간은 그 타당성(plausibility)을 입증하여야 한다.

- 파라미터들이 실제로는 시뮬레이션 기간에 걸쳐 변화할 수 있지만, 전체 분석기간에 걸

쳐 고정된 값을 적용하는 경우가 있다. 이러한 단순화를 통해서는 지금 아는 것에 대한

불확실성 분석은 가능하지만, 우리가 알지 못하는 미래사건에 대한 불확실성 분석은 가

능하지 않다

<표 11> EUnetHTA 파트너 국가 분석: 분석기간

국가 선호하는 분석기간

오스트리아 Choice of time horizon depends on research question and study subject

벨기에 Sufficiently long to reflect all important differences in costs and outcomes

크로아티아 Sufficiently long to reflect all important differences in costs and outcomes

체코 Sufficiently long to reflect all important differences in costs and outcomes

덴마크 Sufficiently long to reflect all important differences in costs and outcomes

영국(England) Sufficiently long to reflect all important differences in costs and outcomes

에스토니아 & 라트비아

Not indicated, but it is stated that “…modelling techniques can be applied when trial data provide too short a time frame…”

핀란드 Sufficiently long to reflect all important differences in costs and outcomes

프랑스 Sufficiently long to reflect all important differences in costs and outcomes

독일At least length of RCTs, yet the appropriate time horizon depend on the nature of

the disease

헝가리 Sufficiently long to reflect all important differences in costs and outcomes

아일랜드 Sufficiently long to reflect all important differences in costs and outcomes

이탈리아 Sufficiently long to reflect all important differences in costs and outcomes

네덜란드 Sufficiently long to reflect all important differences in costs and outcomes

노르웨이 Sufficiently long to reflect all important differences in costs and outcomes

폴란드 Sufficiently long to reflect all important differences in costs and outcomes

포르투갈 Sufficiently long to reflect all important differences in costs and outcomes

러시아 Na

영국(Scotland)

Sufficiently long to reflect all important differences in costs and outcomes. Results (in net cost per QALY gained) should also be reported at different time horizon intervals e.g. at end of study follow-up, at 5 years follow-up and at 5-year

intervals thereafter

슬로바키아 Sufficiently long to reflect all important differences or 5 years

슬로베니아 Time horizon must be specified in economic analysis

Page 46: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 38 -

가이드라인 그 자체로는 분석기간에 대해 비슷한 지침을 제시하고 있지만, 실제로는 동일

한 약이 서로 다른 국가에서 서로 다른 분석기간으로 심의된 것을 확인할 수 있다. 물론 제

약사가 자발적으로 서로 다른 분석기간을 제시한 것인지, 아니면 심의 기관에서 다른 분석기

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, the time horizon should be long enough to capture all relevant differences in the future costs and outcomes associated with the interventions being compared.

(p18)

미래 비용과 결과의 차이를 포착할 수 있을만큼 충분히 길어야 한다.

호주PBAC 지침

version 5(2016)

…the time horizon captures all important differences in costs and outcomes between the intervention and the comparator,

…but does not extend unnecessarily beyond this.... The assessment of plausibility should also apply to how the model

extrapolates the curves to reach this time horizon As a modelled time horizon extends – in absolute terms and relative to available data – it is associated with increasing inherent uncertainty. Therefore, economic claims based on models with very extended time horizons and predominantly

extrapolated benefits will be less certain and are likely to be less convincing to the PBAC. (p68)

분석기간은 중재안과 비교대안 사이의

비용과 결과의 중요한 차이를 포착할 수

있어야 함관찰기간 너머로 효과를 외삽할 때 불확실성이 커질 수

있음을 명시

영국 NICE 지침 (2013)

…should be sufficiently long to reflect all important differences in costs or outcomes between the technologies being compared .... When the impact of treatment beyond the results of the clinical trials is estimated, analyses that compare several

alternative scenarios reflecting different assumptions about future treatment effects using different statistical models are desirable.

These should include assuming that the treatment does not provide further benefit beyond the treatment period as well as

more optimistic assumptions.. (p35)

비교대안들간의 비용과 결과의 중요한 차이를 반영할 수 있을만큼 충분히

길어야 함.관찰기간 이후로

외삽할 때 외삽가정을 달리한 분석결과를

제시

EUnetHTA (2015)

it is recommended that the time horizon for the reference case analysis should be sufficiently long to reflect all relevant

differences in costs or outcomes between the technologies being compared. The choice concerning any alternative time horizon for the reference case analysis should be clearly justified and

described.

비교대안들간의 비용과 결과의 차이를 반영할 수 있을만큼 충분히 길어야 함

<표 12> 분석기간 관련 해외 지침 내용

스페인

Sufficiently long to reflect all important differences in costs and outcomes (Spanish recommendations, CatSalut) A shorter horizon which only includes primary data and

a longer horizon that includes modelling (Osteba) It is recommended to do a complimentary analysis with a time perspective of 3-5 years (CatSalut)

스웨덴 Sufficiently long to reflect all important differences in costs and outcomes

스위스 Na

출처: EUnetHTA (2015a) Na: No information available, RCT: randomized controlled trial

Page 47: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 39 -

간을 요구한 것인지는 분명치 않으나, 이러한 차이는 불확실성에 대한 각 국가의 태도와 관

련된 것으로 보인다. 표 10을 보면 같은 약에 대해 호주, 캐나다, 영국이 최종 선택한 분석기

간이 다른 것을 확인할 수 있다.

4) 기타 문헌고찰 결과

기존의 교과서나 연구논문에서는 비용-효과분석의 분석기간은 대안들 사이의 비용과 효과

면에서 의미있는 차이를 포착할 수 있을 만큼 충분히 길어야 하며, 많은 경우 이 기간은

lifetime일 수 있다고 설명한다(O’Mahony et al., 2015; Drummond et al., 2015; Neumann et

al., 2017).

Kim et al. (2017)은 2005년에서 2014년 사이, Tufts Medical Center CEA Registry와 미국에

서 이루어진 지불자 관점을 사용한 비용-효과분석들에 대한 체계적 고찰을 통해, 연구특성과

분석기간 간의 연관성을 살펴보았다. 각 연구들을 분석기간이 5년 이하인지, 초과인지에 따

라 단기와 장기로 구분하여 살펴본 결과 2013–2014년 사이에는 대상 연구의 40%(235건 중

94건)가 단기 혹은 복수의 분석기간을 채택하였다. 반면, 2013년 이전에는 단지 25%만이 단

기 관점(547건 중 135건)을 채택하였다. 그리고 진단이나 예방접종, 검진과 같은 중재들을 평

가한 연구는 압도적 다수(90%)가 장기 분석기간을 채택한 반면, 시술이나 기기, 수술을 평가

한 연구의 경우 64%가 5년을 초과하는 분석기간을 사용하였다.

단기와 장기의 분석기간을 모두 보고한 연구들을 분석한 결과, 다수 연구에서 분석기간이

길어질수록 비용효과비가 낮아지는, 즉 더 비용효과적인 결과를 보인 것으로 나타났다, 저자

들은 분석기간을 연장할수록 비용효과비가 좋아지는 경향이 나타나는 것은 비용은 초기에

집중적으로 발생하고, 건강 편익은 점차적으로 발생하는 중재의 전형적 특성 때문인 것으로

해석하였다. 그리고 단기 분석기간을 채택한 이유를 관찰 범위 너머의 결과에 대한 정보 부

족 때문으로 보았다. 그러나 저자들은 분석기간의 연장이 비용효과비에 상당한 영향을 미칠

경우, 민감도분석으로라도 장기 분석결과를 제시하여, ICER이 분석기간에 얼마나 영향을 받

는지, 그리고 분석기간을 연장할 때 사용되는 외삽 가정에 얼마나 의존적인지를 보여줄 필요

가 있다고 주장하였다.

5) 이해관계자 의견

☐ 제약사 의견조사

- 제약사별로 공통된 의견이 제출되지는 않았다. 다만 개별적으로 제출된 의견을 보면,

- 유사 약제의 경제성평가 자료에서 설정한 기간이 있다고 해서 신청약제에 타당하지 않

Page 48: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 40 -

은 긴 기간을 설정하는 것은 타당하지 않다. 경제성평가 모형 및 질환의 일반적인 경과

를 고려하여 해당 약제에 타당한 분석기간을 설정하도록 하여야 한다.

- lifetime 분석을 기본분석으로 하고, 민감도분석으로 역학자료를 참고한 분석을 수행하

도록 하자.

☐ 연구자 의견조사 & 전문가 자문회의

- 연구자들은 좀 더 구체적인 지침이 필요하다는 의견을 제시하였다. 현 지침에서는 “주

요 임상결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장”하고 있으나, 실제 검

토 과정에서 더 짧은 분석기간을 요구하는 경우도 있는 바, 좀 더 구체적인 지침을 제시

하는 것이 바람직하다는 의견이었다. 특히 ‘충분히 길게’라는 표현에 대한 재검토가

필요하다는 의견이었다.

6) 지침 개정방향 제언

❍ 현재 지침은 ‘주요한 임상경과를 확인할 수 있을 정도로 충분히 긴 기간’을 요구하

고 있으며, 원론적으로 이 방향은 유지될 것이다.

❍ 그러나 현실에서는 시뮬레이션을 통해 도출한 대상 인구집단의 대부분이 사망하는 시

점을 분석기간으로 설정하는 사례가 많은 바, 도출된 분석기간의 타당성에 대한 고려

가 필요하다. 어떤 모형을 적용하느냐에 따라, 그리고 어떤 자료들이 투입되느냐에 따

라 대상인구 대부분이 사망하는 시점은 달라질 수 있으며, 때로 현실적이지 않은 기

간이 도출될 수도 있다. 따라서 시뮬레이션 과정 전반의 불확실성을 감안함과 아울러

역학자료 등 다른 외부 요소를 통해 분석기간의 적절성을 검토할 필요가 있다.

❍ 특히 외삽된 편익이 전체 편익의 상당부분을 차지하는 경우, 그 영향에 대한 고려가

필요하다. 분석기간에 따른 불확실성을 고려하도록 하고, 관찰자료에 근거한 민감도

분석을 좀 더 강한 톤으로 요구하도록 한다.

❍ 또 하나 중요한 것은 관찰기간 이후의 효과에 대해 어떤 가정을 할 것인가이다. 막연

히 관찰기간 동안 확인된 효과가 그 이후에도 지속될 것이라고 가정하는 것은 바람직

하지 않다. 관찰기간 이후 더 이상의 효과가 나타나지 않거나, 일정한 기간에 걸쳐 효

과가 축소되거나(waning effect), 관찰된 효과가 이후에도 지속될 것이라고 하는 가정

들에 대해 민감도 분석을 실시하고 그 결과를 제출할 필요가 있다.

❍ 다른 나라의 가이드라인과 그간 제출된 자료, 경평소위 심의 내용을 고려할 때 분석

기간 결정시 다음 사항을 고려하도록 할 필요가 있다.

- 적용 인구의 연령, 기대여명, 역학자료에 근거한 생존율

- 임상시험에서 관찰된 생존기간 중앙값, 비교군과의 생존율 차이, 관찰기간

Page 49: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 41 -

- 모형에 투입되는 모수의 불확실성

- 그 외 유사 약제의 평가 사례나 제 외국 평가 사례, 전문가 자문 등 고려

Page 50: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 42 -

다. 분석대상 인구집단

1) 현 지침

가) 주요 지침

경제성평가 결과를 제시할 때에는 비용과 결과가 도출된 인구집단을 명시하고, 분석대

상 인구집단에서 도출된 결과가 실제 연구결과를 적용할 인구집단(급여대상 인구집단)으

로 일반화 될 수 있는지 근거를 제시하고 논의한다.

나) 지침 내 추가 설명

...대상 인구집단은 환자의 역학적 특성(예. 성, 연령, 사회경제적 상태 등), 동반 상병

(co-morbidities)이나 위험요인(risk factors) 보유 여부, 질병의 위중도(severity) 등을 이용

하여 정의할 수 있다. 분석대상 인구집단에서 급여대상 인구집단으로의 일반화 가능성에

대하여 임상적, 인구학적, 역학적 특징에 근거하여 논의한다.

분석대상인구집단과 급여대상인구집단의 정의를 명확히 하고, 분석대상 인구집단에서 급여

대상 인구집단으로 분석결과를 일반화할 수 있을지에 대해 검토할 것을 명시하고 있다. 그러

나 현실에서는 급여기준과 분석대상 인구집단이 일치하지 않는 경우가 자주 발생하며, 이에

일반화 가능성을 판단할 좀 더 구체적인 지침을 제시할 필요가 있다.

2) 기존 제출자료 검토 결과

☐ 일반화 가능성에 대한 검토

기존에 심평원에 제출된 50건의 경제성평가 자료들과 이에 대한 소위원회 논의 결과를 보

면, 경제성평가에 사용된 임상자료가 포괄하는 인구집단(분석대상 인구집단)과 급여대상이

되는 인구집단(급여대상 인구집단)이 다른 경우가 있었다. 이 경우 분석결과를 급여대상 인

구집단으로 일반화할 수 있을지에 대한 소위원회의 판단이 이루어지게 된다. 그간 경제성평

가소위원회(이하 경평소위) 심의에서는 임상시험에 포함된 환자의 인구학적 특성이나 중증도

등을 급여범위와 비교하여 불일치 정도를 확인하였는데, 차이가 발생한 원인을 몇 가지로 분

류해보면 다음과 같다.

❍ 애초에 임상시험 자체가 제한적으로 수행된 경우:

- 임상시험이 급여대상 인구집단의 다수 환자를 포함하여 실시되었으나, 일부 소수 환자

에 대한 자료가 부족한 경우

Page 51: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 43 -

- 임상시험의 중재법/환자군이 급여범위와 불일치하는 경우

❍ 급여기준이 사후에 결정됨에 따라 허가 범위와 급여범위가 달라진 경우:

- 급여기준을 통해 다른 치료에 실패한 환자 등으로 치료 단계를 제한한 경우

- 세부 환자군으로 급여범위를 제한한 경우: 급여기준 설정으로 세부 환자군의 효과 자료

가 필요하나 가용 자료가 없는 경우

❍ 제약사가 허가 범위보다 범위를 좁혀 분석하고 급여신청을 한 경우.

- 예를 들어 신청약제의 효과가 두드러지는 하위집단(중증도가 높은 집단)에 대하여 분석

하고, 급여 신청한 경우.

❍ 일부 적응증에 대한 분석결과를 다른 적응증으로 일반화하고자 하는 경우

경평소위에서는 최종 급여범위와 분석대상 인구집단이 일치하는지를 검토하고, 불일치하는

경우 임상자문을 바탕으로 불일치 정도와 일반화 가능성을 검토하였다. 또한 임상시험 내에

서 세부집단별로 효과와 비용의 발생 경향이 어떻게 달라지는지를 확인하였고, 일반화 가능

성을 뒷받침해줄 수 있는 외부 자료원이 있는지를 확인하였다. 또한 적응증 별로 비용-효과

성이 검토되어야 한다는 원칙을 가지고 있었고, 해당 약제가 등재되었을 경우 급여범위를 벗

어나 사용될 가능성(이후 급여범위 확대 신청 가능성) 등도 고려하였다.

☐ 세부집단 분석

총 50건의 신청건 중 10건에서 세부집단 분석을 수행하였다. 대부분 사전에 계획되었거나

급여기준에 따라 수행된 것으로 보이나, 세부집단분석을 실시한 근거를 제시하지 않은 경우

도 2건이 있었다.

세부집단과 전체집단의 분석결과가 다른 경우는 대체로 전체집단 분석결과를 채택하였으

나 급여기준에 따라 세부집단 분석이 실시된 경우는 급여기준에 따른 분석결과를 채택하였

다. 경평소위에서는 세부집단보다 전체집단분석결과를 선호한 이유로 전체집단분석이 무작위

성이 유지된 상태에서의 관찰결과이기 때문이기도 하고, 향후 급여기준확대를 예상하여서라

고 언급하였다.

☐ Personalized medicine의 경우

선별검사를 거친 후 그 결과에 따라 약물치료를 실시하는 경우, 분석대상을 이미 선별된

인구집단으로 볼 것인지 또는 선별 전 인구집단으로 볼 것인지가 문제가 되었다. 경평소위

심의 과정, 그리고 이후 진행된 워크샵에서는 전체 환자를 대상으로 비용-효과성을 평가하여

야 한다는 결론을 내렸다. 해당 개인맞춤의약품이 도입되지 않았다면 유전자 검사 없이 전체

환자군에 표준치료제를 사용했을 것이므로 전체 환자군을 대상으로 비교해야 한다는 것이다.

Page 52: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 44 -

3) 외국 지침

외국 지침에서는 공통적으로 대상인구집단에 대한 상세 정의를 제시하라고 요구하고 있었

으며, 세부집단별로 비용과 효과에 유의한 차이가 있는 경우, 이러한 차이가 나타난 이유에

대한 설명과 더불어 이를 뒷받침할 자료를 제시하고, 세부집단분석결과를 전체집단분석결과

와 더불어 기본분석에서 제시하도록 하고 있었다. 또한 사후 자료뒤지기의 가능성을 경계하

였다.

가) 캐나다

☐ 대상 인구집단

지침에서는 대상 인구집단을 명확히 할 것을 요구하고 있다. 그리고 세부집단별로 비용과

효과의 차이가 달라질 수 있다면, 이러한 차이를 만드는 요인에 대해 명시함과 아울러, 각

세부집단 분석결과를 기본분석에서 제시하도록 하고 있다.

☐ 세부집단분석

세부집단은 기저 인구학적 특성(예, 연령, 성, 사회경제적 상태)이나 질병의 위중도, 질병단

계, 동반상병, 위험요인, 치료관련 요인(예, 지역사회 혹은 병원 세팅), 지리적 위치, 통상적인

복약순응도(usual adherence rates) 혹은 전형적 치료패턴에 의해 정의될 수 있다,

지침에서는 경제성평가는 전체집단을 반영하여야 한다는 점을 분명히 하고 있으나, 세부집

단별 이질성을 야기할 수 있는 요인에 대해서도 점검해볼 것을 강조하고 있다. 또한 세부집

단분석에서 유의할 사항에 대해서도 비교적 구체적으로 제시하고 있다.

캐나다 지침에서는 세부집단간 차이에 대한 견고한(robust)한 근거를 제공하는 자료가 있

는지를 확인하라고 권고하는데, 이는 특히 사후 자료 뒤지기(dredging)의 가능성을 피하기 위

해 중요하다고 강조한다. 이를 위해 투입 자료(data inputs)에서의 차이에 대한 액면타당도

(face validity) 평가를 권장하고 있다.

또한 세부집단별 층화분석이 수행되었으나 의사결정자가 세부집단별로 달리 의사결정을

할 수 없다면, 최종 결과는 전체 집단을 대상으로 한 평균 결과(예, ICER)가 아니라 각 세부

집단별 추정치를 각각의 유병률을 가중치로 하여 결정하는 것이 적절하다고 제시하였다.

나) 호주

☐ 대상인구집단

호주 지침에서는 진단, 증상, 예후, 그 외 이슈에 대한 상세 사항을 포함하여 신청약으로

치료할 수 있는 질병 혹은 상태에 대한 개요를 제시할 것을 요구한다.

Page 53: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 45 -

또한 해당 적응증을 가진 전체 환자가 아닌 일부 세부집단으로 사용을 제한하여 신청하였

다면, 그 세부집단과 전체 집단이 질병의 통상적 경로나 가용한 치료옵션 면에서 서로 다른

지를 확인하라고 한다.

자료는 호주인들을 포함하는 것을 선호하며, ‘의료이용량 산출을 위한 자료원(Sources of

data for use in generating utilisation estimates)’에 나열된 것과 같은 공신력 있는 자료원으

로부터의 자료를 이용하여 호주에서 해당 질병의 발생률과 유병률을 제시하라고 요구한다.

호주 참가자를 포함한 자료원이 없는 경우, 여기서 제시된 인구 특성이 호주 환경을 대표

할 수 있을지를 논하며, 가능하면 이 자료들에 대해 비중(percentage)과 평균, 그리고 사분위

범위, 표준편차, 범위와 같은 불확실성 추정치를 포함하라고도 언급하고 있다.

☐ 세부집단분석

❍ 세부집단 사용의 정당화

PBAC는 무작위 배정 임상시험이 포괄하는 전체 집단에 기초한 신청서를 선호한다. 만약

임상시험 내의 특정 세부집단에 대해서 의약품 등재 신청을 하고자 하면, 왜 임상시험에서

세부집단이 아니라 더 광범위한 인구집단을 등록시켰는지, 왜 해당 세부집단 외 나머지 집단

에는 신청약을 제공하지 않아야 하는지를 분명히 하라고 요구한다.

❍ 세부집단분석을 할 경우 다음 정보를 제공할 것을 요구한다.

- 세부집단별 치료효과의 차이를 설명하는 약리학적, 생물학적 혹은 임상적 근거

(rationale).

- 세부집단분석이 미리 지정되어 있는지, 무작위할당이 세부집단별로 층화되어 있는지를

확인할 수 있는 임상시험계획서의 관련 파트. 세부집단을 정의하기 위하여 사용된 임계

값에 대해서도 명료하게 정당화할 것

- 원래 수행된 세부집단 분석의 수, 그리고 다중비교를 위한 통계적 보정

❍ 세부집단분석결과

- 결과지표별로 전체 임상시험 대상 인구, 세부집단, 그리고 해당 세부집단을 제외한 나머

지 집단에 대해 각각 상대적, 절대적 효과 측정치를 제시할 것(예시 표도 제공).

- 치료효과와 세부집단을 정의하는 공변량 간의 교호작용 평가.

- 만약 세부집단이 연속변수에 의해 정의된다면, 특히 세부집단이 미리 정의되지 않았다

면, 세부집단을 정의하기 위하여 선택된 임계값에 대해 민감도분석을 제시하라.

- 가능하다면 통합자료에 대해 random effect meta-analysis를 이용하라.

다) 영국

☐ 대상 인구집단

영국은 평가범위 설정(scoping) 단계에서 대상 인구집단(target population)이 명시된다. 이

Page 54: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 46 -

때 대상 인구에 대한 정보는 구체적으로 제시하여야 하며, 임상효과나 비용-효과성이 전체

대상 인구집단과 다를 가능성이 있는 세부집단이 있다면 이에 대해서도 평가범위설정(scope)

단계에서 확인하여야 한다.

☐ 세부집단분석

세부집단분석이 필요할 경우 세부집단별 효과와 비용효과 추정치를 기본분석에서 제시하

되, 세부집단을 구성하는 환자 특성을 분명히 정의하고, 세부집단별 차이를 뒷받침할 수 있

는 타당한 생물학적 기전, 사회적 특성, 그 외 다른 정당화할 수 있는 요인이 있다면 함께

제시하도록 하고 있다. 다른 나라와 마찬가지로 세부집단효과를 찾아서 사후적으로 자료를

뒤지는(dredgin) 것은 피하라고 강조하고 있다. 또한 특정한 건강 결과의 기저 위험의 차이에

따라 세부집단을 구분하는 경우, 기저 자료를 확인하는 방법을 상세히 제공하는 것이 중요하

다고도 언급하고 있다.

세부집단분석을 하는 경우 그 방법을 상세히 기술하고, 세부집단 추정치의 정확도를 불확

실성 분석에 반영하도록 하고 있다. 또한 다수의 세부집단이 보고될 때 우연히 세부집단간

차이가 나타날 가능성이 높다는 점도 언급하며, 연구계획단계에서 세부집단을 미리 지정

(Pre-specification)함으로써 세부집단분석의 신뢰도를 증가시킬 수 있다고 강조한다.

세부집단별 모수 추정을 위해서는 개별 환자자료를 사용하는 것이 선호되나, 분석의 질이

나 가용한 근거가 임상 진료를 얼마나 잘 대표하는지, 그리고 의사결정 문제에 얼마나 관련

성이 있는지와 같은 점들을 고려하여 그러한 자료의 적절성을 평가하라고 명시하고 있다.

라) 기타 지침

EUnetHTA 보고서에 제시된 파트너 국가들의 세부집단분석에 대한 지침은 다음 표와 같

다. 대부분 세부집단분석에 대한 지침을 갖고 있음을 확인할 수 있다. 2019년에 EUnetHTA가

정리하여 회람중인 ‘경제성평가시 고려할 사항’ 중에도 세부집단분석과 관련된 권고안을

찾아볼 수 있는데, 세부집단의 구분, 세부집단분석시 유의할 사항 등에 대한 언급이 포함되

어 있다. 또한 사전 계획되지 않고 사후 진행된 세부집단 분석의 한계에 대해서도 언급하고

있다.

<표 13> EUnetHTA 파트너 국가 분석: 세부집단분석

국가 세부집단분석에 대한 지침이 있는가?

오스트리아 Yes. Recommended for populations with high heterogeneity

벨기에 Yes. If the intervention’s safety, effectiveness, costs and/or baseline risk for events differ between subgroups, separate subgroup analyses should be performed.

크로아티아 Yes. Estimates of clinical and cost effectiveness separately for each relevant subgroup of patients

Page 55: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 47 -

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, the target population(s) for the intervention and its expected use should be specified, and should

be consistent with the decision problem...A stratified analysis with results presented for each subgroup

should be provided in the reference case if factors are identified

목표집단은 의사결정 문제와 일치하여야 함.세부집단분석결과는 세부집단간 차이를 야기하는 요인과

<표 14> 대상인구집단 관련 해외 지침 내용

체코 Subgroup data may be presented additionally in case of potentially important differences in clinical effectiveness or costs

덴마크 Na

영국(England) Yes. Subgroup analyses should be presented separately for each relevant subgroup where appropriate.

에스토니아 & 라트비아

Yes. Subgroup data may be presented additionally in case of potentially important differences in clinical effectiveness or costs

핀란드 Yes. A separate evaluation should be prepared for each indication

프랑스 Yes. Subgroups analyses may be necessary in case of documented heterogeneity of the health effects or the costs

독일 Yes. There can be subgroup analyses, which need to be documented

헝가리 Yes. When the clinical effectiveness or cost-effectiveness in particular patient subgroups differ significantly

아일랜드 Yes. Stratified analysis of sub-groups is appropriate when there is biological or clinical support for heterogeneity in the target population

이탈리아 Yes. Subgroup analyses should be derived from proven differences in the parameters

네덜란드 Yes. With respect to assumptions in the discount rate, unit costs, subgroups, patient characteristics and possible model structures, it is possible to conduct an extra analysis.

노르웨이 Yes. When/if the intervention is expected to differ significantly in cost and/or efficacy for different groups

폴란드 Yes. If the analysis of subgroups has been carried out, the cost-effectiveness in the sub-group should be indicated in comparison to the total population.

포르투갈 Yes. The target population can be divided into subgroups

러시아 Na

영국(Scotland) Yes. A clear definition of subgroup analysis (when appropriate) and a justification of a differential effect within patient subgroups are required

슬로바키아 Yes. Subgroup analysis should be performed

슬로베니아 Na

스페인

Yes. Use data that will determine whether differences in age, gender, disease severity, and risk factors have a significant impact on either effectiveness or costs (Spanish recommendations, Osteba). If there is clinical evidence that there are differences between subgroups, the results should be analyzed separately for these different subgroups (CatSalut).

스웨덴 Yes. Separate calculations should be made for different patient groups where the treatment is expected to have different cost-effectiveness

스위스 Na

출처: EUnetHTA (2015a) Na: No information available

Page 56: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 48 -

4) 이해관계자 의견

이 항목에 대해서는 이해관계자들로부터 별다른 의견이 개진되지 않았다. 다만 대상인구집

단의 불일치 문제는 비교대상 선정과도 연결되는 문제인데, 비교대상 선정과 관련하여서는

여러 의견이 제시되었다.

to support the consideration of distinct subgroups. Otherwise, the analysis should be for the entire target population. (p18)

더불어 분석결과를 기본분석에서 제시

호주PBAC 지침 version 5(2016)

Describe the setting of the model and the demographic and patient characteristics for the modelled population

..Translate the important applicability concerns associated with the clinical data and identify any remaining uncertainty. (p71)Provide an overview of the disease or condition that can be

treated by the proposed medicine. If the medicine is proposed for use in a subgroup(s) of the Australian population with the disease or condition, indicate

whether the usual course of the disease or condition – or the available treatment options for that subgroup(s) – differs from

that of the whole population. Describe the Australian population who would be treated with

the proposed medicine, Provide data (preferably include Australian datasets or studies involving Australian participants). Summarise the incidence and prevalence of the disease or condition in Australia using data

from a reputable sourceWhere data sources involving Australian participants are not available, discuss whether population characteristics presented here are likely to be representative of the Australian setting.

(12-13)

모형에 포함된 인구집단의 특성에

대해 기술, 적용가능성 문제도 탐구.

약이 대상 적응증을 가진 환자의 일부에

사용할 것으로 제안되었다면

전체집단과 해당 세부집단의 차이에

대해 기술호주 환자의 특성에

대해 기술

영국 NICE 지침 (2013)

The scope defines the population for whom the technology is being appraised as precisely as possible. When the technology is a medicine, the marketing authorisation will generally specify the

therapeutic indications. The scope may highlight potential subgroups of the population for whom the clinical or cost

effectiveness of the technology might be expected to differ from the overall population, or who require special consideration. (p17)

평가범주 설정단계에서

목표집단과 세부집단 결정

EUnetHTA (2015)

it is recommended to perform subgroup analyses in the economic analysis when there is a clinical rationale to believe that the cost-effectiveness of the assessed technologies may vary

between sub-groups. It is important that the choice of subgroups is clearly justified and described.

세부집단간 비용-효과에 차이가 있을 때 세부집단

분석 수행. 세부집단선택 정당화

Page 57: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 49 -

5) 지침 개정방향 제언

❍ 인구학적 특성, 중증도, 그 외 임상적 특성 면에서 급여대상 인구집단과 분석대상 인

구집단이 일치하는지를 확인하여, 비교표를 제시하도록 한다. 만약, 불일치하는 경우

는 이러한 차이가 결과에 미칠 영향을 검토하도록 한다.

❍ 급여범위가 전체 환자의 세부집단으로 제한된 경우는, 전체집단 분석결과와 세부집단

분석결과를 별도로 제시하고 세부집단별로 비용과 효과가 어떻게 달라지는지를 확인

하도록 한다. 또한 등재 후 급여범위 외 사용이 이루어질 가능성에 대해서도 함께 검

토하도록 한다.

❍ 세부집단 분석에 대한 구체지침

- 세부집단 분석을 하고자 할 때에는 세부집단을 구성하는 환자의 특성을 구체적으로 제

시한다.

- 세부집단을 나눈 근거(세부집단별로 치료효과나 비용, 효용이 달라진다는 타당한 생물

학적 기전, 임상적 근거, 사회적 근거 등)와 근거의 강도를 제시한다. 연속변수를 기준으

로 세부집단을 정의한 경우, 세부집단 정의에 사용된 임계값을 정당화하고 민감도 분석

을 실시한다.

- 세부집단분석 결과를 제시할 때는 세부집단분석이 (임상시험단계에서) 미리 계획된 것

인지 혹은 사후 기준 설정에 따라 세부집단분석을 하게 되었는지 여부를 함께 제시하도

록 한다. 다수의 세부집단분석을 하다보면 우연히 세부집단 간 차이가 나타날 가능성이

있기 때문이다. 전자의 경우 임상시험계획서 등 사전 계획을 뒷받침할 수 있는 근거를

제시한다. 또한 사전 계획된 세부집단분석결과는 모두 보고하도록 한다.

- 세부집단분석을 한 경우 전체집단분석결과와 세부집단분석결과를 함께 제시하고, 세부

집단분석결과에 대해서도 불확실성 평가결과를 제시하도록 한다.

Page 58: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 50 -

라. 분석기법

1) 현 지침

가) 주요 지침

비교 대상 약물과 등재 신청 약물의 효과가 동등하다는 것을 증명할 수 있다면 비용최

소화 분석을 실시하고, 비교 대상 약물과 등재 신청 약물의 효과가 서로 다르다면 비용-

효과 분석 혹은 비용-효용분석을 실시한다.

치료에 있어 삶의 질이 중요하거나 건강결과가 다양한 지표로 제시되어 하나의 지표에

반영하기 어려운 경우에는 비용-효용 분석을 권장한다. 이때 QALY(질보정수명,

Quality-Adjusted Life Years)를 비용-효용 분석의 지표로 사용한다. 만약 삶의 질이 중요

하지 않은 지표이거나 QALY의 사용이 적절하지 않다면, 비용-효과 분석을 권장한다. 분

석자는 선택한 분석기법의 근거를 제시한다. 비용-효과 분석을 수행할 경우, 가능하면

최종지표를 이용하는 것이 권장되며, 중간결과를 이용할 경우 본 지침 “2-4-1 결과지

표” 항목에 근거하여 보고한다.

나) 지침 내 추가 설명

...비용-효과분석을 수행할 경우, 가능하면 최종지표를 사용하고 효과 한 단위의 증가가

어떤 임상적 가치, 경제적 가치를 갖는지에 대해서 충분히 기술하도록 한다(2-4-1 결과지

표 참고).

....QALY는 개념의 한계, 형평성 반영의 한계, 가정의 한계 등을 갖고 있으나, 아직 QALY

를 능가할만한 적절한 대안이 존재하지 않는다는 현실 때문에 여러 가이드라인에서

QALY의 사용을 권고하고 있다. 본 가이드라인 역시 서로 다른 연구결과들을 비교하기가

용이하다는 점에서 QALY를 비용-효용분석의 결과지표로 사용할 것을 제안한다.

....비용-편익 분석만 실시하는 것은 현재로서는 바람직하지 않다.

현 지침에서는 삶의 질이 중요하거나 건강결과가 다양한 지표로 제시되는 경우 비용-효용

분석을 권장한다는 표현을 쓰고 있으나 다른 분석기법에 대한 설명과 병기함으로써 비용-효

용분석을 우선적 분석기법으로 고려한다는 점이 명확히 전달되고 있지 않다. 또한 비교대안

간 효과가 동등하다는 것을 증명할 수 있을 때 비용-최소화분석을 실시하라고 언급하고 있

지만, 효과의 동등성에 대한 구체적 판단 기준이나 분석방법 등에 대한 구체지침이 없어, 이

점이 보강될 필요가 있다.

Page 59: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 51 -

2) 기존 제출자료 검토 결과

기존에 경제성평가 자료를 제출한 50품목 중에서는 2건이 비용-최소화분석을 실시하였다.

이 중 1개 품목은 간접비교를 통해 대리결과(surrogate outcome)의 비열등함을 보인 후 비용

-최소화분석을 실시하였고, 또 다른 건은 우월성 검증을 목적으로 설계된 직접비교 임상에서

유의한 차이를 보이지 못하여 사후적으로 비열등마진에 대한 체계적 문헌고찰을 실시하고

이를 직접비교임상 결과에 적용하여 비열등을 주장한 경우이었다. 비용-효과분석을 실시한

경우는 1건으로, EFS(event-free survival)이 대리결과지표로 사용되었다. 평가 과정에서 근거

의 불확실성이 논란이 되었으나 가용한 자료의 한계 등을 고려하여 수용되었다.

분석기법 품목수 비고

비용-최소화분석 2

비용-효과분석 1 결과지표: EFS

비용-효용분석 47이중 1건은 추후

비용-최소화분석으로 전환하였음

비용-편익분석 0

계 50

<표 15> 제출자료의 분석기법

위 세 품목을 제외한 나머지 품목들은 모두 QALY를 결과지표로 하여 비용-효용분석을 실

시하였다. 다만 이 중에는 애초 비용-효용분석 결과를 제출하였으나 위원회에서 효과 개선을

둘러싼 불확실성이 크다고 판단하여. 추후 비용최소화분석으로 변경된 1건이 포함되어 있다.

비용-효과분석 혹은 비용-효용분석을 하려면 먼저 임상적 유용성의 개선을 입증하여야 한

다. 특히 비용-효용분석은 삶의 질이나 생존기간 연장 측면에서의 효과를 전제한다. 제출 건

들 중에서는 임상시험을 통해 삶의 양이나 건강관련 삶의질(Health-Related Quality of Life,

HRQoL)의 개선을 직접 입증한 경우도 있었지만, 대리지표의 개선을 보인 후, 기존 문헌값

등을 활용하여 QALY 변화를 추정한 경우도 많았다.

비교약과 비교한 분석자료를 제출하지 않았거나, 효과지표가 적절하지 않았던 경우, 그리

고 주요 효과지표에 대한 개선여부가 불분명하였던 경우는 경평소위 심의 과정에서 임상적

유용성 개선을 인정하지 않았다. 예를 들어 골다공증 치료제인 약 A는 BMD를 대리지표로

사용하여 최종 성과를 추정하였으나, 경평소위 심의 과정에서 (임상자문결과 등을 바탕으로)

BMD가 아닌 고관절 골절 횟수를 결과지표로 사용할 것이 권고되었다. 약 B는 근거문헌에

포함된 환자가 소수이며, 자료원 및 대상환자에 따라 효과(질병진행기간, 무진행기간 등)의

변이가 커 결과값의 불확실성이 크다는 점, 그리고 반응률 개선이 최종 지표(PFS)에 미치는

Page 60: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 52 -

영향이 확인되지 않은 점 등으로 인해 개선 주장이 수용되지 않았다.

효과 외에 부작용을 검토한 품목은 총 50품목 중 21품목이었다.

3) 외국 지침

국가별로 지침에서 비용-효과분석과 비용-효용분석을 분리하여 언급한 경우도 있고, 하나

로 언급한 경우도 있었지만, 대체로 QALY를 결과지표로 한 비용-효용분석을 기분분석으로

제시하도록 하고 있었다. 비용-최소화분석의 경우 주요 3개국 중에서는 호주만 별도 지침을

제시하고 있었으며, 캐나다는 개정 지침에서 비용-최소화분석을 권장하지 않는다는 입장을

명시적으로 밝히고 있다. 그러나 EUnetHTA (2015)에서 파트너 국가들의 지침을 정리한 바에

따르면 여전히 비용-최소화분석을 분석유형의 하나로 제시하는 국가가 다수 있었으며 비용-

결과분석(cost-consequence analysis; CCA)을 분석의 한 유형으로 제시한 국가도 여럿 있었다.

국가별 지침의 내용은 다음과 같다.

가) 캐나다

캐나다 지침에서는 비용-효용분석을 적절한 평가방법으로 제시하고 있다. 비용-효용분석을

한 후 부가적으로 비용-효과분석 결과를 제시하는 것은 가능하나, 기본적으로는 비용-효용분

석을 제시하여야 한다고 명시하고 있다. 또한 설령 주요 결과지표 면에서 대안들이 서로 동

일하다는 것을 보여주는 근거가 있다고 하더라도 비용-최소화분석은 권장하지 않는다고 밝

히고 있다.

나) 호주

호주 지침에서는 비용-효과분석과 비용-효용분석을 구분하는 표현을 사용하지 않으며 경

제성평가를 완전 비용-효과 분석(full cost-effectiveness analysis; full CEA)과 비용최소화분석

으로 구분한 후 별도의 항목을 통해 분석 지침을 제시하고 있다.

호주 지침에 의하면 임상적 평가 결과 신청약이 주요 비교대안에 비해 치료적으로 더 우

수하나 비용 또한 더 소요될 때, 혹은 비교 대안에 비해 치료적으로 열등하나 비용이 더 적

게 소요될 때 full CEA가 적절하고, 치료적 비열등성(혹은 우수성)이 있거나 안전성 프로파일

이 동등하거나 우수할 때 (성격이나 크기 모든 면에서), 그리고 신청약의 사용이 보건체계에

동등하거나 더 적은 비용을 발생시킬 것으로 기대될 때 비용 최소화 분석이 적절하다고 언

급하고 있다.

☐ 비용-최소화분석 (호주 가이드라인에서는 별도 section으로 제시)

Page 61: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 53 -

호주 지침에서 비용최소화분석을 인정하는 경우는 효과와 안전성이 모두 비열등(혹은 우

월)한 것으로 인정될 때이다. 효과는 비열등하더라도 부작용 프로파일이 매우 다르다면 비용

-효과분석이나 비용-효용분석이 더 적절할 수 있다는 것이다.

또한 비용-최소화분석에 주로 포함되는 비용을 i) 신청약과 비교약을 처방하거나 투약하는

데 소요된 비용, ii) 신청약과 비교약에 관련된 부작용을 모니터하거나 관리하는데 소요되는

비용, iii) 그 외 자원 사용에 영향을 미칠 수 있는 것들로 분류하고, 비용-최소화분석 결과를

제출할 때에는 다음에 대한 정보를 함께 제공하도록 하고 있다

- 비용최소화 분석의 핵심 요소와 가정에 대한 요약

- 동등효과 용량의 추정: 사용 과정에서 용량 변경을 하게 되는 경우는, ‘안정 상태’ 의

용량(용량 titration이 완료된 후, 그리고 중단 환자를 배제한 후의 평균 용량) 비교가 적

절. 자료가 제품 허가 정보에서 권고하는 바(용량, titration 방법)와 일치하는지 확인

- 추가비용 그리고/혹은 비용절감: 신청약과 비교약의 투약 프로파일을 비교하여 차이를

확인하고, 이러한 차이가 추가적인 비용이나 비용절감으로 이어질 지를 제시

- 결과: 비용-최소화분석의 결과 제시; 관련 문서와 원 자료원의 사본을 첨부하고, 본문

중에 상호참조할 것

요소 주장 혹은 가정

치료적 주장: 효과 효과는 [비열등/우월]할 것으로 가정

치료적 주장: 안전성 안전성은 [비열등/우월]할 것으로 가정

근거 [직접 무작위 비교임상시험/무작위 임상시험의 간접비교]

동등-효과 용량 (Equi-effective doses)

신청약 [dose/day/course 기술] 과 비교약 [dose/day/course 기술]

직접 의약품 비용[낮다/동등/높다]; [신청약의 비용] vs [비교약의 비용] (비용은 환급성 혹은 자체 제한이 있는 치료의 경우 환자당 course 당으로, 만성 혹은 지속 치료의 경우 환자 당 연간비용)

다른 비용 혹은 비용 절감분[예/아니오] [‘예’인 경우; 간단히 기술 – 예, 부작용 관련

비용, 모니터링 비용, 투약 비용..]

<표 16> 호주 가이드라인에 제시된 비용-최소화 분석의 핵심 가정과 요소

다) 영국

영국지침에서는 기본분석(reference case)으로 비용-효용분석을 선호하며 건강효과는

QALYs로 표현할 것을 명시적으로 요구하고 있다(비용-효과분석이라 표현하고 있지만 내용상

비용-효용분석을 지칭한다). 다만, QALY의 저변에 있는 가정(예를 들어 constant proportional

trade-off와 건강상태들 간의 additive independence)들이 부적절한 경우, 대안적 측정치를 이

용한 분석을 non-reference-case analysis로 부가적으로 제시할 수 있다고 언급하고 있다.

Page 62: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 54 -

라) 기타 지침

EUnetHTA 보고서에 제시된 국가별 선호하는 분석 유형은 다음 표와 같으며 이를 바탕으

로 EUnetHTA에서는 비용-효과분석과 비용-효용분석을 권고하되, 대안들간의 차이가 없다면

비용-최소화분석으로 충분할 수 있다고 언급하고 있다.

<표 17> EUnetHTA 파트너 국가 분석: 선호하는 분석 유형

국가 선호하는 분석 유형

오스트리아 No preferred type

벨기에 CUA, CEA or CMA.

크로아티아 CUA or CEA

체코 CUA

덴마크 Not explicitly stated. CEA and CUA seem to be accepted

영국(England)CUA (Technology Appraisals and NICE Diagnostics Assessment Programme) CCA (NICE Medical Technologies Evaluation Programme Methods Guide)

에스토니아 & 라트비아 CEA or CMA

핀란드 CUA, CEA, CMA or CBA

프랑스 CUA and CEA

독일 CEA (several endpoints= several efficiency frontiers)

헝가리 CUA, CEA or CMA,

아일랜드 CUA or CEA

이탈리아 CUA or CEA

네덜란드 CUA, CEA or CMA

노르웨이 CUA, CEA or CMA

폴란드CUA (preferred according to the regulation), CEA or CMA and a CCA.

CBA is possible only as an additional analysis (according to the guidelines).

포르투갈 CUA, CEA, CMA or CBA (CUA is preferred)

러시아CEA or CMA (Ministry of health) CMA, CEA, CUA or CBA (ISPOR Russian

HTA Chapter)

영국(Scotland) CUA or CMA

슬로바키아 CUA, CEA or CMA

슬로베니아 CUA, CEA or CMA and Cost Analysis

스페인CUA, CEA, CMA or CBA. CUA is preferred. (Spanish recommendations, Osteba) CUA, CEA or CMA (AETSA) CUA or CMA (CEA only if a CUA

cannot be conducted) (CatSalut)

스웨덴 CUA, CEA, CMA or CBA

스위스 CEA

출처: EUnetHTA(2015a) CBA: Cost-benefit analysis, CCA: Cost-consequence analysis, CEA: Cost-effectiveness analysis,

CUA: Cost-utility analysis, CMA: Cost-minimization analysis.

Page 63: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 55 -

4) 기타 문헌고찰 결과

분석 유형 관련하여 문헌에서 주로 다루어진 것은 비용-최소화 분석의 적절성에 대한 검

토였다. 비용-최소화 분석 무용론을 주장한 대표적 논자인 Briggs & O’Brien (2001)은 비용

과 효과를 둘러싼 불확실성 때문에 대부분의 경우에는 비용-최소화분석이 부적절하다고 하

였다. 근거 없음이 없음의 근거는 아니므로(‘absence of evidence is not evidence of

absence’), 치료의 동등함을 보여주기 위해(비용이나 효과 면에서) 특별히 설계된 연구가 아

니라면, 치료법들 사이에 효과나 비용의 차이에 있어 유의하지 않은 것으로 관찰되었다는 사

실에 기초하여 비용 최소화나 성과 최대화와 같은 유형의 분석을 수행하는 것은 부적절하다

는 것이 이들의 설명이다. Drummond et al. (2015) 또한 Briggs & O’Brien (2001)을 인용하

며 비용과 효과를 둘러싼 불확실성 때문에 비용-최소화 분석은 미리 결정할 수 있는 고유한

연구 설계가 아니라는 점을 강조하였다. 이들은 비용-최소화 분석을 적용할 수 있는 유일한

경우는 이전의 연구결과나 전문가 판단에 기초하여 두 선택지가 효과 면에서 동등하다고 사

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, the economic evaluation should be a cost-utility analysis (CUA) with outcomes expressed as

quality-adjusted life-years (QALYs). Any departure from this approach should be clearly justified. (p17)

CUA

호주PBAC 지침

version 5(2016)

State whether cost-effectiveness will be estimated using a CEA and/or a cost-utility analysis (CUA). Identify the incremental

health outcomes (as nominated for the CEA, or as quality-adjusted life years [QALYs] for a CUA) and incremental

health costs.. Other economic evaluations (eg cost-benefit analyses or cost-consequences analyses) should not be presented

as base-case analyses (p63)

CEA or CUA.

영국 NICE 지침 (2013)

For the reference case, cost-effectiveness (specifically cost–utility) analysis is the preferred form of economic

evaluation. (p93) Health effects should be expressed in terms of QALYs. (p94)

CUA

EUnetHTA (2015)

To enhance the usability of the economic evaluations, it is recommended that results be presented in terms of both a cost-effectiveness analysis (CEA) and a cost-utility analysis

(CUA). A costminimization analysis (CMA) is sufficient when it is demonstrated that there is no difference in effect between an intervention and its relevant comparators. If appropriate and

adequately justified, a cost-consequence analysis (CCA) may be a useful alternative in cases where CEA and CUA cannot be

undertaken.

<표 18> 분석기법 관련 해외 지침 내용

Page 64: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 56 -

전에 판단할 수 있는 경우인데, 이는 매우 제한적일 것이라고 판단하였다(예, 동일

pharmacological class의 약), 비용-최소화 분석의 제한성에 대한 언급은 다른 국가의 경제성

평가지침에도 흔히 등장하며, 이에 초기와는 달리 최근에는 비용-최소화 분석을 별도의 경제

성평가 유형으로 분류하지 않는 경우가 많다.

5) 이해관계자 의견

특별한 의견이 개진되지 않았다.

6) 지침 개정방향 제언

❍ 비용-효용분석을 선호함을 명확히 한다. 비용-효용분석이 어려운 경우 비용-효과분석

도 가능할 수 있으나, 왜 비용-효용분석이 부적절, 혹은 불가능한 지에 대한 명확한

설명이 제시되어야 한다.

- 비용-효과분석시 최종결과지표를 사용하여야 하며, 효과 1단위 개선의 경제적 의미를

함께 제시하여 의사결정에 참조할 수 있도록 한다.

❍ 비용-최소화분석과 관련하여 1안은 비용-최소화분석을 제출할 수 있는 대상, 비용-최

소화분석을 수행할 때 고려할 비용 항목과 제출자료에 대해 좀 더 구체적인 지침을

제시하는 것이다.

- 비용-최소화분석 대상: 효과가 비열등(혹은 우수)한 경우 & 안전성 프로파일을 검토하

여 안전성 면에서 신청약이 열등하지 않음을 인정할 수 있는 경우(비열등성 검증과정을

거치라는 의미는 아님)

- 비용 추정: 동등효과 용량(equi-effective doses)을 결정한 후 비교 대안 들의 투약 관련

비용 제시, 모니터링 비용, 부작용 비용, 그 외 관련 비용이 있으면 함께 제시.

- 각 비용 항목을 제시할 때는 이를 뒷받침하는 근거를 함께 제시

- 민감도분석 결과 제시

❍ 2안은 비용-최소화분석을 분석기법에서 제외하는 것이다. 이는 효과의 동등성, 불확실

성 문제를 둘러싼 이론적 논의를 반영한 선택이다.

Page 65: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 57 -

마. 비교대상 선정

1) 현 지침

가) 주요 지침

비교대상을 선정함에 있어 비교할만한 등재 의약품이 있는 경우는 이들 중 가장 많이

사용되는 것을 비교대상으로 한다. 경우에 따라 한 가지 의약품만이 아닌 복수의 의약품

과 비교할 수도 있으며, 비교할 만한 의약품이 없는 경우는 수술 등 다른 치료방법도 비

교대상이 될 수 있다.

어떤 비교 대상을 선정하였건 선정 사유에 대해서는 보고서에서 충분히 언급한다. 즉,

해당질병 혹은 증상에 사용할 수 있는 의약품이나 치료법 중 신청 약을 대신하여 사용

할 수 있는 것으로는 어떤 것들이 있으며, 왜 그 중 특정 의약품(혹은 치료법)을 비교대

상으로 선정하였는지 등을 상세히 기술한다. 비교 대상으로 선정된 약품에 대해서는 용

법, 용량, 제형, 적응증, 부작용, 치료기간, 기타 일차 약제로의 사용이 인정되는지 여부

등을 기술한다.

비교대상으로 선정된 약의 단위 비용과 관련하여, 동일 성분의 다른 의약품이 등재되어

있지 않은 단독 품목인 경우는 해당 약품의 가격을, 동일성분의 의약품이 다수 있는 경

우는 시장점유율을 이용한 가중평균가격을 비교 약물의 단위 비용으로 이용한다.

나) 지침 내 추가 설명

.... 원칙적으로 ICER을 계산할 때에는 다른 대안에 비해 비효율적인 것으로 평가된 대안

은 제외하고 주어진 임계값 하에서 비용-효과적인 것으로 간주되는 대안과 비교하는 것

이 바람직하나.... 실제로는 기 등재 약물 중 어느 것이 비용-효과적인 약물인지 알지 못

하는 경우가 대부분이다. 따라서 대부분의 가이드라인에서는 비교 가능한 기 등재 의약

품들 중 현재 널리 사용되는 것을 비교 대상으로 권고하고 있다.

현재 널리 사용되는 의약품이란 비교 대상으로 적절한 의약품 중 시장 점유율이 가장

높은 것을 말하는데, 경우에 따라 시장 점유율이 높은 한 가지 의약품을 선정하기가 곤

란한 경우가 있다. 예를 들어 동일 효능 군에 포함되는 10가지 약물 중 비교적 시장 점유

율이 높은 세 약품 X, Y, Z의 시장 점유율이 각각 20%, 25%, 23%라고 했을 때, 이중 시

장점유율이 가장 높은 것은 Y이지만, X나 Z 역시 시장 점유율 면에서 Y와 크게 다르지

않다. 따라서 이 경우에는 Y와만 비교하기보다 X, Y, Z와 모두 비교를 하는 것이 적절할

수 있다.

비교대상 약물을 선정함에 있어 시장 점유율보다 더욱 중요한 것은 비교대상으로 적절

한지에 대한 판단이다. 설령 시장 점유율이 높다 할지라도 대상 환자 군이 신청약과 서

Page 66: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 58 -

현 지침에서는 비교가능한 약들 중 가장 시장점유율이 높은 약을 비교대안으로 선정하라

고 제시하고 있다. 시장점유율이 유사한 약들이 여럿 있는 경우 복수의 비교대안을 선정할

수 있으며, 비교 가능한 의약품이 없는 경우 수술 등 다른 치료법도 비교대안이 될 수 있음

을 언급하고 있다. 지침에서 일관되게 강조하는 것은 실제 임상에서의 사용현황인데, 비교

가능하다는 것의 판단기준도 임상에서의 사용 현황이며, 작용기전이 동일해야 한다는 등으로

비교범위를 제한하지 않음을 분명히 하고 있다. 또한 시장점유율에 대한 비교적 자세하고 구

체적인 언급을 하고 있어, 시장점유율이 가장 높은 약이 아닌 경우 비교대안으로 고려할 수

있는 여지를 거의 남기지 않는다는 특징을 갖고 있다. 이는 지침의 명료함은 높일 수 있지

만, 시장의 동태적 특성, 근거의 질 등을 고려하였을 때 고려 가능한 비교대안을 배제하게

된다는 한계가 있다.

2) 기존 제출자료 검토 결과

기 제출 자료에서 사용된 비교대안을 유형별로 구분하면 다음 표와 같다. 비교가능한 약의

로 다른 경우라면 비교대상으로 선정하는 것이 부적절할 수 있다.

만약 비교할 만한 의약품이 없는 경우라면 수술이나 그 외 다른 치료 방법도 대안이

될 수 있으나, 어떤 비교 대상을 선정하였건 선정 과정과 선택의 사유에 대해서는 보고

서에서 충분히 언급하여야 할 것이다. 즉, 기 등재 의약품 중 신청약과 비교 가능한 의약

품 혹은 치료방법으로는 어떤 것들이 있는지를 구체적으로 나열하고, 그 중 특정의약품,

특정 치료방법을 비교대상으로 선정한 사유를 기술한다. ...

여기서 비교 가능한 의약품이라는 것은 신청약이 목표로 하는 대상 질환 혹은 증상을

치료‧관리할 목적으로 지금껏 사용되어 온 것으로, 신청약이 급여됨에 따라 대체가 일어

날 수 있는 의약품을 지칭하는데, 비교가능하다는 것이 반드시 작용기전의 동일함을 의

미하는 것은 아니다. 비교대상으로 선정된 의약품에 대해서는 용법, 용량, 제형, 적응증,

부작용, 치료기간, 기타 일차약으로의 사용이 인정되는지 여부 등의 사항을 기술한다.

일단 비교 대상 약물이 정해지면 해당 약물의 비용과 효과를 추정하여야 하는데....후발

의약품이 등재되어 있지 않은 단독 품목인 경우는 그 제품의 가격이 곧 비교 약의 단위

비용이 되겠지만, 후발의약품이 이미 진입해있고 그 가격이 선발의약품보다 더 낮다면

비교 약의 단위 비용으로..... 시장점유율을 이용한 가중평균가격을 이용할 것을 권고한

다...이는 새로운 약물이 진입할 경우 실제 대체가 일어날 약의 가격을 반영한다는 점에

서도 나름의 근거를 가진 값이라 할 수 있다.

Page 67: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 59 -

범주가 동일 기전이라는 좁은 범위에 매이지 않았음을 확인할 수 있으며, 때로 BSC가 비교

대안이 되기도 하였다. 비교 가능한 약의 범주가 결정되고 나면, 대부분 시장점유율을 기준

으로 비교대안이 선정되었다.

<표 19> 비교대안의 유형 정리

또한 지금까지는 허가범위 초과 혹은 비급여 약은 비교대안으로 고려하지 않았으며, 선정

된 비교대안이 열등한 대안(extended dominance 포함)으로 확인된 경우 비교대상에서 제외하

였다.

기존 치료법에 실패하였으나, 달리 대안이 없어 기존 치료법을 계속 사용하는 경우 신청

약의 비교 대안을 위약으로 볼 것인지 기존 치료법으로 볼 것인지와 관련하여서는, 효과 불

충분시에도 계속 선행 치료제를 사용하고 있다면(별도의 중단 기준 없음), 불응의 선행치료

제라고 비교대안에서 배제할 것은 아니라는 것이 지금까지의 경평소위의 판단이었다. 다만,

허가사항 또는 급여기준에서 중단을 명시하는 경우라면 비교대안에서 배제하였다.

표준치료 혹은 통상의 치료법처럼 단독 치료법이 아니라 여러 치료법으로 비교대안을 구

성하는 경우, 임상자료에 기반하여 비교대안을 구성할 것인지, 국내 사용 현황을 기반으로

하여 비교대안을 구성할 것인지도 쟁점이 되었다. 전자는 분자(비용)과 분모(효과)가 동일 자

료원에서 도출된다는 장점은 있으나, 국내 사용 현실과 달라지는 문제점이 있으며, 후자는

분자와 분모가 일치하지 않는 문제점이 있다. 신청건들 중에서는 국내임상의 패널을 대상으

로 조사한 결과를 바탕으로 BAT (best available therapy)를 구성한 건이 2건 있었다(패널 답

변 결과의 평균값 적용). 이에 대해 경평소위 워크샵에서는 실제 처방사례와 임상시험에서의

비교대안 구성을 비교하여 적절성을 검토할 필요가 있고, 패널간 답변의 편차가 큰 경우 평

균값보다 중간값 사용이 적절하다는 검토의견을 제시한 바 있다.

선별검사 후 양성으로 확인된 환자에게 신청약을 투여하는 치료전략의 경우 통상의 비교

대안 선정과정과는 달리, 약 대 약이 아닌 전략 대 전략의 비교를 필요로 한다. 환자 맞춤형

구분 신청약

비교약은 동일기전(ATC code 4자리 기준)에 속하나?

동일기전 8품목동일기전이 아님 39품목

ATC code 표시 없음 3품목새로운 기전의 약인가?

예 14품목아니오 23품목

BSC를 비교대안으로 사용하였나

예 3품목

Page 68: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 60 -

치료에서 흔히 비교되는 전략은 Test and Treat 치료전략 대 Treat all 치료전략으로 이 경우

대안은 다음과 같이 구성된다.

대안 1: 검사 후 양성환자에게는 신청약, 음성환자에게는 표준치료제 투여

대안 2: 모든 환자에게 현행 치료제 투여

경평소위 워크샵에서는 그간의 심의 결과를 바탕으로 진단 검사 후 치료대상을 선별하는

경우라면, 검사 비용도 포함하여 신청약의 비용-효과성을 평가하는 것이 바람직하다는 결론

을 내렸다. 다만, 치료 대상을 선별하는 검사에 해당한다 하더라도 신청약 투여여부와 관계

없이 이루어지는 검사라면 비용에서 제외하고, 신청약 투여를 위해 추가로 수행되는 검사라

면 비용에 포함하는 것이 바람직하다고도 언급하였다.

3) 외국 지침

다른 나라의 지침들을 살펴보면 대부분 무엇이 현재 해당 적응증에 가장 널리 사용되는지

를 기준으로 대안을 선택하고 있었다. 다만 캐나다의 경우 신기술의 진입의 영향을 받을 모

든 잠재적 대안을 확인할 것을 강조하고 있고, 호주의 경우 비교 대안 선택의 위계를 제시하

고 있다는 점이 특이하다. 또한 다른 나라와 달리 호주는 대부분의 경우 비교대안이 단독 대

안이 될 것이라는 점을 언급하고 있다. 그러나 실제 호주의 평가사례를 보면 PBAC 심의과정

에서 추가적인 비교 대안을 제시하는 경우도 종종 볼 수 있다.

가) 캐나다

☐ 비교대안의 확인

캐나다는 비교대안을 선정함에 있어 현재 사용되고 있고 (신기술이 진입하면) 잠재적으로

대체될 모든 중재들, 그리고 가까운 미래에 가용한 중재들까지 모두 확인할 것을 요구한다.

그리고 이에는 개별 중재 뿐 아니라 중재전략, 관리까지 포함하며, 현재 사용되고 있는 기술

이 BSC에 비해 낮은 혹은 불확실한 가치를 지닌다고 판단될 때는 BSC를 비교대안으로 고려

할 수 있다고 언급하고 있다.

☐ 비교대안의 선택

비교대안들의 포괄적 목록에서 적절한 비교대안을 선택하는 출발점은 무엇이 현재의 임상

진료(current care)를 대표하는지, 혹은 어떤 기술이 대체될 가능성이 높은 지를 결정하는 것

이다. 지침에서는 비교대안은 현재 급여가 되고 있고 흔히 사용되는 것이어야 하며, 자료의

가용성에 의해 비교대안이 결정되어서는 안된다고 언급하고 있다.

다수의 적절한 비교대안들이 있을 때 비교대안 선택이 복잡할 수 있다. 지침에서는 이 경

우 모든 비교대안들이 고려되어야 하고, 어떤 대안들을 제외하기로 선택하였다면 왜 그러한

Page 69: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 61 -

선택을 하였는지를 정당화하라고 명시하고 있다.

☐ 비교 대안의 기술

최종 선정된 비교 대안에 대해서는 용법, 용량, 투여경로, 다른 치료법과의 병용 여부,임상

경로상에서의 위치 등을 포함한 상세 사항을 기술하여, 관련 비용과 결과를 확인할 수 있게

하라고 명시하고 있다.

나) 호주

☐ 비교대안의 선택

호주 지침에서는 현재 호주에서 사용하는 치료법으로, 신청약이 진입하였을 때 대체가 될

가능성이 가장 높은 것을 비교대안으로 선택하라고 제시하고 있다. 대부분의 경우에는 단일

비교대안이 적절할 것이라는 점도 언급하고 있다.

그리고 대부분의 경우 해당 적응증에 대해 현재 PBS에 등재된 약이 비교대안이 되겠지만

해당 인구집단을 대상으로 한 기등재약이 없거나 신청약이 기존 약을 대체하는 것이 아니라

기존 약에 더하여 사용되는 경우에는 표준 치료법(standard medical management)도 적절한

비교 대안일 수 있다고 언급하고 있다.

☐ 가장 대체 가능성이 높은 약의 선택

PBAC는 무엇이 일어나야 하느냐보다 무엇이 일어날 가능성이 가장 높은지에 기초하여 주

요 비교대안을 판단한다. 호주지침에서는 적절한 주 비교대안의 선택을 위하여 다음과 같은

위계(hierarchy)를 제시하고 있다.

- 약리학적 작용이 유사한 약(pharmacological analogue). 신청약과 유사 기전의 약이 이미

등재된 경우라면 이들 중 가장 다수의 대상 환자에게 사용하는 PBS 등재약이 보통은 주

비교대안이 될 것이다.

- 신청약이 새로운 치료군에 속하긴 하나 대상환자들에게 널리 적용되는 다른 등재약이

있다면, 이들 중 가장 많은 처방되는 약이 주 비교대안이 될 것이다.

- 신청약의 투여 방식. 투여경로(주사제, 점안제 등)도 비교대안을 고르는데 중요한 고려

요인이 될 것이다.

☐ 시장 근접 비교대안(Near market comparator)

호주 지침에서는 아직 등재되지 않은 약이라 하더라도 조건부 비교대안으로 고려할 필요

가 있는 약들을 시장 근접 대안이라 부르며, 이에 대한 지침을 제시하고 있다. 해당 환자들

을 대상으로 조만간 또 다른 약이 호주 시장에 진입할 것이라는 합리적 기대가 있다면, 그리

고 같은 차수의 PBAC 회의나 인접한 PBAC 회의 때 이들 약제가 검토될 예정에 있다면, 이

약들이 조건부 비교 대안으로 고려될 수 있다.

☐ 세부집단별, 대상 인구별 비교대안

Page 70: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 62 -

또한 호주 지침에서는 경우에 따라 서로 다른 세부집단에 서로 다른 비교 대안을 사용하

는 것도 가능하다는 점도 간단히 언급하고 있다.

다) 영국

영국지침에서는 비교대안을 선정할 때 NHS에서의 확립된 진료관행을 고려할 것이라고 밝

히고 있다. 그러나 이러한 확립된 진료 관행이 다른 가용한 대안 대비 합리적이지 않다고 평

가되는 경우에는, 다른 대안을 비교대상으로 한 평가를 추가적으로 진행할 수도 있다는 사실

도 언급하고 있다.

평가범위(scope)에 정의된 적응증에 대해 시판허가를 받지 않은 기술도, 그것이 NHS에서

확립된 진료관행의 일부라면 비교 대안으로 고려할 수 있다고 언급하고 있으나 허가받지 않

은 사용의 근거, 특히 안전성, 유효성에 대한 근거와 근거의 질을 고려하여야 한다고 강조한

다.

라) 기타 지침

EUnetHTA (2015)에서도 유럽 각국의 가이드라인을 비교하며 비교대안 선정의 원칙에 대해

언급하였다. EUnetHTA이 검토한 바로는 거의 모든 국가들이 (일상적) 임상 진료에서 사용되

는 것을 주요 비교대안으로 선정하라고 권고하고 있었다. 또한 일부 가이드라인에서는 통상

적으로 이루어지는 선택이라면 “no treatment” 또한 비교대안이 될 수 있다고 언급하고

있고, 어떤 가이드라인은 가장 저렴하거나 가장 효율적인 대안과의 비교를 추가하라는 언급

도 하고 있다고 한다. 이에 EUnetHTA는 임상 현장에서 사용되는 가장 관련있는(relevant) 대

안적 중재를 비교대안으로 선택하여야 하며, 선택배경이 분명히 제시되고 정당화되어야 한다

고 밝히고 있다.

현재 EUnetHTA (2019)가 의견수렴중에 있는 ‘경제성평가시 고려사항(practical

considerations when critically assessing economic evaluations)’에서는 적절한 비교대안을 부

적절하게 배제하거나 비용효과적이지 않은 대안과의 부적절한 비교가 가져올 수 있는 문제

점에 대해 지적하였다. 그리고 일상적 진료에 사용하는 중재에 대해서만 아니라 현재 진료를

대체할 수 있는 다른 새로운 중재, (근거에 기반한) off-label use, 그리고 less intensive

treatment/screening intervals도 고려하라고 권고하고 있다. 그리고 ICER은 효율경계선상에

있는 마지막 비교대안과 비교하여 계산되어야 함을 강조하고 있다. 때로 표준치료가 비용-효

과적이지 않을 수 있는데, 이때는 가능하다면 보다 비용-효과적인 다른 대안을 비교대안으로

고려하는 것이 중요하다고 강조하고 있다. 그리고 대상 인구집단에 따라 비교대안이 달라지

는 경우에는 각각의 인구집단별로 평가하는 것이 적절하다고도 언급하고 있다. 그리고 가용

한 근거가 없는 대안의 경우 경제성평가를 수행하기가 어렵다는 점도 언급하고 있다.

Page 71: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 63 -

<표 20> EUnetHTA 파트너 국가 분석: 비교대안 선택

국가 비교대안 선택

오스트리아 Na

벨기에 Selected by help of an efficiency frontier

크로아티아Therapies routinely used in the Croatian health system, including

technologies regarded as current best practice

체코Therapies routinely used and reimbursed in the Czech health system. The

comparator should be selected and justified properly

덴마크 Na

영국(England)Technologies or tests that are current practice or are recommended in

current NICE guidance (Technology Appraisals and NICE Medical Technologies Evaluation Programme Methods guide)

에스토니아 & 라트비아 Standard treatment or the usual treatment in daily practice

핀란드Therapeutically the most appropriate alternative. Based on Finnish clinical

practice

프랑스 All interventions that compete with the intervention evaluated

독일 All therapeutic alternatives

헝가리 Standard/ most common treatment

아일랜드Routine care, i.e. the technology(ies) most widely used in clinical practice

in Ireland

이탈리아 Current practice

네덜란드 Standard treatment

노르웨이The treatment (drug(s) or health program(s)) that the new pharmaceutical will most likely replace. If currently used treatment not cost-effective, the

efficiency frontier

폴란드Existing practice – procedure that will likely be replaced by assessed

health technology in medical practice (Guideline) Reimbursed technology that is the existing practice should be the first choice (Regulation) Portugal

포르투갈 Current practice, i.e. the most common treatment

러시아Drugs that are already included in the reimbursement list or, if there is

no such drugs, common drugs with similar indications

영국(Scotland)Treatments considered to be in routine use or represent best practice in NHS Scotland, and are the treatments that are most likely to be replaced

슬로바키아The treatment that is most likely to be replaced by the new treatment or, in case of add-on treatments, the current treatment without the add-on

product

슬로베니아The drug with the same therapeutic indication (other drugs can be

included as well)

스페인The standard technology used in current health care practices (AETSA, Osteba, CatSalut, Spanish recommendation). If possible also the most

effective alternatives (Osteba, CatSalut)

스웨덴 The most appropriate alternative treatment in Sweden (e.g. the most used)

스위스 The current treatment standard in Switzerland

출처: EUnetHTA(2015a) Na: No information available

Page 72: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 64 -

4) 기타 문헌고찰 결과

비교 대안을 무엇으로 선정하느냐에 따라 개별 중재법의 비용-효과성이 달라지므로, 비용-

효과적이지 않은 대안을 비교대상으로 함으로써 중재법의 비용-효과성이 왜곡되는 일이 없

어야 한다는 것이 큰 틀에서 합의되는 비교대안 선정 원칙이다(Neyt & Brabandt, 2011;

Drummond et al., 2015; Neumann et al., 2017).

그러나 현실에서는 기존 대안들의 비용-효과성에 대한 정보를 얻을 수 없는 경우가 많은

바, 의사결정에 따른 영향을 살펴본다는 점에서 기존 대안들 중 대체 가능성이 높은 대안을

비교대상으로 선정하여 분석할 것을 권고하는 경우가 많다. (Zhao et al., 2018; Ziouani et

al., 2016; EUnetHTA, 2015)

Neyt & Brabandt (2011)는 상호배타적인 중재에 대한 비용효과분석을 할때에는 효율경계

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, “current care”should be considered. In many cases, this may include more than one relevant comparator. The choice of comparator(s) should be related to the scope of the decision problem. As such, the comparators should reflect the target population of interest and the jurisdiction for which the

decision is being made.(p18)

current care

호주PBAC 지침 version 5(2016)

Select the comparator(s) in the context of the targeted Australian population, the current alternative therapies in Australia, and the therapies most likely to be replaced in clinical practice. A single

comparator will be appropriate in most circumstances. (p13)

Where there is more than one comparator, the main comparator should be the therapy that prescribers would most replace with

the proposed medicine.

임상진료에서의 대체 가능성이 가장

높은 것

영국 NICE 지침 (2013)

When selecting the most appropriate comparator(s), the Committee will consider:

- established NHS practice in England- the natural history of the condition without suitable treatment

- existing NICE guidance- cost effectiveness

- the licensing status of the comparatorThe Committee will normally be guided by established practice in

the NHS when identifying the appropriate comparator(s). (p61)

NHS에서의 진료 현황 고려

EUnetHTA (2015)

it is recommended that the comparator(s) reflect the most relevant alternative intervention(s) used in clinical practice. The choice of comparators should be clearly presented and justified.

<표 21> 비교대안 관련 해외 지침 내용

Page 73: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 65 -

선 상에 위치한 비교대안과 비교하는 것이 바람직하다고 언급하면서, 비용-효과적이지 않은

대안과 비교한 경제성평가 결과는 매우 주의하여 고려되어야 한다는 점을 강조하였다.

Drummond et al. (2015)도 기존 치료를 비교대안으로 고려할 때, 기존 치료법이 현재 평가

대상인 치료법이 없는 상황에서 그 자체로‘최상’인지를 고려하여야 한다는 점을 강조하였

다. 다른 가용한 대안들을 고려하지 않고서는 비용-효과적이지 않은 대안과 잘못 비교함으로

써 잘못된 결론을 내릴 위험이 있기 떄문이다. 적절한 대안으로 비용-효과적일(worthwhile)

있는 가능성이 있는 모든 것을 포함할 것을 주문하였다.

Neumann et al. (2017)은 기존 치료법이 가장 적절한 비교 대안이 아닐 수 있다는 문제점

을 우회하기 위하여, 분석에서는 best available option이나 do nothing option을 포함하여 가

용한 모든 범위의 대안들을 고려할 것을 권장하였다.

Zhao et al (2018)은 문헌검색을 통해 확보한 40종의 경제성평가 가이드라인을 조사하여

비교대안을 어떻게 기술하고 있는지를 비교하였는데, 3종의 가이드라인에서 사용한 비교대안

에 대해 상세한 설명을 하라고만 제시하고 있었고, 다수(15)의 가이드라인은 신기술이 진입

함에 따라 대체가 일어날 가능성이 가장 높은 기술을, 11종의 가이드라인은 표준치료법이 비

교대안으로 선택되어야 한다고 명시하고 있었다고 한다. 2종의 가이드라인은 모든 치료적 대

안들을 포함할 것을 요구하였고, 또 다른 2종의 가이드라인은 가장 적절한 치료(예, 가장 자

주 사용되는 치료, 최소 치료방법, 혹은 어떤 치료도 하지 않는 것)를 비교대안으로 권고하였

다. 대체로 임상 현장에서 통용되는 치료법을 비교대안으로 권고하는 경향이 있음을 확인하

였다.

Ziouani et al. (2016)도 29개국의 경제성평가 가이드라인을 분석하여, 비교대안 선정기준을

확인하였는데, Zhao et al. (2018)의 연구가 발행 주체와는 상관없이 발표한 가이드라인을 비

교분석하였다면, 이 연구는 비교대안 선정기준에 대한 국가별 비교에 초점이 맞추어져있다.

가장 흔히 사용되는 비교대안은 “국내 진료환경에서 사용되는 표준 치료(standard of care

for local practice" (86%)였다. 45%(13개국)에서는 “watchful waiting or doing nothing”도 고

려하라고 권고하였다. “신청약이 등재될 경우 가장 대체 가능성이 높은 치료법(therapy that

prescribers would most replace with the proposed drug)”은 38%의 가이드라인(11개국)에서

바람직한 비교대안으로 언급되었다고 한다. "가장 비용이 낮은 대안(lowest cost alternative)"

을 선택하라고 언급한 가이드라인은 24%(7개국)였으며, 임상진료에서 사용되는, 그러나 “시

판허가가 나지 않은 약(Unauthorized drug)”도 고려하라는 가이드라인은 21%(6개국)이었다.

Zhao et al (2018)의 리뷰에서와 마찬가지로 임상현장에서 통용되는 표준 치료가 가장 널리

언급된 선정기준이었다.

Page 74: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 66 -

5) 이해관계자 의견

☐ 경제성평가제도개선 TF

❍ 경제성평가제도 개선 TF에서 제약업계가 낸 의견은 다음과 같이 요약할 수 있다.

- 오래된 약과 비교하지 말 것,

- 치료적 위치가 동등한 약제들끼리 비교할 것,

- 가용한 근거가 있는 약제와 비교할 것,

- 특허만료약의 경우 최초 등재가로 비교할 것,

- First in class에 해당하는 의약품의 경우 높은 ICER을 적용하거나, 오래된 약을 비교대상

에서 제외하거나, 최초등재가와 비교하거나, 혹은 경제성평가가 아닌 원가기반으로 가

격을 산정할 것,

- 대체약제가 없는 첨단바이오의약품의 경우 별도 트랙으로 평가할 것.

❍ 이에 대해 심평원 측은 현행 지침이 다른 국가의 지침과도 다르지 않고, 경제성평가

의 일반원칙에도 부합하는 바, 변경 사유가 없다는 의견을 제시하였다.

☐ 의견조사 결과

❍ 개별 제약사 의견조사를 통해 TF에서 제시된 의견 외에 다음과 같은 의견이 추가적

으로 제시되었다.

- 시장점유율보다 치료적 위치와 실질적 대체관계가 더 중요함. 치료적 위치 고려 시 허가

적응증이나 가이드라인을 참고할 것

- 시장점유율에 대한 정확한 정보를 알기 어려움. 또한 임상진료 지침 및 교과서와 달리

특이적으로 한국에서만 많이 사용되는 치료가 있다면, 실제 경제성평가 모형 구축이 불

가할 수 있는 바, 임상진료지침, 교과서를 통해 비교약제를 선정할 것을 제안함

- 경제성평가모형의 불확실성을 최소화하기 위해 회사가 가지고 있는 가용한 자료도 함께

고려할 것을 제안함

- 다른 나라에서 평가한 결과도 고려할 것

☐ 전문가 자문회의

- 전문가 자문회의에서는 선정 기준 자체의 변경 필요성은 언급되지 않았다. 다만 가장 많

이 쓰는 약이라는 정의가 애매한 바, 선정 기준을 최대한 구체적으로 제시할 것을 요구

하였다.

- 심평원 실무진과의 간담회에서는 직접 근거가 있는 약을 비교대상으로 선정하는 문제에

대한 검토가 필요하다는 의견이 있었다.

6) 지침 개정방향 제언

Page 75: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 67 -

❍ 비교대안 선정 문제는 오랫동안 제약업계에서 제기해온 이슈 중 하나이다. 그러나 국

내외 지침과 관련 문헌들을 살펴본 결과, 오래된 약을 비교대상에서 배제한다든가, 새

로운 작용기전의 약을 평가할 때 비교대안 선정원칙을 달리한 경우는 찾아볼 수 없었

다. 오히려 실제 임상현장에서 널리 사용된다면 치료법의 형태를 구분하지 말고 폭넓

게 비교대안으로 고려하라는 것이 많은 지침에서 권장하는 바이다. 또한 근거의 가용

성이 아닌 실제 사용현황을 중요하게 고려하라는 것이 일관된 지침이다.

❍ 다만, 우리나라 지침과 다른 나라 지침을 비교해보면 우리나라 지침에서는 대체 가능

한 기존 약들 중 가장 시장점유율이 높은 것을 선택하라고 명시하고 있으나, 다른 나

라 지침에서는 시장점유율이 가장 높은 하나로 한정하는 표현을 쓰지 않는 경우가 많

다. 또한 호주의 평가 결과를 보면(단수의 비교대안을 선정하는 경우가 대부분일 것이

라고 가이드라인에서는 언급하고 있지만) 제약회사가 하나의 약을 비교대안으로 제시

하더라도, 국내 사용현황 등을 고려하여 다른 대안도 secondary comparator로 요구하

는 경우가 많다. 이에 1안으로는 “가장 많이 사용되는”약을 비교대안으로 선정한다

는 기본원칙은 견지하되, 점유율과 관련한 표현을 완화하여 비교약 선정과정에서 대

체 가능성을 우선 고려하되, 다른 상황도 함께 고려할 수 있는 여지를 둔다.

❍ 그 외 그간 평가과정에서 나타난 몇 가지 쟁점에 대해서는 다음과 같이 정리할 것을

제안한다.

- 호주처럼 비교대안 선택 위계를 제시하는 것에 대하여 -> 호주 지침에서는 동일 기전의

약을 비교대안으로 우선 선택한다는 표현이 등장한다. 그러나 호주나 국내의 평가사례

를 보면 ATC level 4 수준에서 동일 기전의 약이 비교대안으로 고려된 경우는 상대적으

로 소수였다. 그리고 호주 외에는 이러한 위계를 구체적으로 제시하고 있는 나라는 드물

었다. 따라서 평가와 지침을 최대한 일치시키고 불필요한 소모적 논쟁을 방지하는 차원

에서 비교대안 선택 위계는 제시하지 않는 것으로 한다.

- 급여되는 약으로 비교대안을 제한할 것인가 -> 다른 나라의 지침을 보면, 신청약을 대체

할 가능성이 매우 높은 약이 동시에 급여신청중에 있거나 조만간 급여예정으로 있다면

이 또한 시장근접대안이라 하여 함께 고려하도록 한 경우가 있다. 그러나 국내 지침의

일차적 사용자가 급여결정신청을 하는 제약사이고 이 경우 경제성평가를 수행하는 시점

에서 시장근접대안에 대한 정보를 확보하기 어려운 바, 지침에서는 등재의약품 중에서

비교대안을 선정하도록 한 애초의 지침을 계속 고수하도록 한다. 다만 시장 상황에 대한

정보는 제약사가 제출한 경제성평가자료와 더불어 위원회 논의 과정이나 협상 과정에서

검토될 수 있도록 한다.

- 대체가능성이 가장 높은 약 vs. 직접 근거가 있는 약(임상시험에서 사용한 비교대안)

Ÿ 때로 시장점유율에 의하여 결정된 비교약제와 임상시험에서 사용한 비교약제가 일

Page 76: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 68 -

치하지 않아, 간접비교를 통하여 비교약제와 신청약제의 상대적 효과를 평가한 경우

가 있었다. 간접비교의 경우 직접비교에 비해 불확실성이 크고, 비교 가능성이 문제

가 되는 경우도 있다.

Ÿ 근거의 질 자체만을 생각한다면 직접비교 자료가 있는 약을 비교약으로 선정하는 것

이 타당하겠으나, 경제성평가의 목적을 생각한다면(이 약이 급여됨에 따라 달라질

상황에 대한 평가), 신약이 등재됨에 따라 어떤 약이 대체될 지를 무시하고, 가용한

자료가 있는지 여부만으로 비교대상을 선정하는 것도 타당하지는 않다.

Ÿ 이에 신약이 등재됨에 따라 대체 가능성이 가장 높은 약을 비교대안으로 선정한다는

기존 원칙을 고수하되, 제한된 경우에 한하여 양질의 근거가 뒷받침되는 대안을 함

께 고려할 수 있도록 여지를 둔다. 가령, 임상시험에서 사용한 비교대안이 다음에 해

당하는 경우 대체 가능성을 기준으로 한 비교대안과 함께 추가적 비교대안으로 고려

할 수 있도록 한다: 1) 표준치료법에 해당하는 경우, 그리고 2) 시장점유율이 가장 높

은 치료법과 신청약을 비교한 직접 근거가 없고, 간접비교를 함에 있어서도 비교가

능성이 문제가 되는 등의 이유로 불확실성이 큰 경우, 3) 임상시험에 사용한 비교약

이 비록 점유율이 가장 높은 치료법은 아니라 하더라도 국내에서 보편적으로 사용하

는 치료법이기는 한 경우.

- 기존 치료법에 실패하였으나 달리 대안이 없어 기존 치료법을 계속 사용하는 경우 신청

약의 비교 대안은? -> 불응의 선행치료제라고 비교대안에서 자동 배제되지는 않는다. 다

른 대안이 없어 해당 치료법을 계속 사용하고 있다면 위약보다는 기존 치료법을 비교대

안으로 선택하는 것이 적절하다. 다만, 허가사항 또는 급여기준에서 중단을 명시하는 경

우라면 비교대안에서 배제하도록 한다.

- 비교 대안이 통상치료법인 경우, 통상치료법을 어떻게 구성할 것인가의 문제(임상연구

기반 vs. 국내 사용 현황 기반) –> 경제성평가의 목적이 신청약이 등재됨에 따라 달라질

상황에 대한 평가라는 점을 감안하여, 실제 국내 사용현황을 기반으로 하여 통상 치료

법을 구성할 것을 제안한다. 다만 국내 사용현황에 따라 구성된 통상치료법과 임상연구

에서 사용된 통상치료법이 효과나 부작용면에서 유의한 차이가 있는 것으로 판단된다

면, 임상연구에서 사용한 통상치료법을 함께 고려할 수 있다.

- 전략 대 전략으로 비교되는 경우 –> 진단검사를 동반한 경우처럼 때로 약 대 약의 비교

가 아니라 치료전략 대 치료전략으로 비교하는 것이 바람직한 경우가 있다. 이 경우 비

교대상이 되는 전략들을 구체적으로 제시하여야 한다.

❍ 2안은 의사결정의 명확성을 고려하여 현 지침을 유지하는 것이다.

Page 77: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 69 -

바. 자료원(간접비교)

1) 현 지침

가) 주요 지침

등재신청 의약품 및 비교대상의 비용과 효과를 추정할 자료원으로는 비뚤림의 가능성이

낮은 자료원(예. RCTs)을 우선적으로 선택하도록 한다. 또한 등재신청 의약품과 비교대

상을 직접비교한 자료원(head to head trials)을 선호하며, 두 대안을 직접 비교한 자료원

이 없을 경우에는 다른 제3의 치료방법이나 위약을 참조대안으로 하여 등재신청약과 참

조대안, 비교대상과 참조대안을 비교한 자료원을 이용할 수 있다. 자료를 검색하고 선정

하는 모든 과정은 투명하게 제시되어야 한다.

나) 지침 내 추가 설명

...그리고 주요 임상 효과(주요 적응증)에 대해 등재신청 의약품과 비교대상을 직접비교

한 자료원(head-to-head trial)을 선택하는 것이 가장 바람직하다. 만약 직접 비교한 자

료가 없을 경우에는 위약(placebo)이나 다른 제3의 치료대안을 참조대상으로 하여 등재

신청의약품과 참조대상, 참조대상과 비교대상을 비교한 자료를 이용할 수 있다”

현 지침에서는 주요 임상효과를 추정할 자료원으로서 등재신청약품과 비교대상약제를 직

접 비교한 자료가 없을 경우에는 위약이나 다른 제3의 치료대안을 참조대상으로 하여 등재

신청의약품과 참조대상 그리고 참조대상과 비교대상을 비교한 자료를 이용할 수 있다는 언

급을 함으로써 간접비교 자료원을 사용할 수 있다는 간단한 기술은 되어 있으나, 위와 같은

간략한 언급 외에 구체적인 지침이 제시되지 않은 상태이다.

2) 기존 제출자료 검토 결과

기존에 경제성평가 자료를 제출한 50품목 중 9개 약제에서 주요 임상효과추정 및 효과차

이 판정을 위해 공통대조군을 이용한 간접비교 또는 단순비교를 통한 간접비교 결과를 제시

한 바 있으며, 제출 자료 평가 과정 중 제약사에 의해 제시된 결과 수용의 타당성을 논의하

는 과정에서 각 자료원에서의 교환가능성 성립 여부나 보정의 필요성 등이 검토되었으며

“임상적 유용성 평가를 위한 간접비교 수행단계별 자료제출 지침”(건강보험심사평가원,

2014)에 제시된 지침에 준하여 논의가 이루어졌음을 확인 할 수 있었다.

임상적 유용성 평가를 위한 간접비교 수행단계별 자료제출 지침은, 간접비교를 수행하여

임상적 효과차이 여부를 결론짓고자 할 때 필수적인 분석가정에 해당 분석자료가 위배되지

Page 78: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 70 -

않는지를 단계별로 평가하고 검토자가 최종분석 결과와 함께 단계별 평가내용을 확인할 수

있도록 제시하도록 하고 있다. 이때 필수적으로 확인하여 제시해야 하는 가정은 간접비교에

포함된 연구들이 서로 교환가능한가 였다. 즉, 환자군 특성, 연구 설계, 약제 사용방법 및 결

과변수 측정 등의 주요 특성에 있어서 충분히 유사하여 해당 연구들로부터 제시된 결과 값

을 합성하여 도출되는 상대효과치가 타당하다고 간주할 수 있는지에 대하여 특성별로 정리

하여 소명한 후 자료를 합성하도록 가이드하고 있다. 이때 간접비교에서 사용되는 공통대조

군에서의 결과 값 또한 연구 간에 충분히 동질한지 확인하도록 권고한다. 연구 특성이 충분

히 유사하였다면 동일한 공통대조약제가 사용되었을 때는 극 결과값도 동질해야하기 때문이

다. 교환가능성에 대한 논란과 함께 경평소위 중 제약사에서 제출된 결과가 수용되지 않은

경우는 위 9건 중 2건에 해당하였고, 간접비교에 사용된 자료의 불확실성을 반영하기 위한

민감도 분석을 추가로 제출하도록 권고하였던 경우가 있었다.

간접비교를 주 임상적효과 추정을 위한 자료제출을 위해 이용하지는 않았으나, 직접비교결

과 자료가 적절하지 않다고 판단되거나 사전에 비열등성으로 설계되지 않은 직접비교결과에

대한 추가 자료로서 간접비교를 제출하여 소명하도록 권고된 경우가 2건이 있었다.

간접비교에 사용된 방법으로는 공통대조군이 부재한 상황에서 수행된 단순비교를 통한 간접

비교가 수행된 4건의 약제평가 결과 중, 정성적 특성 평가에 따른 교환가능성이 인정되어 결

과가 수용된 경우가 2건 있었고, 1건의 경우 인정되지 못하였으며, 그 외 성향점수를 이용하

여 가중치를 부여하여 보정한 방법(IPTW)을 사용하여 제출된 결과에 대하여 방법론적인 수

용가능성이 인정된 경우가 1건이 있었다.

현재 경제성평가지침에서의 간접비교에 대한 언급은 앞서 지적한 대로 매우 간단한 언급

에 그치고 있으나, 심평원에서 제시하고 있는 임상적 유용성 평가를 위한 간접비교 자료제출

지침이 별도로 존재하고 있어 간접비교 수행을 통해 제출자료를 준비하는 제약사는 해당 지

침에 준하여 자료를 준비하여 제출할 것이고 심평원 검토 및 경평소위 평가 과정에서도 해

당 지침이 활용되고 있으므로 경제성평가지침에서 또한 세부적인 가이드로서 해당 지침을

준용하도록 권고하는 일관된 언급이 필요하고, 구체적인 간접비교 자료제출 지침 또한 좀 더

향상된 관점 및 방법론에 대한 수용을 고려하여 향후 개정이 필요할 것이다.

3) 외국 지침

가) 캐나다

크게“Guideline statement”와 “Guideline in Detail” 파트로 구분되어 서술되어진 캐나다

의 “Guidelines for the Economic Evaluation of Health Technologies”(CADTH, 2017)에서는,

세부지침(Guideline in Detail)의 “8. Modelling”절에서 “Incorporating Effectiveness

Page 79: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 71 -

Estimates”관련사항과 “9. Effectiveness”절의 “Data Sources and Assessment”와

“Parameter Estimation”관련 단락 및 “Standard Reporting Format”에서 네트워크 메타분

석(Network Meta-analysis)에 대한 언급이 이루어지고 있다.

지침 내 주요 언급으로는, 기저상태에서의 결과와 상대 효과 모수 값이 네트워크 메타 분

석 연구에서 추정되는 경우 자료가 현재 맥락에서 대상 모집단을 충분히 대표하는지 평가목

적에 부합하는지 고려하여 정당화하여야 한다는 것이며, 자료원으로서 기존의 메타분석이나

네트워크 메타분석을 고려할 때 기존 분석의 목적과 범위 및 선정/제외기준이 적합하며 현

의사결정과 연관되어 있는지 평가되어야 한다는 것이다.

본 지침에서는, 사용 가능한 모든 자료를 결합할 수 있는 방법이 없는 경우에는 목적, 신

뢰성 및 일관성 측면에서 적합하다고 평가된 자료를 합성하는데 집중하여 메타분석 또는 네

트워크 메타분석 방법을 사용할 수 있음을 언급하였다. 특정 의사결정에 필요한 정보를 제공

하기 위한 경제성평가와 관련하여, 의사결정에 두 개 이상의 비교대안이 고려되어야 하거나

또는 서로 직접 비교된 적이 없는 두 개의 비교대안이 포함될 수 있고, 이 때에는 결과적으

로 동시에 여러 중재법에 대한 비교가 가능하며 간접비교에 기반을 둔 데이터의 통합을 허

용하는 네트워크 메타분석이 쌍으로 짝을 지어가며 비교하는(pairwise) 메타분석 접근보다 선

호될 수 있음을 기술하고 있다.

본 지침에서 간접비교에 대한 수행 접근 등 세부사항을 구체적으로 제시하고 있지는 않으

나, 유효성 결과자료에 대한 자료원으로서 기존의 메타분석뿐 아니라 네트워크 메타분석을

나란히 언급하고 있음이 2017년 개정판의 새로운 사항이라고 할 수 있으며, 메타분석뿐 아니

라 네트워크 메타분석도 자료원으로서의 적합성을 명확하게 소명할 것임이 명시적인 가이드

로서 제시되어있다. 구체적으로 어떠한 방법과 접근을 사용해야 할 것인지는 본 지침에서 언

급하여 기술하고 있지는 않으나 방법론적인 참고지침으로서 Cooper et al. (2015)의 문서를

지침 내에서 제시하였다.

본 지침에서 부록으로 제시되는 표준 보고 형식(Standard Reporting Format)에서 제시되는

각 보고서 절에서 제시되어야 할 사항 중, 유효성 결과 관련한 방법론 제시에 네트워크 메타

분석을 위한 별도의 사항은 언급되지 않고 있으며 다만 표준적인 세부사항을 언급함에 있어

서 자료원의 예시로서 임상시험, 메타분석, 네트워크 메타분석을 나란히 언급하여 네트워크

메타분석을 자료원에“고려”함을 명시하였다고 할 수 있다.

경제성평가 지침에서 구체적인 방법론 지침으로 참고하도록 제시되는 Cooper et al. 의 문

헌은 타당한 네트워크 메타분석은 어떠한 것이며 어떠한 가정을 충족해야 하는지를 상세히

제시하고 다양한 이슈들을 설명하였으며, 케이스 스터디를 예시하고 있다. 본 문헌에서는 네

트워크 메타분석에서 고려되는 네트워크는 아래 그림 3의 i)에서 보는 바와 같이 연결이 된

네트워크이어야 하며 ii)에서와 같은 연결이 되지 않은 네트워크에서의 네트워크 메타분석은

Page 80: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 72 -

타당하지 않음을 명시하였고, 네트워크에 관심 의사결정과 관련이 없는 중재가 포함되는 경

우 이를 설명해야 함을 명시하였다. 또한, 타당성의 조건으로서 일관성(Consistency) 가정이

만족되지 않으면, 네트워크 분석에서 얻어지는 중재법 간 중재 효과가 짝에 따라서 다르게

나타날 수 있으며 이 경우 해석이 어렵고 의사결정 모형에 포함하기 어려움을 명확히 하였

다. 따라서 네트워크 메타분석을 수행할 때는 일관성 가정에 대하여 명확히 해야 하며 이에

대한 평가 방법을 제공해야 함을 강조하였다.

[그림 3] Use of network meta-analysis to inform clinical parameters in economic evaluations

출처: Cooper et al. (2015)

나) 호주

호주의 “Guidelines for preparing submissions to the Pharmaceutical Benefits Advisory Committee”는 PBAC (Pharmaceutical Benefits Advisory Committee)에 제출할 자료를 준비하

Page 81: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 73 -

기 위한 지침으로서 자료제출 준비를 위한 구체적이고 세부적인 사항들을 담고 있으며, 간접

비교와 관련한 사항은 이전의 4.3판 (PBAC, 2008)과 2016년에 개정된 5판(PBAC, 2016) 모두

기본적으로 간접비교 워킹그룹의 방법론 보고서 (PBAC, 2008)를 참조하여 제시되고 있다. 다

만, 이전 판에서는 공통대조군을 이용한 비교적 단순한 구조 안에서 매우 엄격한 평가에 기

반을 둔 간접비교에 한정하여 간접비교 자료제출을 권고하고 있는 반면 최근의 개정판에서

는 네트워크 메타분석이나 혼합비교 등에 대한 언급으로 간접비교의 범위를 넓게 언급하여

제시하고 있다. 근본적으로는 분석에 필수적인 가정의 성립과 분석의 타당성에 대한 구체적

이고 세부적인 소명자료를 명확히 제출하도록 권고하고 있으며, 기본적으로는 단순구조를 선

호하여 수행하여야 한다는 점에 있어서는 기존 권고의 틀에서 크게 벗어나지는 않는다.

호주의 PBAC 지침은 전반적인 자료제출 준비를 위한 가이드로서 매 평가별로 상당히 구

체적인 사항 들을 제시하는 것이 특징이며, 5판 지침에서는 “Section 2 Clinical evaluation”

에서 구체적으로 간접비교와 관련한 권고가 이루어지고 있다. 임상적 평가에 대한 자료로서

PBAC은 직접 무작위배정 시험을 기반으로 한 임상 및 경제 평가를 강력하게 선호함을 우선

제시하고, 직접 무작위 시험이 항상 가능한 것은 아니므로 본 지침은 간접비교를 고려하기

위한 틀을 제공함을 언급하고 있다. 이에 따라, 간접비교에 대한 별도의 준비지침을 포함하

고 있다기보다는 전반적인 자료제출을 위한 단계에 따라 간접비교가 포함될 경우 추가적으

로 고려해야 할 사항들이 언급되고 있는 방식이다. 예를 들어, 임상적 주장이나 평가의 범위

를 정할 때, 문헌 검색을 수행할 때, 대상 집단을 정의할 때, 비열등성 평가를 위한 마진을

결정할 때, 분석결과를 제시할 때 등 각 단계에서 간접비교가 관련되어 있을 때의 요구사항

을 추가적으로 언급하거나 구체적으로 제시하는 방식을 취하고 있다.

임상평가 결과에 대한 제출자료에 간접비교가 포함될 경우에 대한 구체적인 사항은 “2.6

Trial results: additional analysis” 절에서 임상평가 결과에 소그룹분석이 이용된 경우, 메타

분석이 이용된 경우, 치료 전환에 대한 보정이 이루어진 경우, 간접비교가 이용된 경우에 대

한 구체적인 각 소절을 제공하였다.

간접비교 평가에 포함된 임상시험에 대한 대상자 기저 특성, 치료의 세부사항, 결과변수

정의 및 포함된 개별 임상시험에 대한 결과를 표준적인 방식에 따라 제시하도록 하며,

Bucher 방법에 따른 쌍별(pairwise) 비교 방법, MAIC (matching-adjusted Indirect Comparison)

방법, 시뮬레이션 중재 비교(Simulated Treatment Comparison), 네트워크 메타분석 또는 혼합

비교(Mixed Treatment Comparison)와 같은 간접비교 수행방법을 기술할 것을 권고하여 해당

방법들에 대한 이용 가능성을 제기하였다.

그러나 아래와 같은 원칙을 제시하여 엄격한 가정에 대한 불확실성이 큰 분석결과는 고려

하지 않을 것임을 명시하고 있다:

1) 네트워크 안에 포함된 각 가능한 경로에 대해 중재들의 짝에 대한 쌍별 비교를 수

Page 82: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 74 -

행하여 결과를 제시하는 것을 기본으로 권고하였으며, Bucher 방법을 제안함

2) 복잡한 네트워크 메타분석을 수행하는 것은 보조적인 분석으로 제시할 것

3) 네트워크 분석에 비무작위 연구가 포함하는 것은 피해야고, 만약 포함한 경우 해당

연구 들을 포함했을 경우 포함하지 않았을 경우 결과를 모두 제시할 것

4) 보정이 되지 않은 단순비교나 분석에 포함된 연구들의 전이성(transitivity)이 충족되

지 않은 간접비교 결과는 PBAC 의사결정 과정에서 결과 해석에 대한 신뢰를 얻는

데 어려움이 있을 것이며, 적어도 한 개의 연구에서 개별환자자료(IPD: Individual

Patient-level Data)를 사용할 수 있는 경우 MAIC 혹은 시뮬레이션 중재 비교법을

사용하여 연구 간 이질성을 보정할 것

또한, 분석을 재현할 수 있을 만큼의 충분히 구체적인 분석 과정과 프로그램 코드를 제공

할 것과, IPD가 요구되는 분석방법을 이용한 경우 IPD 자료의 스프레드시트를 함께 제출하고

그렇지 못한 경우 이유를 소명할 것을 명시하였다.

간접비교 수행에서 요구되는 전이성(transitivity) 가정은 간접비교 내의 중재 간 비교 결과

가 알려진 중재효과 수정인자(treatment effect modifier)의 분포에 따라 달라지지 않아야 함

을 의미한다. 캐나다의 CADTH 지침에서 언급하는 일관성(consistency)과도 같은 개념이며,

PBAC의 이전 4.3판 지침에서 중요하게 다루었던 교환가능성(exchangeability)의 확장된 개념

이라고 할 수 있다. 본 지침은 간접비교에 대한 전이성 가정에 대해 단계별로 평가하여 제시

하도록 아래 그림 4에 제시된 표를 통해 틀을 제공하고 있다.

[그림 4] Steps to assess the transitivity assumption

출처: Guidelines for preparing submissions to the Pharmaceutical Benefits Advisory Committee (version 5). (PBAC, 2016)

Page 83: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 75 -

제시된 표를 통한 단계별 평가 방법과 더불어 각 단계가 무엇을 의미하는지에 대한 부연

설명을 덧붙여 제시하였다. 같은 개념과 관점에 기반하고 있는 만큼 기본적으로 이전 판 지

침에서의 교환가능성 평가 방법 및 제시 과정과 매우 유사하며, 다만 IPD가 가용한 경우에

이용할 수 있는 보정방법이 추가적으로 언급된 점이 차이라고 하겠다. 이에는, 아래와 같은

내용이 포함된다:

- 연구 세트 내 혹은 연구 세트 간의 특성 차이를 요약하고(아래 그림 5에 제시된 바와

같이 메타분석 수행 시 이질성 탐색을 위한 정성적 평가 방법으로서 제시된 잠재적 특성

표를 상호 참조할 것을 권고), 효과 차이에 가능한 영향에 대하여 명확히 기술할 것

[그림 5] Example factors that might cause comparative treatment effect heterogeneity

출처: Guidelines for preparing submissions to the Pharmaceutical Benefits Advisory Committee (version 5). (PBAC, 2016)

Page 84: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 76 -

- 만약 간접비교에 에 교란요인이 포함되어 있다면 메타회귀분석(meta-regression)을 적용

하는 것이 적절하며, 변수당 10개 이상의 연구가 있어야 결과에 안정성이 있음을 언급하

였다. Butcher 방법을 이용한 쌍별 비교에 덧붙여 MAIC나 시뮬레이션 중재 비교를 이용

할 수 있음

- 공통대조군에서의 사건발생률(event rate)을 비교할 것

- 비교효과를 추정하기 위한 측정치가 무엇인지에 따라 통계적 이질성에 영향을 끼치는지

평가할 것

간접비교를 통한 결과를 제시하는 방법은 개정판 이전과 같이 이분형 자료를 기반으로 하

여 틀을 제시하였고, 몇 가지 추가적으로 주목할 사항으로 아래의 내용이 언급되었다:

- 공통대조군이 여러 개 존재하여 복수의 간접비교가 가능한 경우, 이에 대해 명확히 제시

하고 간접비교별 상대효과들을 비교하여 설명할 것

- 추정된 상대효과 값에 있어서 설명될 수 없는 차이가 있다면 해석에 어려움이 있음을

주지할 것

- 적절한 경우에는 네트워크 메타분석을 보충적으로 수행하여 제시할 것

- 특정 이유로 분석에서 제외된 연구가 있는 경우에는 이를 포함하거나 배제한 상태에서

의 민감도 분석을 수행하고, 이질성을 증가시키는 연구나 연구세트를 제외한 민감도 분

석을 수행할 것

다) 영국

영국의 NICE(National Institute for Health and Care Excellence)에서 제시된 “Guide to the

methods of technology appraisal”(NICE, 2013)은 개정판에서도 이전 판과 같이 큰 틀과 범위

에 대한 원론적인 원칙을 제시하는 지침의 성격을 가지고 있으며, 네트워크 메타분석에 관한

내용은 기본분석에 대한 원칙을 제공하는 5장의 “5.2 Synthesis of evidence on health

effects”에서 체계적 문헌고찰에 대한 원론적 접근과 함께 “Indirect comparisons and

network meta-analyses”라는 제목의 소절로 구성되어 언급되고 있다.

일단 기본분석은 직접비교임상시험 기반하여 제시되어야 하며, 단일 RCT 내에서 평가되지

않은 의료기술을 비교할 때는 RCT를 이용한 일련의 쌍별 비교 분석을 수행하고 적절한 경

우에는 네트워크 메타분석과 함께 제시할 것을 권고하고 있다. 네트워크 메타분석은 RCT를

이용한 기본분석에 추가분석으로서 수행되고 이에 동반한 모든 내용이 완전하게 설명되고

제시되어야 함을 언급하였다.

평가위원회는 간접적인 출처에서만 도출된 상대적인 효과의 추정을 고려할 때 직접적인

증거의 부족 및 이에 관련된 추가적인 불확실성을 평가에 고려할 것이며, 쌍별 메타분석에서

Page 85: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 77 -

준수해야 하는 모든 표준적인 원칙은 보정된 간접비교 및 네트워크 메타분석을 수행할 때도

따라야 함을 언급하였다.

본 지침에서 사용하는 네트워크 메타분석이라는 용어는 보정된 간접비교를 포함하여 혼합

비교와 같은 보다 복잡한 증거 합성 분석을 지칭하며, 보정된 간접비교는 관심 의료기술이

RCT를 통해 서로 직접 비교되지 않았지만 공통 비교대조군을 사용하여 간접적으로 비교된

임상시험들로부터의 데이터의 합성을 의미하고, 혼합비교에는 평가대상 중재와 대안치료를

직접비교한 RCT 연구 또는 평가대상 중재나 대안 중재 중 하나를 포함하는 RCT 연구가 모

두 포함되는 분석으로서 정의하였다.

혼합비교나 간접비교를 수행할 때는 자료 합성 방법에 대한 명확한 설명과 RCT에 대한

검색과 선정 및 제외 기준에 대한 이론적 근거를 제시하고 네트워크 메타분석에 포함된 개

별 임상시험의 수행방법과 결과 및 각 시험에 대한 기저 특성 표를 문서화하여 제시할 것을

권고하였다.

쌍별 비교 결과에서의 이질성과 직접비교 및 간접비교 결과 사이의 일관성에 대해 보고해

야 하며, 네트워크 메타분석 내에서 비일관성이 발견되면 이러한 불일치를 소명하고 해결하

기 위한 시도가 이루어져야 함을 권고하였다.

간접비교 또는 네트워크 메타분석의 접근을 사용하여 근거를 합성하는 모든 경우에 임상시

험의 무작위배정이 유지되어야 하며, 즉, 서로 다른 무작위배정 임상시험에서 얻은 단일 치

료군의 결과를 비교하는 것은 허용되지 않음을 밝히고 있다. 이러한 유형의 비교가 제시되

면, 결과자료는 본질적으로 관찰적 연구에서 얻어진 자료의 수준으로 취급되며 증가된 불확

실성을 고려할 것임을 언급하였다.

네트워크 메타분석으로부터의 얻어지는 근거는 표 및 그래프를 이용하여 제시할 것과, 네

트워크 메타분석에 포함되는 직접 및 간접 자료에 명확하게 구분하고 각 비교에 포함되는

임상시험의 개수를 명시하도록 하였다. 또한, 직접비교를 사용한 쌍별 메타분석 결과는 전체

네트워크 메타분석을 기반으로 한 결과와 함께 제시되어야 함을 명확히 하였다.

쌍별 메타분석 또는 네트워크 메타분석에 포함하기에 충분한 자료가 없는 경우에는 합성

을 지양하고 개별 연구를 비판적으로 평가하고 결과를 기술적으로 제시하는 정성적 접근으

로 제한되어야 하며, 평가위원회는 결과를 검토하고 평가대상 중재의 치료 대안에 대한 상대

적 임상효과에 대한 결론을 도출할 때 특히 주의할 것을 언급하였다.

불확실성 검토에 대한 지침 관련 부분에서 메타분석에 뿐 아니라 네트워크 메타분석에서

특정 연구의 질이나 또는 관련성이 의심되는 경우에는 민감도 분석을 수행하여 제시할 것을

함께 언급하기도 하였다.

지침의 본문에 덧붙여서 발간된“Developing NICE guidelines: the manual – appendices”(NICE, 2014)는 지침의 각 내용에 따라 필요한 기준이나 체크리스트 등의 부록

Page 86: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 78 -

을 제시하고 있는 바, 네트워크 메타분석에 대한 결과를 보고할 때는 해당 부록에서 제시된

PRISMA-NMA 체크리스트 수정판의 기준을 충족해야 함을 명시하였다. PRISMA-NMA 수정판

체크리스트는 전체 PRISMA-NMA 체크리스트 중 특히 네트워크 메타분석 결과를 보고하는

데 적용할 항목으로 구성되었고, 각 항목에 대한 구체적인 설명은 전체 PRISMA-NMA

(Hutton et al., 2015)를 참고하도록 하였다.

PRISMA-NMA 수정판 체크리스트에서 다루어지는 주요 내용은 다음과 같다:

- 네트워크 메타분석이 수행된 이유에 대한 언급

- 포함된 임상시험들의 연구 특성을 보고

- 네트워크의 구조 및 이와 관련된 잠재적 비뚤림을 탐색하는 데 사용되는 방법을 설명

- 결과를 요약하기 위해 사용된 측정치에 대해 기술

- 데이터를 처리하고 각 네트워크 메타분석에 대한 수행 및 결과 합성 방법을 설명

- 네트워크에서 직간접 근거의 일관성을 평가하기 위한 통계적 접근 방법을 기술

- 직접결과와 간접결과의 비일관성이 발견되었을 경우 해결하기 위해 사용된 통계적 접근

방법을 기술

- 네트워크를 시각화할 수 있도록 그래프를 제공

- 결과의 제한점에 대한 논의

- 전이성 및 일관성과 같은 가정의 타당성에 대한 논의

- 네트워크 형태와 관련된 논의

라) 각국 지침 요약

국가 내용

캐나다CADTH

4th Edition (2017)

Ÿ 본문에 네트워크 메타분석 사용에 대해 언급됨

Ÿ 직접 비교된 적인 없는 비교대안이 포함된 여러 개의 치료대안이 동시에

비교되어야 할 때는 네트워크 분석이 선호될 수 있음

Ÿ 구체적인 세부지침은 제공되지 않으며 방법론 문서 (Cooper et al., 2015)를

참고하도록 가이드

Ÿ Cooper et al. (2015) 에는 연결이 되지 않은 네트워크에서의 분석은 타당하지 않음을

명시하였고 (단순비교는 여기에 해당함), 일관성 가정에 대해 명확히 하고

평가방법을 제공할 것을 강조하였음

호주PBAC 지침 version 5(2016)

Ÿ 네트워크 메타분석, 혼합비교 등의 사용에 대해 언급됨

Ÿ 단순한 구조 안에서 쌍별 비교 수행이 기본 이며 복잡한 네트워크 분석은 보조적인

분석으로 제시할 것

Ÿ 간접비교에 포함된 대상자 기저특성, 치료세부사항, 결과변수 정의 개별임상시험

결과들을 표준방식으로 제시

Ÿ 간접비교 수행방식을 구체적으로 기술

Page 87: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 79 -

4) 기타 문헌고찰 결과

임상적 효과 평가에 평가대상 약제(A)와 대안 약제(B) 간 직접비교 임상시험을 통해 이루

어진 평가 결과를 우선한다는 것은 모든 지침에서 공통적으로 천명하고 있는 사항이나, 직접

비교 임상시험이 수행된 바 없거나 존재하지 않은 경우 두 약제를 간접비교방법을 선택하게

되고, 간접비교는 그림 6에서 보는 바와 같이 일단 두 약제가 공유하는 공통적인 대조군(P)

을 거쳐서 이루어지는 간접비교인 (a)의 경우와 단순비교인 (b)의 경우로 크게 나눌 수 있을

것이다.

(a) (b)

[그림 6] 공통대조군을 포함한 간접비교(a)와 단순비교(b)

간접비교를 수행할 때는 간접비교를 통해 얻어진 결과에 타당성이 있음을 소명해야 한다.

간접비교가 수행될 때는 다양한 보정 방식이 고려될 수 있는데, 최근의 개정판 해외 지침들

Ÿ 일관성이 충족되지 않는 간접비교 결과는 받아들여지지 않을 것임

Ÿ IPD 가 가용한 경우 MAIC 또는 STC 방법 등을 사용하여 최대한 보정할 것

Ÿ 분석 재현이 가능할 만큼 구체적인 분석과정과 프로그램 코드를 제출할 것

영국 NICE 지침 (2013)

Ÿ 간접비교를 사용하게 될 경우 일련의 쌍별 비교가 우선 이며 적절한 경우에는

네트워크 메타분석을 추가적으로 제시할 수 있음

Ÿ 동반한 모든 내용이 완전하게 설명되고 제시되어야 함

Ÿ 직접비교 및 간접비교 결과 사이의 일관성에 대해서 보고해야 함, 비일관성이

발견되면 불일치를 소명

Ÿ 네트워크 메타분석 접근을 이용하는 경우 무작위배정이 유지되어야 함 (캐나다

경우의 연결되지 않은 네트워크 분석은 타당하지 않다는 것과 같은 언급. 즉,

단순비교는 안됨)

Ÿ 네트워크 메타분석을 수행해야 자료를 제출할 때 보고서는 PRISMA-NMA 수정판

체크리스트에 따라서 작성할 것

Page 88: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 80 -

에서 보정방법으로 언급되고 있는 MAIC (Matching adjusted indirect comparison) 방법과 STC

(Simulated treatment comparison) 에 대하여 간략히 요약하여 제시하고자 한다.

(a)의 경우 P-A 임상시험과 P-B 임상시험 중 적어도 하나 또는 (b)의 경우 A B 각각 의

단일군 연구 중 적어도 하나의 임상시험에 대한 개별환자자료(IPD)가 존재할 때 MAIC 혹은

STC를 통해 두 임상시험에 포함된 참여자들의 특성 차이를 줄여 A와 B의 비교성을 높일 수

있기를 기대하는 것이다.

가) Matching Adjusted Indirect Comparison (MAIC)

P-A 임상시험과 P-B 임상 중 하나의 임상시험에 대한 IPD 가 존재하는 경우 수행할 수

있는 방법으로, 한쪽 모집단에서는 IPD를 사용할 수 있고 다른 쪽 집단에서 요약 자료만 가

용한 경우에 적용되는 방법으로, 일종의 성향점수 가중치(propensity score weighting) 적용

방법이다. IPD가 가용한 모집단에 속하는 개개인에 상대편 모집단에서의 공변량 분포와 균형

을 맞추기 위해 성향점수의 역으로 가중치를 적용한다. IPD가 두 모집단 중 한쪽에서만 이용

가능하기 때문에 기존의 성향점수 이용방식과는 다르게 성향점수 추정에 대한 새로운 접근

방식이 필요하다.

기본 아이디어는 Inverse Probability Weighted Estimator 방법과 같이 모두 동일한 가중치

를 자료에 재가중치를 부과하여 상대효과 추정치를 보정하는 방식이다. IPD가 존재하는 임상

시험에 포함된 환자들이 요약자료(aggregate data)만 존재하는 임상시험에 포함될 확률을 효

과추정 시 가중치로 반영하여 값을 추정한다. IPD가 있는 모집단의 대상자 중 요약자료만 있

는 임상시험의 평균 환자 특성과 유사한 경우 높은 확률을 갖게 되고, 결국 두 임상시험의

환자 특성의 분포가 비슷하게 조정되게 되는 것이다. 절차는 아래와 같이 요약할 수 있다.

❍ Step 1: 분석에 사용할 표본 선택

- P-A 임상시험에 대해서는 IPD 가 존재하고 P-B 임상시험에 대해서 요약자료가 존재한

다고 할 때, P-A trial 의 선정제외기준은 P-B 임상시험의 선정제외기준보다 넓은 범위

혹은 같은 범위를 갖고 있어야 한다. 또한, 한쪽은 이중눈가림 연구인데 한쪽은 공개임

상시험 이라든지 등의 임상시험들 간 연구 설계상의 차이가 없어야 한다.

❍ Step 2: 자료를 파악하여 matching에 사용할 환자들의 기저특성들(baseline

characteristics)을 선정

❍ Step 3: 두 임상시험들 간 집단을 matching

- P-A 임상시험의 각 환자들을 P-B 임상시험에서 보고된 평균 환자 특성에 matching 하기

Page 89: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 81 -

위해 reweighting 한다.

Step 3의 matching 방법은 아래와 같이 요약할 수 있다.

❍ 각 연구(P군은 잠시 제외)의 변수: (X, T, Y)

X: vector of baseline characteristics (e.g. age, sex, baseline disease severity, etc.)

T: T=0 for A, T=1 for B

Y: outcome measure

데이터:

A의 IPD : , B의 aggregate data:

→ 최종 도출될 B에 대한 A의 효과 크기:

,

: 특성을 가진 i번째 환자가 T=1 vs T=0 치료를 받게 될 odds

❍ 구하기

- logistic regression을 따름을 가정하여 로 표현함

- 을 구하는 방법은 다음 방정식을 통해 얻을 수 있음:

❍ 분석에 P군이 포함된 경우

각 연구의 variables : (X, T, Z, Y)

P군인 경우는 Z=0

B의 aggregate data: when , when

, : P-B trial의 P군과 B군에 포함된 각 환자 수

→ 최종 도출될 B에 대한 A의 효과 크기:

Page 90: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 82 -

좀 더 구체적인 세부 이론적 설명과 예시 등을 Signorovitch et al. (2010) 및 Phillippo et

al. 의 NICE DSU 방법론 보고서(Phillippo et al., 2016)및 논문(Phillippo et al., 2018)을 통해

참고할 수 있다.

나) Simulated Treatment Comparison (STC)

STC는 P-A 임상시험과 P-B 임상시험 중 하나의 혹은 둘 모두에 대한 IPD 가 존재하는 경

우 수행할 수 있는 방법이다. 한 임상시험의 IPD를 사용하여 회귀분석을 통해 모형을 적합하

고 추정한 후 이 모형에 다른 임상시험의 요약 자료 혹은 IPD를 대입한 예측을 통해 상대효

과 추정치를 얻는 방법이다.

STC 방법을 적용하기 위해서는 P-A 임상시험과 P-B 임상시험의 모집단이 충분히 겹쳐야

한다. 즉, 공변량들의 분포 및 두 임상시험의 선정제외기준이 충분히 유사해야 한다. 본 방법

을 적용하기 위해서는 예후요인(prognostic factor)와 효과 수정인자(effect modifier)를 구분하

여 정의할 필요가 있다. P-A 임상시험에 대해서는 IPD가 P-B 임상시험에 대해서는 요약자료

가 존재하는 상황을 기준으로 방법을 다음과 같이 요약하여 설명할 수 있다.

❍ Step 1: P-A trial의 IPD 를 이용하여 regression model을 fitting

: 설명변수, :독립변수, : Link function (Identity link function의 경우, g(Y)=Y)

: 치료군

: intercept term

a vector of coefficients for prognostic variables

X=0 에서 P에 대한 A의 relative effect

a vector of coefficients for effect modifiers

❍ Step 2: P-B trial에서 관찰될 P에 대한 A의 효과 크기 추정

P-B trial 의 aggregate data: , , ,

Page 91: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 83 -

: p에 대한 A의 효과

❍ Step 3: A에 대한 B의 효과 크기

로 추정 가능

좀 더 구체적인 세부 이론적 설명과 예시 등을 Caro et al. (2010) 및 NICE DSU (NICE 방

법론 보고서(Phillippo et al., 2016) 및 부연 논문(Phillippo et al., 2018)을 통해 참고할 수 있

다.

다) 두 방법의 적용

최근 자주 거론되는 MAIC와 STC와 같은 방법을 이용한 간접비교를 일종의 모집단 보정

간접 비교(Population Adjusted Indirect Comparison) 방법이라고 할 수 있다. NICE DSU 보고

서는 두 방법에 대해서 매우 상세한 리뷰와 이론적 설명, 가정, 분석 방법, 적용 예시, 문제

점 등과 함께 NICE 제출문서에 임상적 효과 제시를 위해 사용할 때를 위한 권고사항을 제시

하고 있다. 모집단 보정 중재 효과 추정치를 고려하는 데는 명확한 배경이 있지만 실제로 어

떻게, 언제 적용해야 하는지, 그리고 얻어진 결과가 해당 의사결정과 관련이 있는지 여부에

대해서도 명확하지 않으며, 이는 한 분석에서 했던 가정이 동일 조건에서의 추후 다른 분석

에서도 동일하게 적용되지 않을 위험이 커지기 때문이다. 따라서 해당 보고서는 아직 추가로

명확해져야 할 부분이 많고 현재는 잠정적이라는 단서 하에, 일련의 방법 적용에 대한 권장

사항을 제시하였고, 간접비교 방법 선택 및 구현 방법 및 결과 제시 방법을 요약한 모식도와

순서도를 제공하였다.

5) 이해관계자 의견

가) 전문가 의견

- 없음

나) 제약사 의견

개정이 필요한 이유로서 공통대조군 간접비교를 수행할 수 없는 경우의 방법론으로서

MAIC (matching adjusted indirect comparison)나 다른 간접비교 수행방법으로 네트워크

메타분석에 대한 언급이 없음을 지적하며, 여러 가지 간접비교 수행방법에 대한

수용가능성에 대해 명시해줄 것을 개정의 방향으로 요청한 바 있다.

Page 92: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 84 -

6) 지침 개정방향 제언

현 지침에서는 주요 임상효과를 추정할 자료원으로서 등재신청약품과 비교대상약제를 직

접 비교한 자료가 없을 경우에는 위약이나 다른 제3의 치료대안을 참조대상으로 하여 등재

신청의약품과 참조대상 그리고 참조대상과 비교대상을 비교한 자료를 이용할 수 있다는 언

급을 함으로써 간접비교 자료원을 사용할 수 있다는 간단한 기술은 되어있으나, 위와 같은

간략한 언급 외에 구체적인 지침이 제시되지 않은 상태이므로, 좀 더 구체적인 언급과 방향

성의 제시는 필요하다.

현재 경제성평가지침에서의 간접비교에 대한 언급은 매우 간단한 언급에 그치고 있으나,

심평원에서 제시하고 있는 임상적 유용성 평가를 위한 간접비교 자료제출 지침이 별도로 존

재하고 있어 간접비교 수행을 통해 제출자료를 준비하는 제약사는 해당 지침에 준하여 자료

를 준비하여 제출하고 있고, 심평원 검토 및 경평소위 평가 과정에서도 해당 지침이 활용되

고 있으므로 경제성평가지침에서 또한 세부적인 가이드로서 해당 지침을 준용하도록 권고하

는 일관된 언급이 필요하고, 구체적인 간접비교 자료제출 지침 또한 새로운 방법론 등에 대

한 수용을 고려하여 향후 개정이 필요할 것이다.

기존에 제출된 50건의 자료 중 간접비교를 사용하여 임상적 유용성 자료를 제출한 9건의

사례 중 공통대조군 간접비교 5건 중 1건이 불인정 되었고, 공통대조군 없이 수행된 단순비

교가 4건이 있었고 이 중 1건이 불인정 된 바, 3건의 간접비교는 단순비교로 결과가 인정된

사례였다. 공통대조군이 부재한 상황에서 수행된 단순비교를 통한 간접비교가 수행된 4건의

약제평가 결과 중, 인정되지 못한 1건 외 정성적 특성 평가에 따른 교환가능성이 인정되어

결과가 수용된 경우가 2건 있었고, 그 외 1건은 성향점수를 이용하여 가중치를 부여하여 보

정한 방법(IPTW)을 사용하여 제출된 결과에 대하여 방법론적인 수용가능성이 인정되었다고

보고서에 기술된 바, MAIC 와 같은 방법을 사용하였을 것으로 사료된다. 따라서 현재 심평

원 평가과정에서는 상당수의 단순비교도 검토되고 있고 이미 MAIC 와 같은 방법이 수용된

경우도 있다고 할 수 있겠다.

심평원의 경제성평가지침에서 간접비교에 대한 언급은 거의 없었으나, 별도의 간접비교 지

침이 준용되고 있었고 해당 지침은 2014년 개정판에서 이해관계자들의 요청을 받아들여서

단순비교에 대한 수용가능성을 이미 열어 놓았으므로 오히려 해외 지침보다 더 완화된 기준

을 가지고 있었다고도 볼 수 있다.

앞서 요약된 바와 같이, 캐나다, 호주 및 영국의 의료기술평가를 위한 지침서 모두에서 네

트워크 메타분석에 대한 사용이 언급은 되고 있으나 실제로 내용을 보면 매우 제한적인 상

황으로 한정하고 있음을 알 수 있다. 캐나다와 영국의 지침은 사실상 네트워크 분석은 보조

적인 자료로만 제출되어야 하고 단순비교는 허용하지 않는 것으로 기술되어 있고, 호주의 경

Page 93: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 85 -

우도 네트워크 분석은 단순한 구조 안에서 수행하고 IPD가 가용하다면 MAIC나 STC와 같은

방법을 써서 보정하고 사용된 방법론과 타당성에 대해 충분히 소명하라고 제시되어 있다.

캐나다의 경우는 Cooper et al. (2015)의 별도 참고문헌으로 방법론적인 지침을 제시하고

있고, 영국의 경우에는 NICE DSU 보고서가 그러한 역할을 하고 있다. Cooper et al. (2015)에

서는 이어지지 않은 네트워크를 포함한 분석은 타당하지 않다고 제시하고 있고, NICE DSU

보고서는 MAIC 또는 STC 등의 보정 방법에 대해서 심도 있는 장단점을 제시한 후 의존하기

에는 불확실한 점이 많으므로 제출자는 최대한 타당성을 소명하며 수행하되 받아들여지는

데는 어려움이 있을 수 있음을 제시하고 있다.

MAIC나 STC는 기본적으로 IPD가 가용할 때 적용할 수 있는 방법으로, 글로벌 제약회사의

본사 환자자료를 이용하여 분석이 가능하고 해당 방법론이 상황에 적절하다면 시도될 수 있

는 접근이고, 현재 심평원의 간접비교 지침은 단순비교 결과 제출에 대하여 열려 있으나, 단

순비교를 이용한 간접비교 결과를 등재 대상 약제의 주 효과를 판별하는 근거로 인정할 것

인가에 대한 우선적인 고려가 필요할 것이다. 위에서 요약한 바와 같이 해외 지침들은 네트

워크 분석 및 단순비교를 지침에서 언급은 하고 있으나, 주 분석은 직접비교 임상시험 결과

에 기반하고 네트워크분석 수행은 보조적이거나, 네트워크 분석을 사용하더라도 통계적 가정

체크가 가능한 단순구조 및 연결된 네트워크 사용으로 제한하고 있다.

현재 심평원의 간접비교 자료제출지침에서 또한 “단순비교 결과는 공통대조군을 통한 간

접비교의 결과와 동일한 근거수준으로 인정될 수는 없다”라는 점과 “소수의 연구로 보정

없이 이루어진 단순비교 결과는 받아들여지지 않을 수 있다”고 이미 언급이 되어있으나, 이

와 같은 사항을 본 지침에서도 명확히 언급할 필요가 있다. 이와 더불어, 현재 정성적으로

비교성(교환가능성)을 평가하여 소명한 후 수행한 단순비교 결과에 대하여 자료 제출에 대해

서도 검토를 고려하는 것으로 이해되고 있는 부분에 대해 좀 더 엄격한 적용이 될 수 있도

록 조정될 필요가 있으며, 공통대조군이 없는 경우 IPD를 사용한 적절한 통계적 보정 등이

이루어지지 않는 자료 제출은 인정하지 않으며 특정 보정 방법을 적용하였더라도 적절성이

충분히 소명되지 않은 경우 결과가 수용되지 않을 수 있다는 방향으로 심평원 간접비교 자

료제출 지침 또한 명확히 추가 수정이 이루어지는 것이 적절할 것이다.

네트워크 분석에 관련하여서도, 심평원 간접비교 자료제출지침에 이미 2014년 개정 시 혼

합비교 또는 네트워크 분석을 고려할 수 있으며 “네트워크를 구성하고 있는 각각의 비교에

서 본 지침이 제시하는 틀에 따라 교환가능성 가정을 충분히 소명할 수 있다면 혼합비교 또

는 네트워크 분석을 수행할 수 있겠으나, 충분한 소명이 뒷받침되지 못하는 복잡한 설계의

혼합비교 결과는 보조적이고 추가적인 정보로 고려하는 것이 권고된다”라고 언급하여 현재

의 해외 지침과 유사한 기조의 지침을 제시한 바 있음에도 이해당사자들의 의견에는 네트워

크분석을 사용할 수 있음에 대한 언급이 없음을 지적하고 있으므로, 관련 내용을 본 지침 안

Page 94: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 86 -

에서도 일관되게 이해되도록 명시하는 것이 필요하다.

요약하면, 현 지침의 “위약이나 다른 제3의 치료대안을 참조대상으로 하여 등재신청의약

품과 참조대상 그리고 참조대상과 비교대상을 비교한 자료를 이용할 수 있다”는 언급에 대

해서는 두 대안을 직접 비교한 자료원이 없을 경우에는 타당성을 갖춘 간접비교를 통하여

도출된 자료를 이용할 수 있다는 문구로서 좀 더 넓은 맥락의 의미로 수정하여 제시한 후,

지침 설명에 있어서 좀 더 구체적인 사항을 제시하고 제출 자료준비에 심평원 간접비교 자

료제출 지침을 참고하도록 연계하여 언급하는 것이 필요하며, 구체적인 지침 추가 설명으로

서는 아래와 같은 내용을 포함할 수 있다:

1. 임상적 효과에 대한 판단 및 추정을 위한 자료원으로는 등재신청 약제와 대안 약제 간

무작위배정을 통한 직접비교 임상시험을 통해 이루어진 평가 결과를 우선함

2. 직접비교 임상시험이 수행된 바 없거나 존재하지 않은 경우 두 약제가 제3의 대안 약

제로 연결된 네트워크 구성을 통해 분석된 간접비교 결과 자료를 이용할 수 있음

3. 대안 약제들 간 네트워크를 통한 네트워크 분석은 단순한 구조 안에서 쌍별 비교가 기

본적으로 제시되어야 하며 여러 대안이 포함된 복잡한 네트워크 분석은 보조적인 분석

으로 제시되어야 함

4. 공통대조군으로 이어지지 않은 단순간접비교는 근거로서 수용되지 않으며, 충분한 연

구가 존재하여 요약자료로서의 보정(예: 메타회귀분석) 또는 환자단위 자료가 가용하여

환자단위 자료를 이용한 세부적인 보정방법(예: 성향점수를 이용한 방법 등)이 적용되

었고 이의 적절함이 인정될 때 한 해 고려될 수 있음

5. 간접비교에 포함된 대상자 기저특성, 치료 세부사항, 결과변수 정의 개별임상시험 결

과들을 표준화된 방식으로 제시하고, 간접비교 수행방식이 구체적으로 기술되어야 함

6. 자료 제출 방식은 간접비교 자료제출 지침을 참고하여 아래의 내용이 제시되어야 함:

- 간접비교가 수행된 이유 및 네트워크 구조에 대한 설명

- 포함된 임상시험들의 연구 특성 평가 및 보고

- 결과를 요약하기 위해 사용된 측정치에 대해 기술

- 잠재적 비뚤림 가능성 및 탐색과 보정을 위해 사용된 방법에 대한 구체적 기술

- 데이터 검색 및 처리방법, 분석 수행 및 결과 합성 방법을 설명

- 네트워크에서 직간접 근거 간 일관성을 평가하기 위한 통계적 접근 방법을 기술

Page 95: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 87 -

사. 비용

1) 현 지침

가) 비용 항목(identification)

(1) 주요 지침

어떤 항목을 비용으로 포함시킬 것인지는 분석 관점에 따라 달라진다. 사회적 관점을

취한다면 비용 지불 주체가 누구인지와 관련 없이 의약품 치료와 관련한 모든 적절한

비용을 분석에 포함한다. 본 지침에서는 사회적 관점을 취하되 그 영역 및 포괄성은

제한적이므로, 분석에 포함되는 항목으로는 직접 보건의료비용, 환자 및 가족(또는 간

병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 등이 있다.

이환 및 사망으로 인한 생산성손실 비용(productivity cost)은 기본분석에는 포함하지 않

고, 해당 항목을 별도로 제시한다. 해당 질병의 치료와 관련되지 않은 미래의료비용

(unrelated future medical cost) 역시 포함여부와 관련하여 논란의 소지가 있기는 하나

기본 분석에는 포함하지 않는다.

임상시험자체에 소요된 비용으로 실제 진료과정에서는 발생하지 않는 비용이나 이전

비용 등은 개념상으로도 사회적 비용에 포함되지 않는 바, 분석에서 제외한다.

보험자 관점에서 분석할 경우, 건강보험 급여부문과 본인부담금을 포함하고, 비급여

항목은 기본 분석에 포함하지 않고 별도로 제출한다.

(2) 지침 내 추가 설명

직접 보건의료비용으로는 의약품(치료약 및 부작용 치료), 진료 서비스, 병원(입원) 서

비스, 진단 및 검사, 기타 보건의료비용 등이 포함된다. 환자 및 가족(또는 간병인) 비

용에는 치료를 받기 위해 의료기관을 방문하는 과정에서 환자나 그 보호자가 지출하는

교통비, 방문 및 치료대기 시간 동안의 시간 비용, 가족이나 간병인의 간병과 관련한

시간 비용 등이 포함된다. 다른 사회 부문에서 발생하는 비용은 사회복지 서비스 등

보건의료부문 외 다른 부문에서 발생하는 비용을 의미한다.

이환 및 사망으로 인한 생산성손실 비용(productivity cost)은 개념상으로는 사회적 비

용에 해당하나 이중계산의 문제, 정확한 규모를 측정하기 어렵다는 문제 등으로 실제

분석에 포함시킬지 여부는 논란이 되는 항목이다.

... 생산성손실 비용을 포함하는 데 반대하는 이유 중 하나는 비용-효용분석을 하는 경

우, 이미 건강 상태를 반영하는 효용가중치(utility weights)에 생산성 손실에 대한 가치

가 반영되어 있다고 볼 수 있으므로, 이를 다시 비용 계산에 포함하게 되면 동일한 가

치가 분모, 분자에서 모두 집계되는 이중 계산의 문제가 발생할 수 있기 때문이다

Page 96: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 88 -

경제성평가에 포함하는 비용 항목은 관점에 따라 달라진다. 이번 경제성평가 지침 개정에

서는 기존에 사용하던 제한적 사회적 관점 대신 보건의료체계적 관점을 제안하면서 기본

분석에는 직접 의료비용만 포함하고 직접 비의료비용(교통비용, 시간비용, 보호자 간병비

용)은 제외하는 것을 제안하였다. 비의료비용의 비중이 큰 경우에는 생산성손실 비용과 마

찬가지로 별도 자료로 제시할 수 있도록 하였다. 비용 항목과 관련된 경제성평가 지침의

개정은 이러한 변화를 반영하는 선에서 일부 표현이 수정될 것이다.

나) 비용 산출(measurement and valuation)

(1) 주요 지침

비용은 비용으로 열거한 각 항목의 사용량(자연단위)에 단위 비용을 곱해서 산출하게

된다. 각 항목의 사용량을 어떤 단위로 측정했는지, 그리고 단위 비용을 어떻게 산출했

는지에 대해서 자세하게 기술한다. 비용은 분석 시점 기준으로 일관되게 보정하여 산

출하며, 단위비용과 자원사용량의 자료원은 국내자료를 사용한다.

비용 산출의 구체적 방법에 대해서는『표준비용산출기준(안)』을 참고한다.

(2) 지침 내 추가 설명

비용을 산출할 경우에는 각 항목의 사용량을 어떤 단위로 측정할 것인지, 그리고 단위당

비용으로는 어떤 값을 사용할 것인지를 결정해야 한다. 자원사용량의 자료원은 임상연

(Luce, et al., 1996; Garber, et al., 1996).

... 그리고 생산성손실 비용을 포함한다 하더라도 측정하는 방법이 불완전하다는 문제

점이 있다. 전통적으로 인적자본접근법(human capital approach)을 통해 생산성손실 비

용을 측정하는 경우가 많았는데, 이는 사회전체가 완전고용상태가 아닌 경우 과대추정

의 문제가 발생한다.

분석대상 질병이나 치료와 직접적 관련이 없는 미래의료비용(unrelated future health

care costs)의 경우도 포함 여부가 논란이 되는 항목이다. 즉, 질병 치료로 연장된 생존

기간 동안 현재의 질병 치료와 무관한 질병이 발생하고, 이로 인해 보건의료자원을 소

비하게 되었을 때 이 부분을 분석에 포함하여야 할 것인가 하는 문제이다.

... 본 지침에서는 비록 이론적으로는 논란이 거듭되고 있는 사안이기는 하나, 대부분의

연구에서 이 부분을 분석에서 제외하고 있고, 다른 경제성 평가 지침에서도 대상 비용

의 범주에서 제외하고 있음을 감안하여, 해당 질병의 치료와 관련되지 않은 미래의료

비용은 기본 분석에서 제외한다.

Page 97: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 89 -

경제성평가를 위한 비용 산출과 관련하여 현 지침에서는 비용 각 항목의 사용량(자연단위)

에 단위 비용을 곱해서 산출하되, 비용 항목 각각의 사용량을 어떤 단위로 측정했는지 그리

고 단위 비용을 어떻게 산출했는지에 대해서 자세히 기술하고, 자료원은 국내자료를 사용하

라고 한다. 자원사용량의 자료원에는 임상연구, 청구자료, 임상진료지침, 그리고 전문가 의견

등이 있는데, 이들 자료원 가운데 어떤 것을 사용하는 것이 더 나은지에 대한 검토가 필요하

다. 아울러, 항암제 등의 사용이 늘어나면서 주사 투약 후 남는 양, 즉 폐기분(wastage)에 대

한 고려 여부에 따라 투약비용이 달라지는 일이 발생하므로 이에 대한 검토가 필요하다.

2) 기존 제출자료 검토 결과

가) 비용 자료원

기존에 심평원에 제출된 50건의 경제성평가 자료에서 직접 의료비용 중 약가 이외에 검사

비용, 치료비용, 부작용 관리비용 등의 자료원을 살펴보았다.

검사비용의 경우 건강보험 수가파일을 사용한 경우(26건)가 가장 많았고, 전문가 대상조사

구, 청구자료, 임상진료지침, 그리고 전문가 의견 등이 될 수 있다. 측정 시점에 따라 의

료이용행태, 단위비용 등이 달라질 수 있으므로 비용 산출은 분석 시점을 기준으로 일관

되게 보정하는 것이 바람직하다. 또한 단위가격 및 의료이용양상은 국가 간에 차이가 있

으므로, 의료 환경이 전혀 다른 나라에서 측정된 결과를 국내에 일반화시키는데 우려가

있다. 만약 연구 목적에 부합하는 국내의 자료원이 복수로 존재하여 자료제출자가 선택

할 수 있는 경우, 가능하면 최근에 산출된 대표성 있는 샘플에서 산출된 값을 선호한다.

이는 최근의 자료가 국내의 의료이용행태 및 단위가격을 가장 현실적으로 반영할 수 있

고, 대표성이 있는 대규모 자료에서 산출된 경우 더욱 그러하기 때문이다.

시장임금 자료가 없는 사람에 대한 시간비용(가족이 환자를 간병하는 경우)의 처리에는

크게 기회비용 방법(해당 인력이 노동시장에 투입되었을 때 받을 수 있는 임금수준을

기초로 함)과 대체 비용방법(제공하는 서비스의 시장가치에 근거)이 있다. ...본 지침에서

는 기회비용방법을 사용할 것을 제안한다.

비용을 산출할 때, 똑같은 항목에 같은 사용량이라고 해도 단위비용을 얼마로 할 것이냐

에 따라서 비용 산출 값이 달라질 수 있다. 따라서 ‘표준비용산출기준(안)’을 참고하

여 비용 산출과정을 표준화하고 서로 다른 연구들 간의 비교 가능성을 높이도록 한다.

비용 산출 지침에서는 항목별 비용 산정 방법과 더불어 자원 사용량의 평가단위 및 단

위비용에 대한 세부지침이 제시되어 있다.

Page 98: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 90 -

(7건), 병원 조사(2건), 건강보험 표본자료나 코호트자료를 이용한 경우(2건) 등이 있었다.

치료비용의 경우 건강보험 수가파일을 사용한 경우(17건)와 심평원 통계자료를 사용한 경

우(10건)가 많았고, 전문가 대상조사(5건), 선행 연구(3건), 건강보험 표본자료나 코호트자료를

이용한 경우(2건) 등이 있었다.

부작용 관리비용을 포함한 항암제는 모두 14건이었는데, 심평원 통계자료를 사용한 경우(6

건)가 가장 많았고, 건강보험 수가파일(3건), 임상연구(2건), 전문가 대상 조사(2건) 순이었다.

<표 22> 기 제출된 경제성평가 자료에 사용된 직접 의료비용 자료원

구분 검사비용 치료비용 부작용관리비용1) 기타 직접의료비

임상연구 1 1 3(2) 2

심평원 통계자료 1 10 7(6) 5

수가파일 26 17 4(3) 6

건강보험 표본, 코호트자료 2 2 - -

임상가이드라인 1 0 - -

선행연구 0 3 - 7

전문가 조사 7 5 2(2) 2

병원 조사 2 1 - 1

기타(해당 없음, 불명확) 10 11 2(1) 27

계 50 50 18(14) 50

주 : 1) 부작용 관리비용을 포함한 연구는 일부임. ( )안의 값은 항암제 숫자임.

나) 투약 폐기분(wastage)

50건의 경제성평가 자료에서 투약 폐기분(wastage)에 대한 고려 여부를 파악한 결과, 해당

사항이 있는 23건 중 8건에서 폐기분(wastage)에 대한 고려를 하였는데, 비항암제보다는 항

암제(7건)가 주를 이루었다.

<표 23> 기 제출된 경제성평가 자료에서 투약 폐기분(wastage) 반영 현황

구분 항암제 비 항암제 전체

폐기분(wastage) 고려 7 1 8

폐기분(wastage) 미고려 10 5 15

해당 없음 6 21 27

계 23 27 50

Page 99: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 91 -

3) 외국 지침

가) 캐나다 CADTH

☐ 비용 자료원

❍ 자원사용량과 단위비용의 자료를 선택할 때 가용한 자료원들에 대해 목적 부합 정도,

신뢰성 및 일관성 측면에서 장단점을 평가해야 한다.

❍ 자원사용량 자료원으로 행정자료나 임상연구 자료가 있을 수 있다.

- 행정자료는 현실적인 정보(real-world information)를 제공할 뿐만 아니라, 특정 환자 코

호트의 자원사용을 추적 관찰할 때 유용하다.

- 임상연구 자료를 이용할 때는 프로토콜에 의한 자원사용을 염두에 두어야 한다. 임상연

구에 나타난 자원사용이 프로토콜을 따랐지만 캐나다의 진료 패턴을 반영하지 않거나

대상 인구집단을 반영하지 않는다면 다른 자료원을 구해야 한다.

☐ 투약 폐기분(wastage)

❍ 캐나다 지침에 투약 폐기분(wastage)에 대한 내용은 구체적으로 나와 있지 않으며,

CADTH에서 발행한 보건의료비용 산출 안내서에 아래와 같이 간략히 언급하고 있다.

- 의약품의 폐기분(wastage)이 발생할 경우(가령, 처방된 총투약량이 1 바이알에 든 양보

다 적은 경우) 1 바이알 전체의 비용을 기본분석에 포함해야 한다.

나) 호주 PBAC

☐ 비용 자료원

❍ 호주 지침에서는 자원사용량을 구할 때 그 근거를 정당화하고 자료원을 밝히라고 한

다. 그리고 임상연구 과정에서 자원사용의 패턴을 전향적으로 측정해야 하는데, 이때

후향적으로 의무기록을 검토하거나 청구자료와 연계하는 방법, 설문조사를 하는 방법,

다이어리를 활용하는 방법을 적용할 수 있다.

❍ 일차적인 근거에서 나온 자원사용량 자료와 일차자료에서 가용한 정도를 넘어 자원사

용량에 대한 외삽이나 모델링 결과는 구분해야 한다.

☐ 투약 폐기분(wastage)

❍ 호주 지침에는 투약 폐기분(wastage)을 고려하라고 명시하고 있다.

- 즉, 제공된 약이나 자원의 양이 실제 자원사용량보다 더 적절한 경제적 척도이며, 폐기

분(wastage)이 실제로 비용을 유발하기 때문이다.

다) 영국 NICE

Page 100: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 92 -

☐ 비용 자료원

❍ 의약품에 대해서는 공적인 약가목록 자료를 기본분석에 사용해야 한다. 전국적으로

약가 인하가 이루어진 경우, 가령 NHS Commercial Medicines Unit이 이차 진료 사용

목적으로 협상을 통해 구매 계약한 의약품의 경우에는 NHS에 적절한 가격 반영을 위

해 인하된 가격을 기본분석에 사용해야 한다.

❍ Healthcare resource groups (HRGs)은 공통 수준의 보건의료자원을 사용하는 유사한

임상치료를 표준 그룹핑한 것인데, 이는 자원사용량에 대한 중요한 자료원이다. 특정

HRG의 전국 평균 단위비용은 잉글랜드의 모든 NHS 기관에서 준거비용(reference

cost)을 매년 의무 수집하는 것의 일부로 보고된다. 이 비용을 활용하면 미시적 비용

산출(micro-costing)의 필요성을 줄일 수 있다.

☐ 투약 폐기분(wastage)

❍ 영국 지침에 투약 폐기분에 대해 구체적인 언급은 없다.

4) 기타 문헌고찰 결과

☐ Guidance Document for the Costing of Health Care Resources in the Canadian Setting:

Second Edition (CADTH, 2016)

❍ 의약품의 폐기분(wastage)이 발생할 경우(가령, 처방된 총투약량이 1 바이알에 든 양

보다 적은 경우) 1 바이알 전체의 비용을 기본분석에 포함해야 한다.

5) 이해관계자 의견

☐ Scoping 의견조사 결과

❍ 응답자들은 주로 경제성평가의 관점과 관련이 있는 비용항목 위주로 응답했으며, 비

용 자료원이나 투약 폐기분(wastage)에 대해 언급한 사례는 없었다.

❍ 제약사 응답자(9명) 중 5명(관점에서 관련 의견 제시한 1명 포함)이 비용항목에 대한

의견을 제시하였는데, 비용의 유형별로 보면, 간병비용(2명), 생산성손실 비용(2명), 부

작용 관리 비용(1명)에 관한 것이다.

- 간병비용의 경우 질환의 특성에 따라 보호자의 간병 및 보호가 필연적인 경우 이를 포함

할 필요가 있으며, 생산성손실 비용의 경우는 질환의 특성에 따라 고용률이 높은 집단이

나 소아환자에게 발병하여 조기사망에 이르는 경우에 포함될 필요가 있다고 하였다.

- 부작용 관리 비용의 경우 신청약 도입으로 부작용 발생 감소 시 비용 반영이 안 된다고

Page 101: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 93 -

하였다.

❍ 연구자(3명, 모두 경제성평가 수행 경험 있음) 중 1명이 비용항목의 명칭을 한국보건

의료연구원에서 발간한 비용산출 매뉴얼(보건의료분야에서 비용 산출방법)에서의 비용

항목과 일치시킬 필요성을 제기하였다. 다른 1명은 교통비용, 시간비용 등에서의 불확

실성도 크고 포함해야 할 필요성을 잘 모르겠다고 하였다.

6) 지침 개정방향 제언

경제성평가의 관점을 제한적 사회적 관점에서 보건의료체계 관점으로 변경함에 따라 기본

분석에 포함해야 할 비용항목의 변화가 필요하다. 직접 보건의료비용 이외에 환자 및 가족

(또는 간병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 등은 기본분석에서 제외하고 필

요한 경우 별도로 제시할 수 있도록 한다.

기존 지침에서는 비용이나 자원사용량은 국내자료를 사용해야 하며, 자료원은 임상연구,

청구자료, 임상진료지침, 그리고 전문가 의견 등이 될 수 있다고 하였다.

기존 제출된 경제성평가를 살펴보면, 위 자료원 중 전문가 의견이 검사비용에서 7건(14%),

치료비용에서 5건(10%)을 차지해 적지 않은 비중을 차지함을 알 수 있다.

전문가 의견이나 병원 조사 자료에 기반한 비용 및 자원사용량은 데이터 기반 자료원에

비해 신뢰성 및 일관성 면에서 한계가 있다. 따라서 전문가 의견 등을 자료원으로 할 경우에

는 공식적인 학회 의견을 포함하거나 전문가 패널의 최소 인원을 정하여 신뢰성 및 일관성

을 제고할 필요가 있으며, 이를 개정 지침에 간략히 포함할 것을 제안한다.

기존 지침에는 투약 폐기분(wastage)에 대한 내용이 없는데, 폐기분 또한 보건의료체계 내

에서 비용을 발생시키는 요인이므로 이를 포함한 비용을 기본분석에 사용하도록 제안한다.

Page 102: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 94 -

아. 효용, 건강 관련 삶의 질

1) 개정이 필요한 항목

현 의약품 경제성평가 효용 관련 지침 내용은 표 24와 같다. 건강보험심사평가원, 보건경

제 전문가, 제약사, 시민단체 등의 의견을 수렴하여 개정이 필요한 항목을 다음과 같이 선정

하였다.

- 효용 측정방식의 우선순위

- HRQoL(Health-Related Quality of Life) 도구 및 tariff 선정 검토

- 산식(mapping) 관련 세부지침

- 직접측정 관련 세부지침

- 효용의 MCID(Minimal Clinically Important Difference) 추가 검토

항목 2011년 지침 내용 개정 방향 검토

건강상태 측정 대상군 직접적 언급 없음 (암묵적 환자) -

건강상태 측정 자료원언급 없음(효과 자료원[RCT 선호]과 동일할 것으로 추정)

-

건강상태 효용 측정

건강상태 선호도 측정 대상군 한국 일반 대중 -

건강상태 효용 측정방식 우선순위

MAUI 환자 자료에 기존 tariff를 적용하여 간접적으로 질 가중치를 산출하는 방법 언급. 건강상태 시나리오를 구성하여 제출자가 직접 질 가중치를 측정하는 방법 언급. 이 두 가지 대안 간 우선순위 명확하게 표현되어 있지 않음 이외에도 기존 문헌에서 제시한 값 인용 및 산식(mapping)을 통한 질 가중치 산출 언급.

측정방식의 우선순위 제시

[간접측정] HRQoL 측정 도구

선호도에 근거한 일반도구 사용 권장. 국내에서 타당도 검증이 이루어지고 공인된 도구를 사용하도록 함. 선택한 도구에 대한 정당화, 민감도 분석 필요 명시.*질병별 도구, 선호도에 근거하지 않은 도구를 사용한 결과는 추가적으로만 제출 가능

-

<표 24> 의약품 경제성평가 효용 관련 지침 내용과 개정 필요 항목

Page 103: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 95 -

이 장에서는 각 항목에 대해 국내 제약사 제출자료 현황, 주요국 경제성평가 지침, 이해관

계자 의견, 기타 관련 문헌 등을 살펴보고, 이를 토대로 효용 관련 지침 개정 방향에 대해

제언을 하고자 한다.7)

7) QALY(quality-adjusted life years) 및 효용 측정 관련한 이론적 배경은 기존 개정연구 보고서(배승진 등, 2012)를 참고하도록 한다.

[간접측정] Tariff 선정 Tariff가 여러 개 존재할 경우에는 특별한 사유가 없는 한 대표성 있는 최신값 사용 명시

기본분석에서 사용할 (도구 및) tariff 선정 가능 여부 검토

[직접측정] 선호도 도출 방법선택에 기초한 방법(TTO or SG 등) 권장

-

[직접측정] 건강상태 시나리오 구성의 적절성 평가

시나리오 구성 및 내용 평가 시 고려사항에 대해 별첨에서 간단히 언급

시나리오 구성 방법 및 적절성 평가 관련 세부지침 추가

기존 문헌 인용필요시 사용 가능. 자료원의 포함/배제 기준 명시. 투명하게 보고하고 불확실성 평가 필요

-(현 지침 유지하나, 여러 건강상태의 질 가중치가 필요할 경우 다수의 자료원에서 가져오는 것은 지양 언급 필요, 문헌고찰 및 선정 과정에 대한 투명성 및 정당화 매우 강조)

산식(mapping)을 통한 효용 도출

선호도에 기반한 일반도구 사용을 기본으로 함. 필요시 산식(mapping)을 통해 선호도에 근거한 값으로 변환한 후 결과값을 “추가적”으로 제출하는 것은 가능. 산식(mapping)에 대한 한계 및 문제점 위주로 언급

산식(mapping) 관련 세부지침 추가

효용의 MCID 언급 없음 추가 검토

여러 건강상태 결합 시 효용 계산

언급 없음 -

Page 104: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 96 -

2) 효용 측정방식의 우선순위

가) 현 지침

(1) 주요 지침

(2) 지침 내 추가 설명

질 가중치 측정에 사용된 도구는 신뢰도, 타당도가 검증된 것이어야 한다. 특히 외국에

서 개발된 도구를 사용할 때에는 언어적‧문화적 차이에 유의하여 국내에서 타당도 검증

이 된 도구를 사용한다.

도구에 따라 결과값에 차이가 있으므로, 연구자는 자신이 선택한 도구를 본 지침의 별

첨 3, 표 4에 근거하여 정당화하고 아울러 민감도 분석 등을 통해 질 가중치의 불확실성

이 결과에 미치는 영향을 검토한다.

자료 제출자는 조사 방법에 대하여 상세히 보고한다.1) 기본분석에서는 선호도에 근거

한 일반도구의 사용이 권장되며, 질병별 도구, 선호도에 근거하지 않은 도구2)들을 사용

하여 측정한 결과는 추가적으로 제출할 수 있다.

건강상태에 대한 선호도 평가 대상을 명시한다. 건강상태의 선호도 측정대상은 국내의

대표성 있는 일반 대중을 선호한다.

만약 기존 문헌에서 질 가중치 값을 인용하는 경우 자료원의 포함․배제 기준을 상세히

설명하고 근거를 제시하는 등 선정과정을 투명하게 보고한다3). 그리고 해당 건강상태에

적용가능한지 여부를 논의하고, 불확실성을 평가한다.

1) 별첨 5에 근거2) 선호도에 근거한 도구로 변환(transformation) 시키고, 이때 변환을 위한 산식(mapping function)의 구축방

법론, 비뚤림 발생 가능성에 대해 자세히 기술한 후 해당 방법론을 정당화하고, 모형의 예측성 및 적합도에 대해서 기술한다.

3) 2-4-2의 “기존 값 인용 시 보고해야 할 항목”, 별첨 4, 표 5의 항목을 준수한다

선호도에 근거한 도구는 각각의 장단점이 있어, 어떤 도구가 우월하다고 보고되지는 않

는다. 다만 직접 측정 도구의 경우, 시각아날로그척도(Visual Analogue Scale, 이하 VAS)

방법 등의 RS 방법은 단독으로 사용되는 데 우려가 있다고 보고된다(별첨 2 참조). 따라

서 직접 측정 도구를 사용할 경우, 표준기회선택법(standard gamble), 시간교환법(time

trade-off)과 같은 선택에 근거한(choice-based) 도구를 사용하여 측정할 것을 권장한다.

기존에 사용되고 있는 간접방법 도구들은 대부분 우리와 언어적, 사회경제적, 문화적

배경이 다른 국가에서 개발된 것이므로 주의하여 사용하여야 한다. 안면 타당도(face

validity), 내용 타당도(content validity), 번역의 타당도(validity of the translations) 뿐 아

니라 도구 내에서 각 항목(item)이 갖는 상대적 중요성이 달라질 수 있기 때문이다

Page 105: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 97 -

QALY(quality-adjusted life year) 계산에 사용되는 질 가중치는 각 건강상태가 개인에게 주

는 효용의 정도를 측정한 것으로, 현 지침에서는 개인의 선호도를 반영할 것을 권장하고 있

다. 지침에서는 질 가중치 측정방법으로 간접측정, 직접측정, 기존값 인용을 제시하고 있으

며, 각 방법의 내용은 다음과 같다. 참고로 이들에 대한 상대적 선호도는 명확하게 제시되어

있지 않다.

- 간접측정 : 선호에 근거한 일반도구를 이용하여 환자의 건강상태를 측정하고, 이 자료에

일반 대중의 선호를 반영한 기존의 tariff를 적용하여 질 가중치를 산출하는 방법

- 직접측정(시나리오 기반 효용 측정) : 건강상태 시나리오(vignette)를 구성하고, 선택에

근거한(choice-based) 도구를 이용하여 이 건강상태에 대한 질 가중치를 제출자가 직접

도출하는 방법

- 기존값 인용 : 기존 문헌에서 제시된 질 가중치를 인용

또한, 현 지침에서는 선호에 근거하지 않은 질병별 도구를 이용하여 환자의 건강상태를 측

정한 경우에는 산식(mapping)을 이용하여 선호에 근거한 값으로 변환(transformation)할 수도

있다고 언급하고 있으나, 이 방법에 대해서는 주로 한계점 위주로 기술하고 있다.

나) 기존 제출자료 검토 결과

2014~2018년 5년 동안 건강보험심사평가원(이하 심평원)에 건강보험 등재의 목적으로 제출

된 경제성평가 자료 50건 중 비용-효용 분석(cost-utility analysis, CUA) 47건을 대상으로 분

석을 수행하였다. 분석에는 항암제 21건, 희귀·난치성질환 치료제 8건, 기타 일반 약제 18건

(Fletcher, 1992). 이들 도구를 사용할 때에는 국내에서 타당도 검증이 이루어지고 공인된

도구를 사용하도록 한다.

개인의 선호도가 반영되지 않은 SF-36, Nottingham Health Profile(NHP), Sickness

Impact Profile(SIP) 등과 같은 도구 및 선호에 근거하지 않은 질병별 도구들은 산식

(mapping)을 통하여 선호에 근거한 값으로 변환(transformation)하는 방법이 있다. 그러나

이러한 산식(mapping)은 대체로 예측성(predictability), 모델 적합도(model fit)에 있어 상

당한 변이가 있다는 근본적인 한계점을 가지고 있다고 보고되었으며(Brazier et al,

2007), Chancellor 등(1997)은 산식(mapping)을 변환시키는 것이 아예 불가능하다고 제시

하기도 하는 등 방법론적 문제점이 존재한다.

Page 106: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 98 -

이 포함되었다.

(1) 질 가중치 측정방법

표 25에서 제시된 바와 같이, 다양한 질 가중치 측정방법들이 혼재되어 사용되고 있었다.

총 47건의 CUA 중에서 기존 문헌에서 제시한 질 가중치를 인용한 경우가 23건(48.9%)으로

가장 높은 빈도를 보였고, 그다음으로는 시나리오에 기초한 직접측정(9건), 간접측정(6건), 산

식(mapping) 이용(6건), 기타(3건) 순으로 나타났다. 기존값을 인용한 이유로는 삶의 질 자료

의 부재(8건) 또는 불충분(5건), 질병별 도구 사용(7건), 직접비교 임상시험 부재(3건) 등이 있

었다.

항암제(21건)로 국한하여 분석할 경우, 기존값 인용이 23건(48.9%)에서 6건(28.6%)으로 크게

감소함에 따라 다른 측정방식이 차지하는 비중이 상대적으로 증가하였다(표 26). 직접측정과

간접측정이 각 5건, 산식(mapping) 이용이 3건, 기타 2건이 사용되었다.

유형 N 백분율

간접측정 6 12.8%

EQ-5D-3L 4 -

EQ-5D-5L 2 -

직접측정 9 19.1%

TTO 7 -

SG 2 -

기존값 인용 23 48.9%

산식(mapping) 6 12.8%

기타 3 6.4%

총계 47 100.0%

※ 주요 기본분석을 기준으로 분류 SG: standard gamble, TTO: time trade-off

<표 25> 2014-2018년 국내 제출된 보고서에서 사용된 질 가중치 도출방법

유형 N Percent

간접측정 5 23.8%

직접측정 5 23.8%

기존값 인용 6 28.6%

<표 26> 2014-2018년 국내 제출된 보고서에서 사용된 질 가중치 도출방법 (항암제)

Page 107: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 99 -

(2) 내국인의 선호도 vs. 외국인의 선호도

국내 일반대중의 선호를 반영하여 질 가중치를 측정한 사례는 20건(42.6%)으로 외국인의

선호를 반영하여 질 가중치를 측정한 사례(27건)보다 조금 낮게 나타났다(표 27). 이는 기존

문헌을 인용하는 경우 대부분 외국 문헌을 이용하거나 국내 자료와 혼합하여 사용했기 때문

이다. 기존값을 인용한 23건 중에서 단 2건만이 한국 일반대중의 선호를 반영한 질 가중치를

단독 사용하였다. 산식(mapping)의 경우도 산식(mapping)이 외국에서 개발된 경우가 많다 보

니 대체로 외국인의 선호를 반영한 EQ-5D 점수로 변환하여 분석에 이용하였다. 간접측정이

나 직접측정을 사용한 경우에는 대체로 한국 일반대중의 선호를 반영하여 질 가중치를 산출

하였다.

산식(mapping) 3 14.3%

기타 2 9.5%

총계 21 100.0%

※ (최초 제출 자료의) 주요 기본분석을 기준으로 분류

유형 내국인 외국인 전체

간접측정 6건 - 6건

EQ-5D-3L3건(일반대중: Lee et al., 2009)

1건(언급 없음)- 4건

EQ-5D-5L2건

(일반대중: Kim et al., 2016a)- 2건

직접측정 8건 1건 9건

TTO6건

(일반대중)1건

(영국 일반대중)7건

SG2건

(일반대중)- 2건

기존값 인용

1건(일반대중: Lee et al., 2009)

1건(일반대중: Jo et al., 2008)

21건국외 또는 국내외

혼합 23건

산식(mapping)2건

(일반대중: Lee et al., 2009)영국 일반대중 3건 +

1건 불확실 6건

기타3건

(일반대중: Lee et al., 2009)- 3건

총계 20건 (42.6%) 27건 (57.4%) 47건 (100.0%)

※ (최초 제출 자료의) 주요 기본분석을 기준으로 분류 SG: standard gamble, TTO: time trade-off

<표 27> 2014-2018년 국내 제출된 보고서에서 사용된 선호도 측정대상

Page 108: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 100 -

다) 외국 지침

캐나다(CADTH, 2017), 호주(PBAC, 2016), 영국(NICE, 2013) 등을 비롯한 대다수 국가에서

평가의 일관성, 비교 가능성, 자료수집의 용이성 등의 이유로 간접측정을 선호하고 있는 것

으로 나타났다(표 28, 표 29).

(1) 캐나다(CADTH, 2017)

캐나다 지침에서는 일반도구를 이용한 간접 측정방식을 기본분석(reference case)에서 사용

할 것을 권장하고 있다. 건강상태 시나리오에 근거한 직접 측정방식의 경우 설계 및 수행에

어려움이 따르고, 건강상태 기술(description)의 타당도에 따라 질 가중치가 크게 달라질 수

있다고 언급하였다. 산식(mapping)을 이용한 질 가중치 도출은 권장하지 않으나, 산식

(mapping) 이외 다른 대안이 없을 경우에는 가능하다고 명시하고 있다. 단, 이 경우 산식

(mapping)의 타당도를 뒷받침해 줄 수 있는 실증 자료(empirical data)를 제출하도록 하고 있

다. 간접측정이 힘들 경우 기존 문헌에서 제시한 값을 인용할 수도 있는데, 이때 그 과정과

방법에 대해 자세히 기술하도록 하고 있다.

(2) 호주(PBAC, 2016)

호주 지침에서도 MAUI (Multi-Attribute Utility Instrument)로 측정한 환자 건강상태 자료에

호주 일반 대중을 대상으로 도출된 tariff를 적용하여 질 가중치를 산출하는 간접측정을 권장

하고 있다.8) 일반도구 이외 다른 PRO (patient-reported outcomes, 환자보고성과지표) 도구가

임상시험에서 사용되었을 경우 산식(mapping)을 통해 선호에 근거한 일반도구 값으로 변환할

것을 제시하고 있다. 이 외에도 건강상태 시나리오(vignettes)에 근거한 직접측정, 임상시험에

포함된 환자들과 유사한 집단을 별도로 모집하여 이들을 대상으로 간접측정으로 질 가중치

를 산출하는 방법(population matching study), 기존값 인용 등을 대안으로 간단히 기술하고

있다. 자료 제출자는 사용한 방법에 대해 자세히 기술하고 정당화할 것을 명시하고 있다.

(3) 영국(NICE, 2013)

영국 NICE 지침에서도 일반도구로 측정된 자료에 영국 일반 대중의 선호를 반영한 tariff

를 적용하여 질 가중치를 산출하는 간접측정을 권장하고 있다. 다만, 다른 지침에서와는 달

리 평가의 일관성을 위해 성인을 대상으로 할 경우 EQ-5D-3L 사용을 선호한다고 명시하였

다. EQ-5D-3L 자료가 없을 경우에는 산식(mapping)을 이용하여 EQ-5D-3L 점수로 변환할 수

도 있고, 투명하고 체계적인 문헌고찰을 통해 기존 문헌에서 제시한 값을 인용할 수도 있다

8) 호주 지침에서는 캐나다나 영국 지침에서처럼 간접측정을“reference”로 명확하게 명시하지는 않았으나, 전반적으로 간접측정을 권장하는 것으로 기술하고 있다.

Page 109: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 101 -

고 언급하고 있다. NICE 본 지침에서는 건강상태 시나리오(vignette)에 근거한 직접 측정방식

에 대해 아무런 언급을 하고 있지 않으나, NICE DSU TSD 11 (Brazier & Rowen, 2011)에서는

검증된 HRQoL 도구에 근거하지 않은 직접측정은 NICE 기준에 부합하지 않는다고 명시하였

다. 다만, 검증된 도구로 측정된 자료가 없을 경우에는 직접측정이 제한적 역할(limited role)

을 담당할 수도 있다고 언급하고 있다.

(4) 기타

EUnetHTA (2015a)에서 경제성평가 지침 또는 유사한 정보를 제공하고 있는 유럽 25개 국

가의 지침을 분석한 결과, 덴마크와 스웨덴을 제외한 대다수 국가에서 간접측정을 선호하고

있는 것으로 나타났다(표 29). 또한, 최근 개발한 일본 지침에서도 선호도에 근거한 일반도구

와 일본에서 개발된 tariff를 이용하여 질 가중치를 산출하는 간접측정을 권장하고 있으며,

직접측정은 덜 선호(less preferred)된다고 명시하고 있다(Shiroiwa et al., 2017).

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

In the reference case, researchers should use health preferences obtained from an indirect method of measurement that is based on a generic classification system (e.g., EuroQol 5-Dimensions questionnaire [EQ-5D], Health Utilities Index [HUI], Short Form

6-Dimensions [SF-6D]). Researchers must justify where an indirect method is not used. (p20)

일반 도구에 기초한 간접측정을

기본분석에 사용. 다른 방식 사용시

정당화 필요.

호주PBAC 지침

version 5(2016)

If a MAUI has been used in an included study to estimate utility weights (as described in Subsection 2.4.3), state where and when the scoring algorithm was derived, and consider how applicable it

is to the general Australian population. It is preferred that Australian-based preference weights are used in the scoring

algorithm used to calculate utility weights. (p77)

Where utility weights or QALY changes cannot be directly estimated from data collected in the clinical studies from Section

2, or there are significant concerns about the reliability and relevance of trial-based utility, transform the Section 2 health

outcomes to estimate QALY gains. (p77)

Describe the source(s) and method(s) (as described below) used to derive externally derived health state utilities, and justify their

inclusion in the model. (p78)

MAUI가 사용되었을 경우 점수체계

알고리즘이 언제, 어디서 도출되었는지

기술. 호주 일반대중의 선호를

선호함.

MAUI 임상자료 사용이 힘들 경우

QALY 추정 위해 다른 자료 이용.

외부에서 도출된 질 가중치 사용 시

출처와 방법을 기술 & 정당화 필요.

영국 NICE 지침 (2013)

For the reference case, the measurement of changes in health-related quality of life should be reported directly from patients and the utility of these changes should be based on public preferences using a choice-based method. The EQ-5D

간접측정을 기본분석에 사용.

성인의 경우 EQ-5D 선호.

<표 28> 효용 측정방식의 우선순위 관련 해외 주요국 지침

Page 110: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 102 -

<표 29> EUnetHTA 파트너 국가 분석: 질 가중치 측정 관련 선호하는 방법과 도구

라) 기타 문헌고찰 결과

is the preferred measure of health-related quality of life in adults. (p40)

HRQoL 변화 측정 대상은 환자여야 함.

국가 선호하는 방법과 도구 (간접측정 vs. 직접측정)

오스트리아 간접측정 (HUI, EQ-5D)

벨기에 간접측정 (EQ-5D)

크로아티아 간접측정 (EQ-5D)

체코 간접측정 (EQ-5D)

덴마크 직접측정 (TTO, SG)

영국(England) 간접측정 (성인의 경우 EQ-5D)

에스토니아 & 라트비아 간접측정 (EQ-5D, HUI)

핀란드 검증된 일반 HRQoL 도구

프랑스 간접측정 (프랑스 tariff 존재하는 EQ-5D와 HUI-3)

독일 선호하는 방법 없음

헝가리 간접측정 (효용에 근거한(utility-based) HRQoL 설문)

아일랜드 간접측정 (EQ-5D나 SF-6D 같은 선호에 근거한 일반 도구)

이탈리아 간접측정 (EQ-5D)

네덜란드 EQ-5D 선호하나, 다른 도구도 충분히 가능(EQ-5D-5L 기본분석)

노르웨이 간접측정 (EQ-5D, SF-6D, 15D)

폴란드 간접측정 (EQ-5D)

포르투갈 포르투갈에서 검증된 도구, 선택한 도구에 대한 정당화 필요

러시아 언급 없음

영국(Scotland) 간접측정 (EQ-5D)

슬로바키아 간접측정 (EQ-5D)

슬로베니아 언급 없음

스페인CatSalut: 간접측정 (EQ-5D, SF-6D)

Osteba: 직접 또는 간접 측정

스웨덴 직접측정(SG, TTO), 간접측정 (EQ-5D)†

스위스 해당 없음

† 원 출처에는 간접측정 미포함. ISPOR 웹사이트(https://tools.ispor.org/peguidelines)를 바탕으로 업데이트출처: EUnetHTA (2015a)

SG: standard gamble, TTO: time trade-off

Page 111: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 103 -

앞서 언급하였듯이 모형에서 정의한 건강상태의 질 가중치를 추정하는 방법은 다음처럼

크게 네 가지로 나누어 볼 수 있다.

① 간접측정

② 직접측정

③ 산식(mapping)을 이용하여 선호도에 근거한 값으로 변환

④ 기존 문헌에서 제시한 값 인용

간접측정은 multi-attribute utility instrument(MAUI)9)를 이용하여 건강 영역별로 환자의 건

강수준을 측정하고, 이 측정 자료에 일반 대중을 대상으로 미리 도출한 건강 영역 및 수준에

대한 선호도(점수체계)를 적용하여 환자가 경험하고 있는 건강상태의 효용을 단일한 수치(질

가중치)로 추정하는 방법이다. 이때 질 가중치는 0(사망)과 1(완전한 건강)을 기준으로 하는

데, 도구에 따라서 사망보다 더 나쁜 상태를 의미하는 음의 값이 도출될 수도 있다. 대표적

인 MAUI로는 EuroQol 5-dimension (EQ-5D), Short Form-6-dimension (SF-6D), Health Utility

Index (HUI-2, HUI-3), Quality of well-being (QWB), Assessment of Quality of Life (AQoL),

15D 등이 있다(Brazier et al., 2017)10).

대부분의 MAUI들은 표준화되어 있기 때문에 비교가능성(comparability)이 높아 정책결정자

가 일관된 결정을 내리는 데 도움이 될 수 있고, 사용이 용이한 측면이 있다. 또한, 대상환자

군이 경험하는 효과와 부작용을 평가에 직접 반영할 수 있고, 동시에 국내 일반 대중의 선호

도를 반영하여 객관성과 일관성을 확보할 수 있다. 그러나 도구에 따라 산출된 질 가중치의

차이가 발생할 수 있는데, 이는 도구가 기술하고 있는 건강 영역 및 수준이 달라서이기도 하

지만 선호도(점수체계)를 도출할 때 사용한 방법이 달라서이기도 하다. 예를 들어, EQ-5D의

경우 일반적으로 TTO를 사용하여 선호도(점수체계)를 도출하지만, HUI의 경우 일반적으로

SG를 이용하여 선호도를 도출한다.

직접측정은 문헌고찰, 임상 자료, 전문가 의견 등을 토대로 건강상태에 대한 시나리오

(vignette)를 먼저 구성하고, SG나 TTO 등의 선택에 근거한 방법을 이용하여 일반대중을 대

상으로 이에 대한 질 가중치를 직접 측정하는 방법이다. 일반인을 모집하여 별도의 연구를

수행해야 하므로 시간이 많이 소요되고 복잡하다. 또한, 건강상태가 어떻게 기술되느냐, 어떠

한 질 가중치 도출방법이 이용되느냐에 따라 질 가중치가 크게 달라질 수 있다(Brazier &

Rowen, 2011). 임상시험에 참여한 다양한 환자의 경험을 평가에 직접 반영할 수 없는 점도

단점으로 꼽을 수 있다.

Arnold et al. (2009)은 간접측정(EQ-5D, SF-6D, HUI)과 직접측정(SG, TTO)을 통해 도출된

9) 선호에 근거한 일반 HRQoL 도구와 일반 MAUI를 혼용하여 사용하였다. 단, 지침이나 문헌을 인용할 때에는 원 문헌에서 사용한 용어를 그대로 이용하였다.

10) 이 도구들에 대한 자세한 설명은 “3) HRQoL 도구 및 tariff 선정 검토”장을 참조.

Page 112: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 104 -

질 가중치를 비교하기 위해 두 방법을 모두 사용한 연구를 대상으로 체계적 문헌고찰을 수

행하였다. 총 32개의 연구와 여기에 포함된 직·간접 측정 83건이 최종 고찰에 포함되었다.

직접측정의 경우 SG가 57건, TTO가 60건으로 비슷하게 사용되었고, 간접측정의 경우 EQ-5D

67건, HUI-3 37건, SF-6D가 13건, HUI-2 5건 순으로 조사되었다. 평균 질 가중치는 SG 0.81,

TTO 0.77, EQ-5D 0.59, HUI-3 0.68, SF-6D 0.63, HUI-2 0.75로 나타나 도구별로 질 가중치 추

정에 차이를 보였다. 연구진들은 간접측정보다 직접측정 시 질 가중치가 상대적으로 크게 측

정되는 경향이 있다고 보고하였고, 가능한 이유로 MAUI의 경직성(예를 들어, 긍정적인 면을

추가로 보고할 수 없거나, 자신의 건강상태를 무조건 몇 개의 범주 중 하나로 분류)과 선호

도 측정대상 차이를 언급하였다. 문헌고찰에 포함된 직접측정 연구에서는 대체로 환자를 대

상으로 선호도를 측정하였으나, 간접측정 연구에서는 일반대중을 대상으로 선호도를 측정하

였기 때문에 이러한 차이가 발생했을 수도 있다고 보고하였다.

Briggs et al. (2019)은 대규모 임상시험에서 수집된 EQ-5D-3L 자료를 통해 도출한 질 가중

치와 이 임상시험에서 경험하는 환자의 건강상태를 반영한 시나리오에 대해 TTO를 이용하

여 도출한 질 가중치를 비교·분석하였다. 건강상태 시나리오는 부갑상선기능항진증으로 치

료받고 있는 말기 신부전 환자가 경험하는 여러 증상을 반영하여 작성하였으며, 두 방식에서

모두 영국 일반대중의 선호를 반영하였다. 분석 결과, 직접측정에서보다 EQ-5D-3L을 이용한

간접측정에서 질 가중치가 더 높게 나타나 Arnold et al. (2009)이 보고한 결과와는 다른 경향

을 보여주었다.

두 연구간 결과 차이의 이유를 명확히 파악할 수는 없으나, Briggs et al.(2019)에서는 직접

측정 시 일반대중을 대상으로 하였기 때문에 해당 건강상태에 적응한 환자보다 시간 교환을

하려는 경향이 더 크게 나타났을 수 있다. 이러한 결과 차이에도 불구하고 두 연구에서 공통

적으로 지적하는 문제는 도구 간 질 가중치 차이이다. 직접측정과 간접측정 간에도 차이가

발생하였으나, 같은 측정방식 내에서도 어떤 도구를 사용하느냐에 따라 질 가중치 차이가 발

생하였다.

직접측정과 간접측정 중 무엇을 선택해야 하는지에 대해 지침을 제공해 줄 수 있는 보편

타당한 이론적 기초는 없다(Gold et al., 1996; Arnold et al., 2009; Briggs et al., 2019). 다만,

직접측정을 사용하기 위해서는 질 높은 시나리오를 개발하는 게 무엇보다 중요하다. ISPOR

Task Force (2016)에서는 직접측정의 제한적 역할을 인지하고 있으며, 직접측정이 사용되기

위해서는 질 높은 시나리오(vignette)를 개발하기 위한 점진적 투자가 이뤄줘야 하고, 이에

대한 지침 개발의 필요성도 언급하였다. Arnold et al. (2009)은 어떠한 측정방식이 더 우월한

지 언급하지 않았으나, 두 방법을 통해 도출한 질 가중치 차이가 각 범주 내에 있는 도구들

을 통해 측정한 질 가중치 차이보다 더 큰 경향이 있으므로 자원 배분을 위한 의사결정에서

는 이 둘을 혼용하지 말 것을 주장하였다. Briggs et al. (2019)도 방법론적 일치화

Page 113: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 105 -

(methodological harmonization)를 위한 연구가 더 필요하다고 언급하였다.

마) 이해관계자 의견

(1) 전문가 의견 (scoping survey 및 전문가 자문 내용)

- 효용 관련 불확실성을 줄이기 위해 심평원에서 선호하는 도구 및 추정방법을 명시할 필

요 있음.

- 건강 관련 삶의 질 산출방법과 자료원 근거의 질 관련하여 좀 더 정확하게 설명하고, 이

중 무엇을 선호하는지에 대해 명확히 기술할 필요 있음.

- 지침에서도 효용 측정방식의 우선순위에 대해 언급해 줄 필요 있음.

- 임상시험에서는 건강상태를 측정하는 게 아니라 효과를 측정하는 것임. 이 부분에 대해

지침 개정 시 학문적으로 논의하고 명시가 되었으면 함.

- 측정방법마다 장·단점이 있으므로 상황에 맞게 선택하게 하도록 하는 게 필요함.

- 현실적으로 한국인이 상당수 포함된 임상자료는 많지 않음. 심평원에서는 한국인이 거

의 포함되지 않은 임상시험에서 수집된 HRQoL 자료를 수용하지 않으므로 간접측정 선

호는 부적절함(→사실관계 오류).

(2) 제약사 의견 (scoping survey 및 기타 회의 내용)

- 최신 항암제 등의 임상시험 내에서 해당 환자로부터의 삶의 질 개선이 보고되는 경우,

이는 매우 의미있는 양질의 결과이므로 이를 활용할 수 있도록 해야 함. 내국인 일반 대

중의 선호도가 아니라 외국인 환자의 선호도라 하더라도 활용할 수 있도록 해야 함.

- 임상연구에서 측정된 삶의 질 또는 효용값을 활용할 수 있다면 경제성평가 시 이를 직접

이용하도록 해야 함.

- 현재 국내 EQ-5D를 기본 분석으로 자료 요청하고 있으나, 임상시험에서 측정된 값을 산

식(mapping)을 이용하여 EQ-5D 값으로 변환한 값도 기본분석으로 수용해야 함.

- 제약업체 설문조사(경제성평가 제도개선 TFT 보고서[건강보험심사평가원, 2018]) : 2017

년 7월 25일 ~ 2017년 8월 4일 11일간 진행. 총 11개 사 응답함(그림 7).

F 뚜렷이 선호되는 항목 없이 고른 답변이 도출됨. 제약사 입장 : 효용 측정방법의 우선순

위를 명확하게 미리 정하기보다는 질환 특성 및 상황에 맞게 선택할 수 있도록 하였으

면 함. 상호 합의에 따른 일관성 있는 의사 결정과 함께 시간 흐름에 따른 변화를 반영

하는 것도 필요함.

Page 114: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 106 -

[그림 7] 효용 우선 순위에 대한 제약사(n=11) 응답 결과

바) 지침 개정방향 제언

간접측정의 경우 대상환자군이 경험하는 효과와 부작용을 평가에 직접 반영할 수 있고, 표

준화된 도구 사용으로 평가의 일관성 및 효율성을 제고할 수 있다. 이에 반해 직접측정의 경

우 건강상태 시나리오의 타당도에 따라 질 가중치가 크게 달라질 수 있으나, 정보와 시간의

제약으로 인해 이를 제대로 평가하기가 어려울 수 있다. 따라서 대다수 국가의 HTA 지침과

마찬가지로 지침 개정판에는 다음과 같이 간접측정 선호를 명시할 것을 제언한다.

- 선호에 기반한 일반 도구로 임상시험에 포함된 환자의 건강상태를 측정하고, 이 자료에

기존에 국내 일반대중을 대상으로 도출된 tariff를 적용하여 질 가중치를 산출하는 간접

측정방식을 선호한다고 명시한다.

- 선호에 근거한 일반 도구로 측정된 자료가 없거나 제한적일 때에는 건강상태 시나리오

(vignette)에 기반한 직접측정, 산식(mapping)을 통한 질 가중치 도출, 기존 문헌에서 제

시한 값 인용 등도 수용 가능하다는 안을 제시한다. 이 경우 일반 도구 사용의 한계점과

대안으로 사용된 방법에 대해 충분히 설명하고, 민감도 분석을 통해 대안 사용과 관련한

불확실성을 충분히 검토할 것을 명시한다.

Page 115: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 107 -

3) HRQoL 도구 및 tariff 선정 검토

가) 현 지침

(1) 주요 지침

질 가중치 측정에 사용된 도구는 신뢰도, 타당도가 검증된 것이어야 한다. 특히 외국에

서 개발된 도구를 사용할 때에는 언어적‧문화적 차이에 유의하여 국내에서 타당도 검증

이 된 도구를 사용한다.

도구에 따라 결과값에 차이가 있으므로, 연구자는 자신이 선택한 도구를 본 지침의 별

첨 3, 표 4에 근거하여 정당화하고 아울러 민감도 분석 등을 통해 질 가중치의 불확실성

이 결과에 미치는 영향을 검토한다.

자료 제출자는 조사 방법에 대하여 상세히 보고한다. 기본분석에서는 선호도에 근거한

일반도구의 사용이 권장되며, 질병별 도구, 선호도에 근거하지 않은 도구들을 사용하여

측정한 결과는 추가적으로 제출할 수 있다.

(2) 지침 내 추가 설명

현 지침에서는 표준이 되는 MAUI 도구와 tariff를 제시하고 있지 않다. 연구자는 자신이

선택한 도구를 지침에서 제시하는 양식에 근거하여 정당화하고 민감도 분석 등을 통해 불확

실성을 검토하도록 하고 있다. 내국인의 tariff가 다수 존재하는 경우에는 가능한 최근에 산

출된 연구이면서 대상군이 대표성 있는 연구에서 산출된 값을 기본값으로 권장하고 있다.

나) 기존 제출자료에 대한 검토 결과

현재 MAUI 중에서 국내의 일반대중을 대상으로 tariff가 산출된 도구는 EQ-5D가 유일

하지만, 연구 별로 값의 차이가 크다. 본 지침은 내국인의 tariff가 다수 존재하는 경우,

가능한 최근에 산출된 연구이면서 대상군이 대표성 있는 연구에서 산출된 값을 기본값

으로 권장한다. 이는 대체로 후발 연구는 선행 연구의 단점을 보완하기 위하여 수행되어

그 간의 이론적 발전을 반영하는 경향이 있고, 대표성이 부족한 샘플에서 산출된 값은

내국인 전체로 일반화시키는데 한계가 있기 때문이다. 만약 후발 연구라 하더라도 연구

방법의 타당도가 선행 연구보다 발전되지 않았거나, 샘플링 방법 및 그 규모가 열등하다

면 선행 연구를 사용할 수 있으며, 이때는 그 근거를 명시한다. 또한 사용되지 않은 연

구의 tariff값을 사용하여 민감도분석을 수행하는 것을 권장한다.

Page 116: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 108 -

2014~2019년 5년간 심평원에 건강보험 등재의 목적으로 제출된 경제성평가 자료 50건(CUA

47건) 중에서 일반도구를 이용하여 질 가중치를 간접 측정한 사례는 6건이었다(표 30). 이 중

에서 EQ-5D-3L을 사용한 사례가 4건, EQ-5D-5L을 사용한 사례가 2건 있었다. EQ-5D-3L의

경우 tariff 출처를 언급하지 않은 1건을 제외한 나머지 3건에서 모두 Lee et al. (2009)의

tariff를 이용하여 질 가중치를 계산하였다. EQ-5D-5L의 경우 2건 모두에서 Kim et al.

(2016a)의 tariff를 이용하였다. 민감도 분석에서 다른 tariff를 이용한 경우가 총 2건 있었는

데, Jo et al. (2008)의 tariff를 이용한 사례가 1건, 영국 tariff를 이용한 사례가 1건 있었다.

ICER (incremental cost-effectiveness ratio)의 경우 Jo et al. (2008)의 tariff를 이용했을 경우

1.46%가 증가하였고, 또 다른 사례에서 영국 tariff를 이용하여 민감도 분석을 하였을 경우

ICER가 15.1% 증가한 것으로 보고되었다.

다) 외국 지침

도구에 따라 질 가중치의 차이가 크기 때문에 일관된 정책 결정을 위하여 영국을 비롯한

상당수 유럽 국가에서 EQ-5D를 하나의 도구로 권장하거나 선호한다고 언급하였다. 그러나

호주나 캐나다 등 일부 국가에서는 대상 질환에 적합한 도구를 선택할 수 있도록 하였고, 대

신 도구 선택에 대한 근거를 제시하도록 하였다(표 31).

(1) 캐나다(CADTH, 2017)

캐나다 지침에서는 선호도에 근거한 일반 도구 사용을 권장하고 있다. 많이 사용되고 있는

사례 질환 유형건강상태, 선호도

측정대상Tariff

1 위장관기질종양 EQ-5D-3L 환자, 일반대중Lee et al. (2009)

민감도 분석 : Jo et al. (2008)

2 다발성 골수종 EQ-5D-3L 환자, 일반대중 Lee et al. (2009)

3 전신홍반루푸스 EQ-5D-3L 환자, 일반대중 Lee et al. (2009)

4 비소세포폐암 EQ-5D-3L 환자, 언급 없음 언급 없음

5 비소세포폐암 EQ-5D-5L 환자, 일반대중Kim et al. (2016a)민감도 분석 : 영국

tariff

6 신장세포암 EQ-5D-5L 환자, 일반대중 Kim et al. (2016a)

※ (최초 제출 자료의) 주요 기본분석을 기준으로 분류MAUI: multi-attribute utility instrument

<표 30> 2014-2018년 국내 제출된 보고서에서 사용된 MAUI 및 tariff

Page 117: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 109 -

일반 도구로 EQ-5D, HUI, SF-6D 등을 언급하였으나, 어느 한 도구를 표준도구로 제시하지는

않았다. 다만, 측정하고자 하는 건강상태의 속성(attribute)과 건강상태의 변화 및 차이를 잘

포착할 수 있는 도구를 선택할 것을 권장하고 있으며, 도구의 실행가능성(feasibility), 신뢰도

(reliability), 타당도(validity) 등이 충분히 검증되었는지 검토하도록 하고 있다. 또한, 지침에서

는 질 가중치를 측정하기 위해 사용된 자료의 일관성을 강조하고 있는데, 특히 단일 경제성

평가에 사용할 질 가중치를 도출할 때에는 동일한 도구와 인구집단에서 도출된 자료를 사용

할 것을 권장하고 있다.

캐나다 일반대중의 선호를 반영한 선호 점수체계(tariff)를 고려할 때에도 연구자는 자료가

평가 목적에 부합하는지 여부와 자료의 신뢰도 및 일관성 등을 비교하고 검토할 것을 제시

하고 있다. 현재 가용할 수 있는 캐나다 tariff로는 TTO 및 DCE(discrete choice experiments)

를 이용하여 도출한 EQ-5D-3L tariff와 EQ-5D-5L tariff가 있고, SG와 VAS(visual analogue

scale)를 혼용하여 측정한 HUI2와 HUI3의 tariff가 있지만, 특정 tariff를 표준값으로 제시하고

있지는 않다.

(2) 호주(PBAC, 2016)

호주 지침에서는 자주 사용되고 있는 일반 MAUI(즉, HUI2, HUI3, EQ-5D-3L, EQ-5D-5L,

SF-6D, AQoL, CHU9D) 이외 다른 MAUI 또는 PRO(patient reported outcome) 도구가 사용되

었을 경우에는 (1) 이 도구에서 측정하고자 하는 삶의 질, 증상, 기능 영역, (2) 점수 체계

(scoring method), (3) 타당도(validity), (4) 신뢰도(reliability), (5) 건강상태 차이 또는 변화에

대한 민감도(responsiveness), (6) 최소한의 임상적으로 의미 있는 차이(minimal clinically

important differences, MCID) 등에 대한 정보를 추가로 제공하도록 하고 있다. 또한, 하나 이

상의 MAUI가 임상연구에서 사용되었을 경우에는 이 도구들로 측정된 결과들을 비교하도록

하고 있다. 점수체계가 호주 일반대중을 대상으로 도출된 것이 아닐 경우, 가능하면 대안에

대한 민감도 분석을 수행할 것을 제시하고 있다.

(3) 영국(NICE, 2013)

영국 NICE에서는 평가의 일관성을 위해 하나의 도구를 선정하여 사용하는 것을 선호한다.

지침에서는 분석대상이 성인일 경우 EQ-5D-3L 사용을 선호한다고 명시하였고, 이 자료에 영

국 일반대중을 대상으로 도출된 EQ-5D-3L tariff를 적용할 것을 권장하고 있다. 지침에서는

EQ-5D-5L도 기본분석에 사용될 수 있다고 명시하고 있으나, 영국 일반대중을 대상으로 수행

된 EQ-5D-5L 가치평가 연구(Devlin 등, 2018)에 대한 질(quality) 문제가 제기되어(Hernandez

Alava et al., 2018) 현재 사용 보류 중이라는 별도의 입장문(position statement)을 발표하였다

(NICE, 2019). 입장문에서는 현재 EuroQol 그룹에서 영국 일반대중을 대상으로 새롭게

Page 118: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 110 -

EQ-5D-5L 가치평가 연구를 하도록 하고 있으며, 이 연구가 완료되면 EQ-5D-5L에 대한

NICE 입장을 재검토할 계획이라고 명시하였다. 지침에서는 수용 가능한 EQ-5D-5L tariff가

개발될 때까지는 EQ-5D-5L이 사용되었을 경우 van Hout et al.(2012)에 의해 개발된 산식

(mapping) 알고리즘을 이용해 EQ-5D-3L 점수로 변환할 것을 권장하고 있다.

참고로 EQ-5D-5L 가치평가 연구의 질 평가를 담당했던 Hernandez Alava et al. (2018)은

보고서에서 EQ-5D-5L과 EQ-5D-3L로 측정된 결과는 이 두 도구 간 응답 수준 및 tariff 차

이로 인해 매우 다른 경향을 보이므로(Wailoo et al., 2017a), 일관된 정책 결정이 요구될 때

에는 이 두 도구를 상호 교환적으로(interchangeably) 사용할 수는 없다고 언급하였다.

또한, 지침에서는 EQ-5D가 어린이를 대상으로 개발된 도구가 아니라는 점을 명시하고 있

다. 7-12세 아동을 대상으로 HRQoL을 측정하는 EQ-5D 버전도 개발되었으나, 아직 이에 대

한 tariff가 개발되지 않았음을 언급하고 있다. 이 외에도 EQ-5D 사용이 부적절하다고 판단

될 때에는 EQ-5D의 내용 타당도(content validity)가 부족하다는 주장에 대해 질적인 실증 자

료(qualitative empirical data)를 제시할 것을 명시하고 있다. EQ-5D가 특정 환자 집단에서 구

성 타당도(construct validity) 및 민감도(responsiveness) 면에서 제대로 기능하지 못한다는 근

거를 제시해야 하는데, 이때 근거는 상호심사 문헌(peer-reviewed literature)을 종합하여 도

출되어야 한다고 하였다. 이러한 근거가 충분히 제시된 경우에는 다른 HRQoL 도구가 대안

으로 사용될 수 있는데, 이때 대안으로 사용된 도구의 타당도와 측정 자료를 포함하여 이 도

구 사용이 질 가중치에 미칠 수 있는 영향에 대해 자세히 설명하도록 하고 있다.

(4) 기타

EUnetHTA (2015a)에 따르면 간접 측정방법을 권장하는 상당수 유럽 국가(예: 벨기에, 크로

아티아, 체코, 영국, 이탈리아, 네덜란드, 폴란드, 스코틀랜드 및 슬로바키아)에서 EQ-5D 사

용을 권장하고 있다. 오스트리아, 발트해(에스토니아 및 라트비아) 및 프랑스에서는 EQ-5D

또는 HUI 사용을 선호하며, 아일랜드, 노르웨이 및 스페인 CatSalut에서는 EQ-5D 또는

SF-6D 사용을 권장하고 있다(EUnetHTA, 2015a). 노르웨이 지침에서는 추가로 15D도 수용 가

능한 방법으로 언급하고 있다. ISPOR Task Force에서는 실증 근거(empirical evidence)에 기

반한 도구의 실용성(practicality), 신뢰도(reliability), 타당도(validity), 민감도(responsiveness)와

해당 HTA 기관의 선호를 고려하여 도구를 선정할 것을 권장하고 있다(Wolowacz et al.,

2016).

국가 지침 내용 원문 요약

캐나다 The most common generic classification systems include the 건강상태 특성과

<표 31> HRQoL 도구 및 tariff 선정 관련 해외 지침 내용

Page 119: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 111 -

CADTH 지침(4판)(2017)

EQ-5D, the HUI, and the SF-6D.78-80 (p45)The selection of a particular indirect generic method should be based on its fitness in terms of reflecting the health states of interest and their associated attributes, and in terms of capturing potentially important changes within and among states. The researcher should also assess the credibility of the instrument in terms of whether it represents an established instrument with demonstrated psychometric properties including feasibility, reliability, and validity.83 Consistency with respect to the data used for estimating utility values is strongly recommended; in particular, it is recommended that utility data from the same instrument and population be used to estimate all the utilities in an economic evaluation. (p45)

변화를 가장 잘 포착할 수 있는 일반

도구 선택. 연구자는 도구의

실행가능성(feasibility), 신뢰도(reliability),

타당도(validity) 등의 검증 여부를 확인해야

함.

When considering Canadian-specific preference sets, researchers must weigh their fitness for purpose against any issues of credibility and consistency with the data used to inform other parameter estimates, to ensure that the specific instrument addresses the decision problem. (p46)

Examples of Canadian-specific preference sets include the EQ-5D, which has been measured using the time-trade-off technique and a discrete choice experiment for both the EQ-5D-3L and EQ-5D-5L (three-level and five-level versions, respectively),81,82 and the HUI Mark 2 and Mark 3, which have been measured using a combination of the standard gamble and visual analogue scale from a sample of adults from Hamilton, Ontario.2 (p45)

캐나다 선호 점수체계 고려 시, 연구자는 자료가 목적에 적합한지 여부와

자료의 신뢰도(credibility) 및 일관성(consistency) 등을 비교하여 평가.

캐나다 tariff : TTO 및 DCE 이용하여

측정한 EQ-5D-3L & EQ-5D-5L

SG 및 VAS를 혼용하여 측정한 HUI2

& HUI3

호주PBAC 지침

version 5(2016)

Several commonly used MAUIs for which a detailed discussion of the validity or reliability is not required are the Health Utilities Index (HUI2 or HUI3), the EQ5D-3L or -5L (‘EuroQol’), the SF-6D (a subset of the Short Form 36, or SF-36), the Assessment of Quality of Life (AQoL) instruments, and the Child Health Utility 9D (CHU9D) index for children and adolescents. (p37)

Where a patient-reported outcome measure is used, or a MAUI that is not listed above, provide, in an attachment, a discussion of (or reference supporting) the: domains of quality of life, symptoms or function that are covered by the instrument scoring method of the instrument validity of the instrument reliability of the instrument responsiveness of the instrument to differences in health states between individuals and to changes in health states over time experienced by an individual clinical importance of any differences detected by the instrument

자주 사용되는 MAUI에 대해서는 도구의 타당도 및 신뢰도 논의할 필요 없음.

그러나 PRO 도구 또는 위에서 언급되지 않은 MAUI가 사용되었을

경우에는 (1) 도구에서 측정하고자 하는 삶의 질, 증상, 기능 영역, (2) 점수 체계, (3)

타당도, (4) 신뢰도, (5) 건강 상태 차이 또는

변화에 대한 민감도(responsiveness),

(6) MCID 제시.

하나 이상의 MAUI가 임상연구에서

Page 120: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 112 -

라) 기타 문헌고찰 결과

(1) MAUI 도구

표 32에 제시된 바와 같이 성인을 대상으로 현재 가장 많이 사용되고 있는 선호에 근거한

일반 도구 또는 MAUI로는 Quality of Well-Being Self-Administered(QWB-SA)(Kaplan &

Anderson, 1988; Seiber et al., 2008), Health Utility Index three(HUI-3)(Feeny et al., 2002),

(see Subsection 2.4.4 for guidance on minimal clinically important differences [MCIDs]). (p37)

If more than one MAUI has been used in the included study, compare the results from the two MAUIs. (p42)

사용되었을 경우 두 도구의 결과 비교.

If the scoring algorithm has not been derived from the general population in Australia, consider presenting a sensitivity analyses using alternative scoring algorithms, if possible. (p42)

점수체계가 호주 일반대중을 대상으로 도출된 것이 아닐

경우, 가능하면 대안에 대해 민감도 분석

실시.

영국 NICE 지침 (2013)

Different methods used to measure health-related quality of life produce different utility values; therefore, results from different methods or instruments cannot always be compared. Given the need for consistency across appraisals, one measurement method, the EQ-5D, is preferred for the measurement of health-related quality of life in adults. (p41)

The standard version of the EQ-5D has not been designed for use in children. An alternative version for children aged 7–12 years is available, but a validated UK valuation set is not yet available. (p42)

The EQ-5D-5L may be used for reference-case analyses. The descriptive system for the EQ-5D-5L has been validated, but no valuation set to derive utilities currently exists. Until an acceptable valuation set for the EQ-5D-5L is available, the validated mapping function to derive utility values for the EQ-5D-5L from the existing EQ-5D (-3L) may be used. (p42)

평가의 일관성을 위해 성인 대상인 경우 하나의 도구(EQ-5D)

선호 명시.

7-12세 아동용 도구있으나, 아직 검증된 영국 tariff

없음.

EQ-5D-5L도 기본분석에 사용될 수

있음. 도구의 기술체계는

검증되었으나, 수용 가능한 영국 tariff 현재 없음. 수용

가능한 tariff가 개발될 때까지 EQ-5D-5L

이용 시 산식(mapping) 통해 EQ-5D-3L로

변환.

A set of preference values elicited from a large UK population study using a choice based method of valuation (the time trade-off method) is available for the EQ-5D health state descriptions. This set of values should be applied to measurements of health-related quality of life to generate health-related utility values. (p41)

TTO 통해 도출한 영국 tariff 있음. 이를

이용해야 함.

Page 121: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 113 -

EQ-5D(Dolan, 1997), 15D(Sintonen & Pekurin, 1993), SF-6D(Brazier et al., 2002; Brazier &

Roberts, 2004), Assessment of quality of life-8D(AQoL)(Hawthorne et al., 1997; Richardson et

al., 2014) 등이 있다.

동일한 환자의 건강상태라 할지라도 어떤 MAUI를 사용하느냐에 따라 매우 다른 질 가중

치가 도출될 수 있다. 그 이유는 각 도구의 기술체계에 포함된 건강 영역 및 수준이 도구마

다 다르고, 건강상태에 대한 선호도 측정방법 등도 도구마다 다르기 때문이다. 예를 들어,

SF-6D에는 에너지 영역이 포함되어 있지만, EQ-5D에는 포함되어 있지 않다. 선호도 도출 시

EQ-5D는 주로 TTO 방법을 사용하나, HUI-3와 SF-6D는 SG 방법을 사용한다. EQ-5D와

HUI-3의 경우에는 죽음보다 나쁜 건강상태를 허용하기 때문에 음의 효용값도 존재하지만,

QWB과 SF-6D는 이를 허용하지 않는다. 또한, EQ-5D, SF-6D, QWB-SA는 질 가중치 도출 시

가법(additive) 함수를 이용하나, HUI-3나 AQoL-8D는 승법(multiplicative) 함수를 이용한다.

Richardson et al. (2015a)은 MAUI(EQ-5D, HUI-3, SF-6D, 15D, QWB, AQoL)에 따른 질 가중

치를 비교하기 위하여 호주, 영국, 미국, 캐나다, 노르웨이, 또는 독일에 거주하는 7개 만성

질환자와 건강한 일반인을 대상으로 Multi Instrument Comparison(MIC) 프로젝트를 수행하였

다. 해당 도구의 원 tariff(즉, 도구 개발국의 tariff)를 적용하여 질 가중치를 산출한 결과, 도

구 간 상당한 차이를 보이는 것으로 나타났다. 특히 15D는 질 가중치를 상대적으로 높게,

QWB는 질 가중치를 상대적으로 낮게 측정하는 경향이 있었다. 연구팀에서는 이러한 차이가

도구의 건강상태 기술체계에 의한 것인지, 아니면 tariff에 의한 것인지를 확인하기 위하여

추가 연구를 수행하였다(Richardson et al., 2015b). 분석 결과 도구 간 질 가중치 차이는 주

로 기술체계와 스케일 효과(scale effect)에서 기인한다고 하였는데, 특히 기술체계가 차지하

는 비중이 66%라고 보고하였다. 질 가중치의 범위 차이로 발생하는 스케일 효과도 도구 간

차이의 30.3%를 설명하는 것으로 나타났다.

위에서 살펴본 바처럼 도구 선택은 결과에 큰 영향을 미칠 수 있는 한 요인이지만, 아직

어떤 도구가 가장 우월한지에 대한 합의는 이뤄진 바 없다. 다만, 현재까지 가장 많이 사용

된 도구는 EQ-5D인 것으로 보고된다. 2005년~2010년 동안 사용된 전체 MAUI 중에서 EQ-5D

가 차지한 비중은 63.2%이며, 그다음으로는 HUI-2/HUI-3(14.4%)와 SF-6D(8.8%) 순으로 나타났

다(Richardson et al., 2014). EQ-5D의 높은 사용 빈도는 영국 NICE의 영향을 받은 것으로 추

정되는데, 영국 NICE(2013) 지침에서는 평가의 일관성을 위해 하나의 도구, 즉 EQ-5D를 선호

한다고 명시하였다. Brazier et al. (2017)은 실용성(practicality), 신뢰도(reliability), 내용 타당

도(content validity), 구성 타당도(construct validity), 가치평가 방법 및 대상 등을 고려하여

도구를 선택해야 한다고 주장하였다.

Page 122: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 114 -

위에서 논의된 대부분의 MAUI는 주로 성인을 대상으로 개발되었기 때문에, 내용 타당도

(content validity)와 안면 타당도(face validity) 면에서(예: 건강 영역 및 단어 표현(wording))

아동에게 적합하지 않다는 지적이 있다(Stevens, 2009; Brazier et al., 2017). 따라서 여러 도

구들이 어린이용으로 수정·보완되거나 새로 개발되었는데, 그 예로는 HUI-2, 16D, 17D,

AQoL-6D, EQ-5D-Y, CHU-9D 등이 있다. 이에 대한 자세한 설명은 표 33을 참고할 수 있다.

도구(도구 개발국)

연령 응답자 영역 건강상태 개수

HUI2(캐나다)

≥5, 5-8세 경우 대리자

자기 보고, 면접관 기입,

감각(sensation), 운동능력(mobility), 감정(emotion), 인지(cognition), 자기

관리(self-care), 통증(pain), 24,000

<표 33> 어린이 및 청소년 대상 MAUI

도구(도구 개발국)

영역건강상태 개수

(원) 가치평가 방법(질 가중치

최소값)QWB-SA(미국)

운동능력(mobility), 신체적 활동(physical activity), 사회적 기능(social functioning)

945 RS(0.09)

HUI-3(캐나다)

시력(vision), 듣기(hearing), 말하기(speech), 보행(ambulation), 손 민첩성(dexterity),

감정(emotion), 인지(cognition), 통증(pain)972,000 SG(-0.36)

EQ-5D(EQ-5D-3L & EQ-5D-5L)

(영국)

운동능력(mobility,), 자기 관리(self-care), 일상 활동(usual activities), 통증/불편감(pain/discomfort),

불안/우울(anxiety/depression)

243(3L)3,125(5L)

3L : TTO(-0.59)5L : TTO & DCE(-0.208)

15D(핀란드)

운동능력(mobility), 시각(vision), 청각(hearing), 숨시기(breathing), 잠자기(sleeping), 먹기(eating), 말하기(speech,), 대소변 배출(excretion), 일상 활동(usual activities), 정신적 기능(mental

function), 불편감/증상(discomfort/symptoms), 우울(depression), 스트레스(distress), 활력(vitality),

성적 활동(sexual activity)

310억 RS(0.11)

SF-6D(영국)

신체적 기능(physical functioning), 역할 제한(role limitation), 사회적 기능(social functioning),

통증(pain,), 에너지(energy), 정신 건강(mental health)

18,3000(SF-36)7,500(SF-12)18,750(SF-V2)

SG(0.301)

AQoL-8D (호주)

독립적 생활(independent living, 4항목), 감각(senses, 3), 통증(pain, 3), 정신 건강(mental

health, 8), 행복감(happiness, 4), 자기 가치(self-worth, 3) 대응 능력(coping, 3),

관계(relationship, 7)

2.37⨉1023RS &

TTO(-0.04)

출처: Brazier et al. (2017) 참조 AQoL-8D: assessment of quality of life-8 dimensions, HUI-3: health utilities index-3, DCE: discrete choice experiment, MAUI: multi-attribute utility instrument, QWB-SA: quality of well-being self-administered, RS: rating scale, SG: standard gamble, SF-6D: short-form 6 dimensions, TTO: time trade-off

<표 32> MAUI 도구 비교

Page 123: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 115 -

(2) MAUI의 국내 가치평가 연구

현재 국내 일반인을 대상으로 수행된 MAUI의 가치평가 연구는 총 7개가 있다. EQ-5D-3L

대상 3개(강은정, 2006; Jo et al., 2008; Lee et al., 2009)와 EQ-5D-5L 대상 2개(조민우, 2011;

응답대리자 기입

(출산(fertility); 아동 암환자 대상으로 개발되어 부작용 평가

위해 포함. 현재 생략)

16D(핀란드)

12-15세

자기 보고, 면접관 기입, 대리자 기입

운동능력(mobility), 시력(vision), 듣기(hearing), 숨쉬기(breathing), 잠자기(sleeping), 먹기(eating),

말하기(speech), 대소변 배출(excretion),

학교/취미(school/hobbies), 정신적 기능(mental function),

불편/증상(discomfort/symptoms), 우울(depression), 스트레스(distress), 활력(vitality), 외모(appearance),

친구(friends)

1.5⨉1011

17D(핀란드)

8-11세, 8세 미만의

경우 대리자 응답

면접관 기입, 대리자 기입

운동능력(mobility), 시력(vision), 듣기(hearing), 숨쉬기(breathing), 잠자기(sleeping), 먹기(eating),

말하기(speech), 대소변 배출(excretion),

학교/추억(school/hobbies), 배우기/기억(learning/memory), 불편/증상(discomfort/symptoms),

우울(depression), 스트레스(distress), 활력(vitality), 외모(appearance), 친구(friends), 집중(concentration)

7.6⨉1011

AQoL-6D 청소년(호주)

청소년 자기보고

독립적 생활(independent living), 관계(relationships), 정신 건강(mental health), 대응 능력(coping), 통증(pain),

감각(senses)

7.8⨉1013

EQ-5D-Y(영국)

8-15세, 4-7세 경우 대리자 응답

자기보고, 대리자 기입

운동능력(mobility,), 자기 관리(self-care), 일상 활동(usual

activities), 통증/불편감(pain/discomfort), 불안/우울(anxiety/depression)→ 어린이용으로 문구 수정

243

CHU-9D(영국)

7-17세 자기보고, 대리자 기입

걱정(worry), 슬픔(sadness), 통증(pain), 피곤(tiredness),

짜증(annoyance), 학교(school), 잠(sleep), 일상생활(daily routine),

일상활동(daily activities)

1,953,125

출처: Brazier et al. (2017) 참조 AQoL-6D: assessment of quality of life-6 dimensions, CHU-9D: child health utility 9-dimensions, HUI-2: health utilities index-2, MAUI: multi attribute utility instrument.

Page 124: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 116 -

Kim et al., 2016a)가 있고, 국내에서 새롭게 개발된 HRQoL Instrument with 8 items (HINT-8)

대상 1개(조민우, 2017)와 Child Health-6D (CH-6D) 대상 1개(한겨레 & 강은정, 2015)가 있다.

이 중 아동용으로 개발된 것은 CH-6D가 국내 유일하다.

☐ EQ-5D-3L 국내 가치평가 연구

EQ-5D-3L은 유럽의 EuroQol 그룹에서 개발한 HRQoL 설문 도구로 운능 능력, 자기 관리,

일상 활동, 통증/불편, 불안/우울의 5개 영역과 영역별 3단계 응답 수준으로 구성되어 있다.

구성이 간단하고 답변이 용이하여 가장 많이 사용되고 있는 삶의 질 평가 도구 중 하나이다.

표 34에서 보는 바와 같이 국내에서는 현재 세 개의 가치평가 연구가 존재하나, 연구마다 건

강 영역의 상대적 중요도 및 산출된 질 가중치의 범위가 다르다.

Jo et al. (2008)은 우리나라에서 최초로 일반인구 집단을 대상으로 EQ-5D-3L에 대한 가치

평가 연구를 실시하였다. 서울, 경기 지역의 20세 이상 성인 500명을 대상으로 TTO 방법을

사용하여 건강상태의 선호도를 조사하였다. 33333과 무의식 상태를 포함한 43개 건강상태를

평가하였고 응답자 1인당 13개의 상태를 평가하도록 하였다. 최종모형으로 LN(1-건강상태의

질 가중치)을 사용하였는데, 이때 절대평균오차(mean absolute error, MAE)는 0.074이었다. 자

기 관리나 일상 활동이 상대적으로 중요하게 평가되었고, 질 가중치의 범위는 –0.562(33333)에서 1(11111)이었다.

강은정 등(2006)은 국민건강영양조사에서 사용한 조사구 가운데 7개 조사구를 선정하여

302(분석 기준 287)명에게 면대면 면접 방식의 설문조사를 실시하였다. TTO 방법을 사용하여

EQ-5D-3L로 정의되는 243개 건강상태 중 17개 상태에 대한 선호도를 조사하였다. 이 연구에

서는 N3와 I2sq항을 포함한 모형을 최종모형으로 선택하였는데 N3는 수준 3이 하나라도 있

을 경우 활성화되는 항이고, I2sq는 I2의 제곱항으로 I2는 수준 2가 두 개 이상 있을 때 수준

2가 있는 영역의 개수에서 1을 뺀 값이다. 이 모형의 R2는 0.4321로 보고되었고, Jo et

al.(2008)의 연구와는 다르게 운동 능력이 제일 중요한 영역으로, 자기 관리가 덜 중요한 영

역으로 평가되었다. 질 가중치의 범위는 –0.243(33333)에서 1(11111)이었다.

Lee et al.(2009)은 가장 최근에 수행된 연구로 전국 20세 이상 성인 1,307명을 대상으로 가

치평가 연구를 수행하였다. EuroQoL 그룹이 제안한 100개의 상태에 33333 상태를 포함하여

측정하였고, 각 응답자에게는 11111, 33333, 사망 상태를 포함한 15개의 상태를 할당하여 평

가하도록 하였다. 선행 두 연구와 마찬가지로 TTO를 이용하여 질 가중치를 도출하였다. N3

를 포함한 OLS(ordinary least squares) 모형을 최종 모형으로 선정하였고, 이때 수정된 R2는

0.984로 높은 설명력을 보였다. 운동 능력과 일상 활동이 가장 중요한 영역으로 평가되었고,

질 가중치의 범위는 –0.171(33333)에서 1(11111)이었다. 참고로 국민건강영양조사에서 조사한

EQ-5D-3L의 점수는 이 연구의 모형을 바탕으로 산출된 것이다.

Page 125: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 117 -

항목Jo et al.(2008)

강은정 등(2006)

Lee et al.(2009)

표본수 500명302명

(287명 분석)1,307명

(1,264명 분석)

표본 특성서울, 경기 지역의 만 20세 이상 성인 남녀

서울, 인천, 경기, 전북, 충남 20세 이상 성인

남녀

제주를 제외한 전국의 20세 이상 성인 남녀

자료수집설문지 기반 직접 방문

면접조사설문지 기반 직접 방문

면접조사설문지 기반 직접 방문

면접조사

측정 건강상태 42개 17개 101개

주 가치평가 방법 TTO TTO TTO

수정된 R2 언급 없음(MAE=0.074)

0.4321(MAE=0.028)

0.984(MAE=0.029)

영역별 상대적 중요도 (최종 모형 기준[특히 수준 3의 회귀계수 참고])

SC3(자기 관리), UA3(일상활동), AD3(불안/우울), M3(운동능력) & PD3(통증/불편) 순

M3(운동능력), UA3(일상활동) & PD3(통증/불편), AD3(불안/우울),

SC3(자기 관리) 순

M3(운동능력), UA3(일상활동),

AD3(불안/우울) & PD3(통증/불편) & SC3(자기 관리) 순

점수 계산 및 범위

점수 = 1 – exp(-2.68NPH + 0.267M2 + 0.554M3 + 0.471SC2 + 0.819SC3 + 0.374UA2 + 0.662UA3 + 0.318PD2 + 0.488PD3 + 0.313AD2 +

0.603AD3)

(NPH, 11111 외의 건강상태)

범위 –0.562(33333) ~ 1(11111)

점수 = 1 - (0.164NPH + 0.003M2 + 0.274M3 + 0.058SC2 + 0.078SC3 + 0.045UA2 + 0.134UA3 + 0.049PD2 + 0.132PD3 + 0.044AD2 + 0.102AD3 + 0.345N3 + 0.014I2sq)

(NPH, 11111 외의 건강상태; N3, level 3 최소 1개 이상; I2sq, (level 2의 개수 –1)의

제곱)

범위 : -0.243(33333) ~ 1(11111)

점수 = 1 - (0.05NPH + 0.096M2 + 0.418M3 + 0.046SC2 + 0.136SC3 + 0.051UA2 + 0.208UA3 + 0.037PD2 + 0.151PD3 + 0.043AD2 + 0.158AD3 +

0.05N3)

(NPH, 11111 외의 건강상태; N3, level 3

최소 1개 이상)

범위 : -0.171(33333) ~ 1(11111)

MAE: mean absolute error, OLS: ordinary least squares, TTO: time trade-off

<표 34> EQ-5D-3L 국내 가치평가 연구

Page 126: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 118 -

☐ EQ-5D-5L 국내 가치평가 연구

EQ-5D-5L은 건강 변화에 대한 EQ-5D-3L의 민감도를 개선하고 모든 영역에 문제가 없다

고 보고하는 천장 효과(ceiling effect)를 줄이기 위해 고안된 평가 도구로, EQ-5D-3L과 동일

한 영역으로 구성되어 있으나 영역별 응답 수준이 3단계에서 5단계로 확장되었다. 표 35에서

제시된 바와 같이 국내에서는 현재 두 개의 EQ-5D-5L 가치평가 연구가 존재한다. 이들 연구

에서는 EQ-5D-3L과 비교 시 천장 효과가 감소했고 신뢰도와 민감도는 유의하게 증가했다고

보고하였다(조민우, 2011; Kim et al., 2016a).

먼저 조민우(2011)는 서울, 인천, 경인 지역에 거주하는 500명의 성인을 대상으로 SG 방법

을 사용하여 EQ-5D-5L의 가치평가 연구를 수행하였다. 총 70개의 건강상태를 선정하여 각

응답자가 이 중 7개의 건강상태와 추가로 55555 및 무의식 상태를 함께 평가하도록 하였다.

절편이 없는 주효과모형을 최종모형으로 선정하였는데, 이때 수정된 R2는 0.75로 상대적으로

높은 설명력을 보였고, MAE도 0.031로 양호한 수준이었다. 최종모형에서는 이동성(운동능력)

과 자기 관리가 상대적으로 중요하게 평가되었고, 질 가중치의 범위는 –0.159(55555)에서

1(11111)이었다.

Kim et al. (2016a)은 제주를 제외한 전국의 19세 이상 성인 남녀 1,080명을 대상으로

composite TTO (cTTO) 방식을 사용하여 EQ-5D-5L의 가치평가 연구를 실시하였다. cTTO는

사망보다 나은 건강상태에 대해서는 기존의 TTO 방식으로 평가하고 사망보다 나쁜 건강상

태에 대해서는 lead time TTO 방식으로 진행한다. 이 연구에서는 총 86개의 건강상태를 선

정하여, 각 응답자가 이 중 10개의 건강상태를 평가하도록 하였다. 최종 모형으로는 N4항을

포함한 모형이 선정되었는데, N4는 수준 4 이상이 하나라도 있을 경우 활성화되는 항이다.

이 모형의 R2는 0.538, MAE는 0.027로 양호한 수준을 보였다. 이동성(운동능력)과 통증/불편

영역이 상대적으로 중요하게 평가되었으며, 질 가중치의 범위는 –0.066(55555)에서 1(11111)로

선행 연구와는 의미 있는 차이를 보였다.

항목 조민우(2011) Kim 등(2016a)

표본수 500 명 1,080 명

표본 특성서울, 인천, 경기지역의 만 19세 이상

성인 남녀제주를 제외한 전국의 19세 이상 성인

남녀

자료수집 설문지 기반 직접 방문 면접조사 컴퓨터 기반 일대일 면접조사

측정 건강상태 72개 (55555 & 무의식 포함) 86개

주 가치조사방법 SG Composite TTO

<표 35> EQ-5D-5L 국내 가치평가 연구

Page 127: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 119 -

☐ 기타 MAUI의 국내 가치평가 연구

EQ-5D 외에도 국내 일반인을 대상으로 가치평가가 수행된 삶의 질 도구로는 최근에 국내

에서 개발된 HINT-8과 CH-6D가 있다.

HINT-8은 한국인의 HRQoL을 측정하고, 추후 국민건강영양조사에서 사용하기 위해 개발된

한국형 삶의 질 측정 도구이다(조민우, 2014). 신체적, 사회적, 정신적, 긍정적 영역에 기반한

8개 항목(신체적 – 계단 오르기, 통증, 기운; 사회적 – 일하기; 정신적 – 우울, 기억, 수면; 긍

정적 – 행복)과 항목별 4개의 응답 수준으로 구성되어 있다.

HINT-8에 대한 가치평가 연구(조민우, 2017)는 컴퓨터 보조 개인 면접 방식으로 전국 성인

R2 0.75(MAE=0.031)

0.538(MAE=0.027)

영역별 상대적 중요도 (최종 모형 기준[특히 수준 4,5의 회귀계수 참고])

M5(이동성), SC5(자기 관리), PD5(통증/불편) & UA5(일상생활) &

AD5(불안/우울) 순

M3(이동성), PD3(통증/불편), UA3(일상활동) & AD3(불안/우울) &

SC3(자기 관리) 순

점수 계산 및 범위

점수 = 1 - (0.068M2 + 0.114M3 + 0.238M4 + 0.396M5 +0.042SC2 + 0.081SC3 +0.127SC4 + 0.232SC5 +0.010UA2 + 0.034UA3 + 0.129UA4 + 0.170UA5 + 0.014PD2 + 0.036PD3 +0.096PD4 + 0.198PD5 + 0.047AD2 + 0.054AD3 +0.116AD4 + 0.164AD5)

범위 : -0.159(55555) ~ 1(11111)(*반올림으로 인해 점수표와 계산값 사이 약간의 차이 발생. 55555 계산

시 0.160)

점수 = 1 – (0.096NPH +0.046M2 + 0.058M3 + 0.133M4 + 0.251M5 +0.032SC2 + 0.050SC3 +0.078SC4 + 0.122SC5 +0.021UA2 + 0.051UA3 + 0.100UA4 + 0.175UA5 + 0.042PD2 + 0.053PD3 +0.166PD4 + 0.207PD5 + 0.033AD2 + 0.046AD3 +0.102AD4 + 0.137AD5 +

0.078N4)

범위 : -0.066(55555) ~ 1(11111)

MAE: mean absolute error, SG: standard gamble, TTO, time trade-off

Page 128: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 120 -

1,015명을 대상으로 이뤄졌다(표 36). 총 65,536 건강상태 중 111개의 건강상태를 SG를 사용

하여 평가하였고, 각 응답자는 완전한 건강상태인 11111111, 44444444, 사망 상태를 포함하여

총 9개의 건강상태를 평가하였다. 최종모형의 R2는 0.563, MAE는 0.043으로 보고되었다. 또

한, 신체적 영역인 통증과 계단 오르기가 상대적으로 중요하게 평가되었고, 최종모형에서 도

출된 질 가중치의 범위는 0.132(44444444)에서 1(11111111)로 모두 죽음(0)보다 더 나은 상태

로 평가되었다.

CH-6D는 아동의 삶의 질을 측정하기 위해 개발된 선호기반의 일반적인 삶의 질 측정 도

구로 국내에서 최초 개발되었다(강은정 등, 2014)(표 36). 아동청소년을 대상으로 해외에서 개

발된 일반적 HRQoL 도구는 존재하지만(예를 들어, EQ-5D-Y, HUI-2, CHU-9D), 국내 일반 대

중을 대상으로 가치평가가 수행된 아동용 일반적 삶의 질 도구는 현재 CH-6D가 국내에서

유일하다. CH-6D는 6개 영역(공부, 운동/뛰기, 힘, 기분, 아픔/불편감, 친구들과 어울려 놀기)

과 각 영역별 3-4개의 응답 수준으로 구성되어 있다.

한겨레 & 강은정(2015)은 서울 거주 20세 이상 성인 173명을 대상으로 TTO를 사용하여

2,304개의 건강상태 중 26개의 건강상태에 대해 조사를 진행하였다. 최종 모형의 R2는 0.554,

MAE는 0.0631이었다. 수준 4까지 있는 영역에서 수준 4의 회귀계수 크기는 친구들과 어울려

놀기, 공부, 운동/뛰기, 힘 순이었으며 수준 3까지 있는 영역에서 수준 3의 회귀계수는 기분,

아픔/불편감 순으로 나타났다. 가치평가 방법에 대한 예시나 알고리즘은 제시되어 있지 않다.

두 도구의 타당도와 신뢰도는 HINT-8의 경우 일반대중(이현정 등, 2016) 및 수술후 유방암

환자(Kim et al., 2019)를 대상으로 확인된 바 있고, CH-6D의 경우 일부 지역 아동(n=112)과

전국 패널에서 추출된 고등학생(n=229)을 대상으로 확인된 바 있으나(강은정 & 한겨례,

2018), 좀 더 다양한 집단을 대상으로 추가 검증이 필요할 것으로 판단된다.

항목 조민우(2017) 한겨레 & 강은정 (2015)

도구 HINT-8 CH-6D

도구개발 목적한국형 건강관련 삶의 질 측정도구인 HINT-8의 일반대중의 선호를 반영한

tariff 개발

아동에게 사용할 수 있는 선호도 기반 일반

총 건강상태 65,536개(일부 응답 수준 합쳐짐) 2,304개

영역 및 수준

4개의 영역에 기반한 8개 항목:신체적 – 계단 오르기(CL), 통증(PA),

기운(VI)사회적 – 일하기(WO)

정신적 – 우울(DE), 기억(ME), 수면(SL)긍정적 – 행복(HA)

각 항목별 4개의 응답 수준(tariff 계산

6개 영역(공부, 운동/뛰기, 힘, 기분, 아픔/불편감, 친구들과 어울려 놀기).

각 영역별 3-4개의 응답 수준

<표 36> 기타 국내 일반적인 삶의 질 도구를 이용한 가치평가 연구

Page 129: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 121 -

(3) 표준 MAUI 및 tariff 제시 여부

가장 널리 사용되고 있는 MAUI(예 – EQ-5D, SF-6D, HUI 등) 중에서 현재 국내 일반대중을

대상으로 가치평가가 수행된 도구는 EQ-5D 뿐인데, EQ-5D-3L 대상 3개(강은정, 2006; Jo et

al., 2008; Lee et al., 2009)와 EQ-5D-5L 대상 2개(조민우, 2011; Kim et al., 2016a)가 있다. 이

와 더불어 아직 검증이 더 필요하기는 하나 국내에서 새롭게 개발된 HINT-8 대상 1개(조민

우, 2017)와 CH-6D 대상 1개(한겨레 & 강은정, 2015)가 있다. 그러나 위에서 살펴본 바처럼

같은 도구라 할지라도 어떠한 tariff를 사용하느냐에 따라 질 가중치와 QALY가 크게 달라질

수 있다.

도구 선택에 따른 QALY 값의 차이는 ICER 값에 영향을 끼치고, 결과적으로 정책 결정에

영향을 줄 수 있다(Arnold et al., 2009; Richardson et al., 2015a; Richardson et al., 2015b;

Brazier et al., 2017; Briggs et al., 2019). 2009년에 발표된 ISPOR Task Force의 합의 연구

(consensus paper)에서는 공평한 자원배분을 위하여 통일된 도구 선정의 필요성을 제시하였

고(Drummond et al., 2009), 일관된 정책 결정을 위하여 NICE (2013)는 EQ-5D를 표준 도구로

명시하였다. 다만, ISPOR 합의 연구에서는 통일된 도구 선정의 필요성을 인지함에도 불구하

고, 표준 도구를 제시하는 것에는 잠재적 위험이 있을 수 있다고 언급하였다. MAUI마다 측

시 일부 수준 합쳐짐)

표본수 1,015 명 173 명

표본 특성제주를 제외한 전국의 19세 이상 성인

남녀서울 거주 20세 이상 성인 남녀

자료수집 컴퓨터 보조 개인 면접 방식 설문지 기반 직접 방문 면접조사

측정 건강상태 111개 26개

가치조사방법 VAS, SG TTO

기본모형 R2 0.563(MAE=0.043)

0.554(MAE=0.0631)

영역별 상대적 중요도 추세

통증 > 계단 오르기, 기억 > 그 외

범위 : 0.132(44444444) ~ 1(11111111)

L4 포함 영역의 회귀계수 크기: 친구들과 어울려 놀기, 공부,

운동/뛰기, 힘 순L4 미포함 영역의 회귀계수 크기:

기분, 아픔/불편감 순

(질 가중치 산출 예시나 알고리즘 제시 안 됨)

특징 요약전국구 조사로 대한민국을 대표하는 표본. 국민건강영양조사에서 활용할

목적으로 개발

일부지역 거주자 173명 대상. 국내 일반인 대상 가치평가가 이루어진 아동 대상 국내 유일한 선호기반의

일반적인 삶의 질 도구

MAE: mean absolute error, SG: standard gamble, TTO: time trade-off, VAS: visual analogue scale

Page 130: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 122 -

정하는 건강의 속성이 조금씩 다르기 때문에, 하나의 도구가 선정될 경우 이 도구가 초점을

두는 속성에 영향을 미치는 중재(intervention) 위주로 자원이 배분될 수 있다고 하였다.

현 지침(2011년 버전)이 개정될 당시에는 EQ-5D-3L이 가치평가가 수행된 유일한 도구였

다. 지침에서는 국내에서 타당도가 검증된 도구를 사용하고, MAUI 별로 복수의 tariff가 존재

하는 경우에는 가능한 한 최근에 개발된 대표성 있는 표본에서 도출된 tariff 값을 기본값으

로 사용하도록 하였다. 지난 5년간 제출된 제약사 자료 분석 결과 가장 최근에 개발된 Lee

et al. (2009)의 tariff가 가장 많이 사용된 것으로 나타나, 지침에 부합되는 결과를 보여주었

다. 2018년 경제성평가 TFT 보고서(건강보험 심사평가원, 2018)에서도 표본의 대표성을 근거

로 Lee et al. (2009)의 tariff가 더 선호된다고 하였고, EQ-5D-5L의 경우에도 같은 이유로

Kim et al. (2016a)의 tariff가 더 선호된다고 하였다.

그러나 대표성에 근거하여 선정된 두 tariff 간에도 건강영역별로 선호도 차이가 존재하는

것으로 나타났다. 예를 들어, Lee et al. (2009)의 tariff에서는 통증/불편감 영역이 상대적으로

덜 중요하게 평가되었으나, Kim et al. (2016a)의 tariff에서는 이 영역이 상대적으로 중요하게

평가되었다. 이러한 차이가 최소한 하나의 연구에서는 대표성이 결여됨을 의미하는 것인지,

아니면 두 가치평가 연구가 다른 시점에서 수행되었기 때문에 이 기간 선호에 변화가 발생

하였음을 의미하는 것인지는 알 수 없다. 그러나 이러한 선호에 차이가 발생하는 상황에서

대표성을 근거로 도구별 하나의 tariff를 선정하는 것은 논리의 모순을 초래할 수 있다.

그렇다고 MAUI 및 tariff를 전혀 선정하지 않으면, 평가의 일관성이 저해될 뿐만 아니라,

자료 제출자가 유리한 방향으로 이를 선정할 수 있는 위험이 있다. 참고로 현재 영국 NICE

에서는 EQ-5D-3L만 표준도구로 인정하고 있고, EQ-5D-5L의 경우 가치평가 연구에 대한 질

문제가 제기되어 현재 사용 보류 중이다. NICE는 제약사가 임상시험에서 EQ-5D-5L 사용을

자제할 필요는 없으나, 수용 가능한 영국 tariff가 개발될 때까지는 EQ-5D-5L 자료를

EQ-5D-3L 점수로 변환하여 사용하도록 하고 있다. 질 평가를 담당했던 Hernandez Alava et

al. (2018)은 EQ-5D-5L과 EQ-5D-3L로 측정된 결과는 두 도구 간 응답 수준 및 tariff 차이로

인해 매우 다른 경향을 보이므로(Wailoo et al., 2017a), 일관된 정책 결정이 요구될 때에는

두 도구를 상호 교환적으로(interchangeably) 사용할 수 없다고 하였다. 일각에서는

EQ-5D-3L tariff에 대한 질 문제도 제기하고 있는데, 가장 대표적인 이슈 중 하나가 선형 회

귀분석 사용의 적절성이다(Briggs et al., 2019). Briggs et al. (2019)은 기존 tariff에 대한 비판

을 고려하여 NICE 등의 해당 기관에서 더 적절한 tariff를 제공해야 하고, 어떤 tariff를 사용

해야 하는지에 대해 강력한 지침을 제공해야 한다고 주장하였다. 참고로 국내에서는 Lee et

al. (2009)의 tariff를 비롯한 국내 MAUI 가치평가 연구에 대해 질 평가를 공식적으로 수행한

적은 없다. 도구 및 tariff 선정이 자원 배분에 미치는 영향을 고려하면 가치평가 연구에 대

해 심도 있는 평가가 선행되고, 이 결과에 따라 심평원 또는 관련 기관에서 별도의 가치평가

Page 131: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 123 -

연구를 수행하여 더 적절한 tariff를 제공하는 방법도 고려해 볼 필요가 있다.

요약하자면, 모든 질병 영역에서 가장 적절한 하나의 완벽한 도구는 없으며(Brazier et al.,

2017), 어떤 tariff가 현 대중의 선호를 가장 잘 반영하는지도 불확실하다. 따라서 일관성에

좀 더 무게를 두고 하나의 도구와 tariff를 선정할지, 아니면 질병에 가장 적합한 도구를 사

용할 수 있도록 도구와 tariff 선정을 유연하게 해야 할지 이에 대한 논의와 합의가 필요하

다.

마) 이해관계자 의견

(1) 전문가 의견

- 효용 관련 불확실성을 줄이기 위해 방법을 명시화할 필요 있음. 심평원에서 선호하는 도

구, 추정방법 등을 명시.

- 특정 도구를 권고하는 것은 적절하지 않다는 의견도 있음.

- 의사결정에 미치는 중요성을 고려하여 국가 주도 사업으로 대표성이 있는 대규모 표본

을 이용한 표준 tariff 도출 연구를 수행할 필요가 있음.

(2) 제약사 의견

- 효용 측정도구에 대해서는 어떤 도구가 우월하다는 표준(gold standard)은 없음. 따라서

EQ-5D를 선호하는 것으로 제한을 두기보다는, 현 지침처럼 연구자가 선택한 도구를 정

당화하여 사용할 수 있도록 하는 것이 바람직하다고 사료됨. EQ-5D, SG, TTO를 선호하

되 그중 가장 정당한 사유가 있는 효용값을 선택하여, 경제성평가에 적용함이 바람직하

다고 봄.

- 효용값 추정 시 질병의 특성, 측정 도구, 연구의 형태, 국가나 사회적인 특성에 따라 결

과가 다르게 나타남에도 불구하고 우리나라에서는 이러한 특성을 간과하고 일률적으로

특정 효용 tariff만을 적용하고 있어 의약품의 실질적인 특성을 반영하지 못함. 질병의

특성을 고려하여 유연하게 효용 tariff를 선택하고 적용할 수 있도록 해야 함.

- 삶의 질 측정 도구(EQ-5D)를 국내 효용으로 환산 시 적용하는 tariff에 대한 불확실성이

큼. 경제성평가에서 효용 산출 시 적용할 수 있는 3가지 tariff에 따라 효용값 절대값 뿐

아니라 건강상태에 따른 효용값 변화의 차이가 큼. 비용효과적으로 평가된 약제가 비용

효과적으로 평가되지 않을 수도 있음. 실제 경제성평가 진행 시, 보수적인 tariff만을 적

용하여 의약품의 가치가 저평가되고 있음. 건강상태에 따른 효용이 충분히 반영된 tariff

의 개발이 필요함.

- 국내 tariff 중 어떠한 방법이 가장 적절한지에 대한 권고가 부재함.

Page 132: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 124 -

- 경제성평가 제도개선 TFT 보고서(건강보험심사평가원, 2018) : 제약사 측에서는 해당 분

야의 전문가가 수행한 tariff 연구에 대해 우선순위를 제시하기는 곤란하며, 하나의 tariff

를 정하기보다는 전반적인 참조를 허용하는 안을 제안함(제약사 의견).

바) 지침 개정방향 제언

정책 결정의 일관성을 위해서는 하나의 도구와 tariff를 선정하는 것이 필요하다. 이에 지

금까지 국내 및 국제적으로 제일 많이 사용되고 있는 EQ-5D-3L을 하나의 도구로 선정하고,

EQ-5D-3L 가치평가 연구 중에서 표본 크기가 가장 크고 가장 최근에 수행된 Lee et al.

(2009)의 연구에서 개발된 tariff를 표준 tariff로 선정하는 안을 1안으로 검토하였다.

그러나 국내에서는 아직 HRQoL 도구와 tariff에 대한 비교 연구나 질 평가가 제대로 수행

된 적이 없기 때문에 1안에 대한 실증 근거가 매우 부족한 실정이다. 평가의 일관성도 중요

하지만 충분한 근거에 기반하지 않은 의사결정은 자칫 잘못된 결정을 초래할 수 있으므로

기존 지침(2안)을 유지할 것을 제언한다.

- 제1안(영국안). 정책 결정의 일관성과 대표성을 근거로 하여 EQ-5D-3L과 Lee et

al.(2009)이 도출한 EQ-5D-3L tariff 사용을 선호한다고 명시하고, 그 외 tariff는 민감도

분석에서 사용하도록 한다. 평가의 일관성을 위해 EQ-5D-5L이 사용된 경우에도 산식

(mapping)을 이용하여 EQ-5D-3L 점수로 변환하도록 한다.

- 제2안(기존 지침 유지안). 도구의 타당성(validity), 민감성(responsiveness), 신뢰성

(reliability), 실행가능성(feasibility) 등에 근거하여 선호에 기반한 일반 도구를 선택하도

록 명시한다. 선택한 도구의 내국인 tariff가 다수 존재할 경우, 가장 대표성이 있고, 가능

하면 최근에 수행된 연구에서 도출된 tariff를 사용할 것을 권장한다.

다만, tariff 선정이 의사결정 및 자원배분에 미치는 영향을 고려하여 향후 심평원이 주축

이 되어 기존 tariff에 대한 질 평가를 수행하고, 필요시 대표성 있는 대규모 표본을 이용하

여 표준 tariff를 개발·제공할 것을 제언한다.

Page 133: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 125 -

4) Mapping 관련 세부지침

가) 현 지침

(1) 주요 지침

기본분석에서는 선호도에 근거한 일반도구의 사용이 권장되며, 질병별 도구, 선호도에

근거하지 않은 도구19)들을 사용하여 측정한 결과는 추가적으로 제출할 수 있다.

19) 선호도에 근거한 도구로 변환(transformation)시키고, 이때 변환을 위한 산식(mapping function)의 구축

방법론, 비뚤림 발생 가능성에 대해 자세히 기술한 후 해당 방법론을 정당화하고, 모형의 예측성 및 적합도

에 대해서 기술한다.

(2) 지침 추가설명

현 지침에서는 선호도에 근거하지 않은 도구로 건강상태를 측정하였을 경우, 산식

(mapping)을 이용하여 선호도에 근거한 값으로 변환시킨 후 이 결과를 “추가적으로” 제출

할 수 있다고 언급하고 있다. 지침 추가설명에는 산식(mapping)의 한계점 및 방법론적 문제

점 위주로 기술되어 있다.

나) 기존 제출자료 검토 결과

표 37에서 제시된 바와 같이, 지난 5년간(2014-2018) 산식(mapping)을 이용하여 효용을 도

출한 경우는 총 6건이었다. 6건 모두 기존 문헌에서 제시한 산식(mapping) 또는 모형 설정

(model specification)을 이용하였는데, 산식(mapping) 문헌고찰 과정을 보고한 경우는 3건뿐이

었다. 산식(mapping)의 구축 과정, 모델 적합도, 예측력 등에 대해 자세히 보고한 사례도 거

의 없었다.

임상시험에서 사용된 원래의 질병별 도구는 질환에 따라 다양하였으나, 목표 도구(target

개인의 선호도가 반영되지 않은 SF-36, Nottingham Health Profile(NHP), Sickness

Impact Profile(SIP) 등과 같은 도구 및 선호에 근거하지 않은 질병별도구들은 산식

(mapping)을 통하여 선호에 근거한 값으로 변환(transformation)하는 방법이 있다. 그러나

이러한 산식(mapping)은 대체로 예측성(predictability), 모델 적합도(model fit)에 있어 상

당한 변이가 있다는 근본적인 한계점을 가지고 있다고 보고되었으며(Brazier et al,

2007), Chancellor 등(1997)은 산식(mapping)을 변환시키는 것이 아예 불가능하다고 제시

하기도 하는 등 방법론적 문제점이 존재한다.

Page 134: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 126 -

measure)는 모두 EQ-5D-3L로 동일하였다. EORTC QLQ-C30을 원 도구로 사용한 경우에는

(총 2건) 국내에서 개발된 산식(mapping)을 이용하여 한국 일반대중의 선호가 반영된 EQ-5D

점수로 변환하였다. 이 외의 질병별 도구가 사용된 경우에는 대체로 영국에서 개발된 산식

(mapping) 또는 모형 설정(model specification)을 이용하여 EQ-5D 점수로 변환하였는데, 이는

산식(mapping)의 가용성이 반영된 결과로 볼 수 있다. 영국 NICE 지침에서는 산식(mapping)

을 이용할 때도 영국 일반대중의 선호가 반영된 EQ-5D-3L 점수로 변환할 것을 권장하고 있

다. 이에 따라 산식(mapping)의 상당수가 영국 일반대중의 선호를 반영한 EQ-5D-3L 점수를

목표 변수로 하여 개발되었다(Mukuria et al., 2019).

그러나 산식(mapping)을 이용한 경우라 할지라도 이를 모든 건강상태에 적용한 사례는 3건

뿐이었다. 나머지 사례(3건)에서는“유지상태”나 “기본 건강상태”에만 산식(mapping)을 통

해 도출된 질 가중치를 적용하고 “중증 건강상태”에는 표본 수 등의 이유로 기존 문헌에

서 제시한 값을 사용하였다.

또한, 임상시험에서는 원 질병별 도구로 측정된 삶의 질 개선이 중재군 간 유사한 것으로

보고되었으나, EQ-5D 점수로 변환 시 치료군 간 차이가 발생하여 치료군 유형별로 다른 질

가중치를 건강상태에 부여한 사례도 1건 있었다.

향후 의사결정 과정에서 산식(mapping) 이용과 관련된 불확실성을 줄이기 위해서는 최소한

(1) 산식(mapping) 이용 시 이에 대한 정보를 자세히 제공해서, 평가자가 산식(mapping)과 관

련된 질 평가를 충분히 할 수 있도록 해야 하며, (2) 주 임상시험에 질병별 도구 또는 선호

에 근거하지 않은 도구가 포함되었다면 이에 대한 자료도 함께 제출하여 변환된 값을 정당

화하도록 해야 한다.

<표 37> 산식(mapping)을 이용하여 질 가중치를 도출한 사례 분석

사례대상 질환

원 도구목표 도구

선호도 산식 출처산식

문헌고찰보고 문항

1

전이성 거세 저항성 전립선암

FACT-PEQ-5D-3L

영국 일반대중

Spencer et al. (2011) (구두 발표 자료)

(동일암 대상)

최종모델 : OLS,모델 적합도 및 예측력 관련 언급 없음

2

재발성 만성 중증 습진

PGA(임상자료)를 DLQI로 환산

EQ-5D-3L

영국 일반대중

기존문헌PGA(임상자료) → DLQI로 환산 →

EQ-5D로 환산

언급 없음 언급 없음

3중증 천식

AQLQEQ-5D-3L

불명확

Sheffield HE 회귀모형

(Tsuchiya et al., 2002

[대상자 언급

최종모델 : OLS, 모델 적합도 및 예측력 관련 정확한 수치 언급 없음

Page 135: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 127 -

다) 외국 지침

캐나다(CADTH, 2017), 호주(PBAC, 2016), 영국(NICE, 2013) 지침에서는 산식(mapping)을 제

한적으로 허용하고 있는 것으로 나타났다. 호주나 영국의 경우에는 MAUI(영국은 EQ-5D-3L)

자료가 없을 때 산식(mapping)을 사용할 수 있다고 하였고, 캐나다 지침에서는 산식(mapping)

이용을 권장하지 않으나, 다른 대안이 없을 때 제한적으로 이용할 수 있다고 하였다(표 38).

각 지침에서는 산식(mapping) 이용 시 이에 대한 정당화를 하고, 산식(mapping)에 대한 자세

한 정보를 제공하며, 관련 불확실성을 충분히 검토할 것을 명시하고 있다.

(1) 캐나다(CADTH, 2017)

캐나다 지침에서는 설명력(explanatory power)을 주 이유로 산식(mapping) 이용을 권장하지

않는다고 명시하고 있다. 원 도구(source measure) 및 목표 도구(target measure)가 모두 선

호에 근거한 일반 도구일 경우에는 둘 간 측정하는 건강 영역이 유사하므로 두 도구 간 상

관성(correlation)이 높을 수 있으나, 측정하는 건강 영역이 상대적으로 다른 질병별 도구와

일반 도구를 이용할 때에는 둘 간 상관성이 낮아 산식(mapping)의 설명력이 상대적으로 낮을

수 있다고 언급하였다. 따라서 원 도구와 목표 도구의 유형, 산식(mapping) 알고리즘의 유형,

포함된 건강상태의 중증도 등에 따라 예측값이 크게 달라질 수 있으므로 산식(mapping) 이용

없음])을 이용하여 직접 회귀분석 실시

* 천식 악화 건강상태 경우 기존문헌값 이용

4다발골수

종EORTC QLQ-C30

EQ-5D-3L

한국 일반대중(Tariff : Lee et al,

2009)

Kim et al.(2012a)(다양한 암

대상)

최종모델 : OLS,수정된 R2 = 0.51* Post progression 건강상태 경우 기존문헌값 이용

5중증

호산구성 천식

SGRQEQ-5D-3L

영국 일반대중

Starkie et al.(2011)

(COPD 대상)언급 없음

최종모델 : OLSRMSE = 0.1723* 천식 악화 건강상태 경우 기존문헌값 이용

6전이성 췌장암

EORTC QLQ-C30

EQ-5D-3L

한국 일반대중(Tariff :

Lee et al., 2009)

Kim et al.(2012b)(전이성 유방암)

언급 없음

최종모델 : OLS모델 적합도 및 예측력 관련 언급 없음

※ 2014-2018년 국내 제출된 제약사 자료 분석(최초 제출된 자료의 주요 기본분석 기준) AQLQ: asthma quality of life questionnaire, COPD: chronic cbstruction pulmonary disease, DLQI: dermatology life quality index, EORTC QLQ-C30: European Organization for Research and Treatment core quality of life questionnaire, FACT-P: functional assessment of cancer therapy-prostate, OLS: ordinary least squares, PGA: physicians global assessment, RMSE: root mean square Error, SGRQ: St. George's respiratory questionnaire

Page 136: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 128 -

을 권장하지 않는다고 하였다. 다만, 산식(mapping)을 통해서만 질 가중치 추정이 가능한 경

우에는 제한적으로 산식(mapping)을 이용할 수 있는데, 이 경우 검증된 산식(mapping) 알고

리즘을 이용하고, 이에 대한 실증 자료(empirical data)를 제시하도록 하고 있다. 또한, 산식

(mapping)과 관련된 불확실성을 평가에 충분히 반영할 것을 명시하고 있다.

(2) 호주(PBAC, 2016)

호주 지침에서는 임상시험에 포함된 환자보고성과지표(patient reported outcome, PRO) 도

구가 MAUI가 아닐 경우 이에 대한 정당화와 함께 포함된 PRO 도구에 대한 자세한 정보를

제공하고, 산식(mapping)을 통해 이를 선호에 근거한 값으로 변환할 것을 명시하고 있다. 산

식(mapping)을 이용하는 경우에는 산식(mapping) 알고리즘 도출에 사용한 추정 표본(인구학

적·임상적 특정, 표본 크기 등)에 대해 자세히 설명하고, 별도의 검증(validation) 표본이 있

는지 기술하도록 하고 있다. 또한, 원 도구(source measure)와 목표 도구(target measure)의

지표(index) 및 영역(dimensional), 산식(mapping) 알고리즘을 추정하기 위해 사용한 통계 모형

및 방법에 대해서도 자세히 기술하도록 하고 있다. 알고리즘의 수행능력(performance)과 타

당도(validity)를 측정하기 위해 사용된 방법과 산식(mapping)이 제출된 자료에 적합한지, 특히

추정 표본과 연관하여 논의하도록 하고 있다. 또한, 산식(mapping)의 불확실성과 함께 예측된

질 가중치를 보여줄 것을 명시하고 있다.

(3) 영국(NICE, 2013)

영국 NICE 지침에서는 EQ-5D-3L 자료가 없을 경우 산식(mapping)을 통해 다른 HRQoL 도

구로 측정된 자료를 EQ-5D-3L 점수로 변환할 수 있다고 명시하고 있다. 지침에서는

EQ-5D-5L도 기본분석에 사용될 수 있다고 명시하고 있으나, 현재 수용 가능한 EQ-5D-5L

영국 tariff가 없는 상태이기 때문에 EQ-5D-5L 자료도 van Hout et al. (2012)에 의해 개발된

산식(mapping)(“cross-walk”)을 이용하여 EQ-5D-3L 점수로 변환하도록 하고 있다. 산식

(mapping)을 선택할 때에는 EQ-5D-3L과 다른 HRQoL 도구 모두 포함한 자료에서 산식

(mapping)이 도출된 것인지, 통계적 속성이 충분히 기술되고 정당화되었는지, 산식(mapping)

이 자료에 적합한지 등을 고려하도록 하고 있다. 또한, 산식(mapping) 알고리즘을 통해 도출

된 결과값을 민감도 분석에서 제시할 것을 명시하고 있다.

(4) 기타

EUnetHTA (2015a)에 따르면 상당수 유럽 국가 지침에서는 산식(mapping)에 대한 입장을

제시하고 있지 않지만, 다른 대안이 없을 경우 산식(mapping)을 인정하는 국가도 여럿 있는

것으로 파악된다(예를 들어, 영국, 체코, 아일랜드, 이탈리아, 노르웨이 등)(EUnetHTA, 2019).

Page 137: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 129 -

그러나 EUnetHTA (2015b)에서 발간한 효용과 관련된 상대적 효과 평가(relative effectiveness

assessment) 지침에서는 산식(mapping)은 직접 자료수집 방식보다 원칙적으로 열등(inferior)

하기 때문에 일반적으로 권장하지 않는다고 하였다. 또한, 산식(mapping)의 필요성을 줄이기

위해서는 해당 HTA 기관에서 자료 제출자가 임상시험 프로토콜에 선호에 근거한 도구를 항

상 포함하도록 장려해야 한다고 언급하였다.

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

Statistical mapping functions have been used to convert from one measure to another (e.g., HUI to EQ-5D) in an effort to maintain consistency, but mapping as a means of deriving health utilities is not recommended. (p47)

When there is no alternative but mapping to obtain utility estimates, empirical data are required. The mapping should be undertaken using a validated algorithm. The full uncertainty in the mapped estimates, reflecting parameter uncertainty in the source algorithm, parameter uncertainty in the mapping algorithm, and uncertainty regarding which HRQoL states are represented in the clinical health states included in the model, should be incorporated into the evaluation. (p47)

산식(mapping) 이용 권장하지 않음.

다른 대안이 없을 경우 검증된

알고리즘을 사용하여 제출. 산식과 관련된 불확실성 충분히

검토.

호주PBAC 지침

version 5(2016)

Mapping of generic and disease-specific scalesNonpreference-based patient-reported outcome measures will require a mapping algorithm to be transformed into preference-based measures to estimate utilities. Where this occurs, detail the source of the mapping algorithm. Describe the estimation sample (population demographic and clinical characteristics, sample size etc) and whether there is an external validation sample. Provide details of the source and target measures (eg index, dimensional), and the statistical model and methods used to estimate the mapping algorithm. Detail the statistical association or operations that constitute the algorithm. Discuss methods used to measure the algorithm performance and validity. Present the resulting predicted utilities with associated uncertainty. Discuss the applicability to the submission data, particularly in relation to the sample in which the algorithm was developed. (p78)

산식을 이용하여 선호에 근거한 효용값 추정 가능. 산식 이용 시 산식 알고리즘,

표본, 검증(validation) 표본 여부, 원 도구와 목표 도구, 통계 모형, 예측력 등에 대해 자세히 기술하고 불확실성 검토.

영국 NICE 지침 (2013)

When EQ-5D data are not available, these data can be estimated by mapping other health-related quality of life measures or health-related benefits observed in the relevant clinical trial(s) to EQ-5D. The mapping function chosen should be based on data sets containing both health-related quality of life measures and its statistical properties should be fully described, its choice justified, and it should be adequately demonstrated how well the function fits the data. Sensitivity analyses to explore variation in

EQ-5D 자료가 없을 경우 산식을 이용하여 EQ-5D 점수로 변환

가능.

선택한 산식의 통계적 특성에 대해 자세히 기술, 정당화, 모델

<표 38> 산식(mapping) 관련 해외 주요국 지침 내용

Page 138: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 130 -

라) 기타 문헌고찰 결과

(1) 산식(mapping) 연구 현황

선호에 근거한 일반 도구 대신 질병별 도구나 선호에 근거하지 않은 일반 도구가 사용되

었을 때에는 일반대중의 선호를 반영한 질 가중치 도출이 원칙적으로 불가능하다. 이때 대안

으로 사용할 수 있는 하나의 방법이 산식(mapping)인데, 산식(mapping)을 통해 이 도구들로

측정된 자료를 선호에 근거한 값으로 변환할 수 있다. 검증된 산식(mapping)이 존재할 경우

이를 이용하여 질 가중치를 상대적으로 쉽고 빠르게 추정할 수 있기 때문에 지난 10여 년간

산식(mapping) 연구가 상당히 증가하였다(Mukuria et al., 2019). 특히 영국 NICE 지침에서는

EQ-5D-3L 대신 다른 HRQoL 도구가 사용되었을 경우에 산식(mapping)을 이용하여 이를

EQ-5D-3L 점수로 변환할 것을 명시하고 있어 EQ-5D 도구를 목표 도구(target measure)로

하는 산식(mapping) 개발 연구가 영국을 중심으로 활발히 이뤄지고 있다. 참고로 Oxford

HERC(Health Economics Research Centre)에서는 2013년 산식(mapping) 관련 데이터베이스를

구축하여 현재 182개의 산식(mapping) 연구와 여기에 포함된 산식(mapping) 알고리즘에 대한

정보를 제공하고 있다.

선행 연구를 살펴보면 기존 Brazier et al. (2010)이 수행한 체계적 문헌고찰에서는 1996

년~2007년 초반 발표된 총 30개의 산식(mapping) 연구를 확인하고, 이를 고찰에 포함하였다.

가장 일반적인 통계분석 방법은 최소제곱법(ordinary least squares, OLS)을 이용한 회귀분석

이었고, 다른 분석기법은 거의 사용되지 않았다. 모델 적합도와 예측력에 대한 정보를 제공

하기 위해 대부분 R2, RMSE(root mean square error; 평균제곱근오차) 또는 MAE(mean

absolute error; 평균절대오차) 등을 보고하였는데, 포함된 연구의 설명력은 0.17~0.71, RMSE

는 0.084~0.2, MAE는 0.0011~0.19 수준이었다. Brazier et al. (2010)은 질환의 중증도가 높을

때는 질 가중치가 과대 추정되고, 낮을 때는 과소 추정되는 경향이 있다고 보고하였는데, 특

히 중증 환자의 질 가중치 추정 시 과대추정(즉, 건강상태의 효용 높게 추정)에 대한 주의가

필요하다고 언급하였다.

최근에 수행된 체계적 문헌고찰(Mukuria et al., 2019)에서는 2007년~2018년에 발표된 일반

도구를 목표 도구로 하는 산식(mapping) 연구를 검토하였다. 이 기간에 발표된 산식(mapping)

관련 논문이 총 180개, 산식(mapping) 알고리즘이 총 233개로 기존 Brazier et al. (2010)의 문

헌고찰에서 보고한 결과와 비교 시, 지난 10여 년간 산식(mapping) 연구가 크게 증가하였음

을 알 수 있다. 산식(mapping) 알고리즘에서 가장 많이 사용된 목표 도구는 EQ-5D로 총 147

개의 알고리즘에서 사용되었다. 기존의 Brazier et al. (2010)의 보고와는 달리 다양한 회귀분

the use of the mapping algorithms on the outputs should be presented. (p41-42)

적합도 증명. 산식에 대한 민감도 분석.

Page 139: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 131 -

석방법이 산식(mapping) 추정에 사용되었다. 효용 자료의 치우침, 천장 효과, 범위의 제한 등

을 고려하여 Tobit 모형, CLAD (censored least absolute deviation; 중도절단 최소절대편차)

모형, Two-part 모형 등 다양한 대안들이 OLS와 함께 사용된 사례가 많았다. 그러나 예측력

면에서 OLS가 다른 대안들과 비슷하거나 더 나은 평가를 받아 기본분석에서는 여전히 제일

많이 사용되고 있는 것으로 보고되었다. 또한, 예측력 관련해서는 여전히 RMSE와 MAE를 제

일 많이 보고하는 것으로 나타났으나, 예전과는 달리 증상의 중증도에 따라 예측력을 별도로

보고하는 연구가 점차 늘어나고 있다고 보고하였다. Mukuria et al. (2019)은 산식(mapping)

연구의 질 향상을 위해 산식(mapping) 개발 연구자들은 ISPOR Task Force (Wailoo et al.,

2017b), Ara et al. (2017), Longworth & Rowen (2013) 등이 개발한 지침들을 참고하여 산식

(mapping)을 개발하고, Petrou et al. (2015)이 개발한 MAPS (MApping onto Preference-based

measures reporting Standards) 보고 지침 등에 따라 보고할 것을 권장하였다. 또한, 산식

(mapping) 연구가 활발히 진행되는 것과는 별도로 임상시험이나 관찰 연구에서 일반 도구 사

용을 회피하려는 목적으로 산식(mapping)을 사용해서는 안 된다고 강조하였다.

(2) 국내 산식(mapping) 연구

표 39에 제시된 바와 같이 현재까지 발표된 국내 산식(mapping) 연구는 총 7개로 추정된

다. 이 연구들에서는 암, 전이성 유방암, 관절염, COPD(chronic obstruction pulmonary

disease; 만성폐쇄성폐질환) 환자들뿐만 아니라 일반대중을 대상으로 측정한 자료를 이용하여

산식(mapping)을 개발하였다. 원 도구에는 EORTC-QLQ-30 등의 질병별 도구 및 SF-36 등의

일반 도구도 포함되었으나, 목표 도구는 모두 EQ-5D로 동일하였다. 기본 분석에서는 OLS 계

통의 분석 모형이 사용되었으며, 대부분의 연구에서 R2, RMSE, MAE 등을 이용하여 모델 적

합도 및 예측력을 보고하였다.

좀 더 자세히 연구를 살펴보면 우선 Kim et al. (2012a)은 893명의 암환자(유방암 32.9%, 대

장암 20.0% 포함)를 대상으로 측정된 EORTC QLQ-C30 자료를 이용하여 EQ-5D-3L 점수를

예측하였다. EORTC QLQ-C30 항목 및 영역 유형을 달리하여 모델을 구성하였고, 분석방법

으로는 OLS를 이용하였다. 최종모델의 수정된 R2는 0.516, RMSE는 0.095, MAE는 0.069로 양

호한 수준을 보여주었으나, 상대적으로 심각한 환자군에서는 효용이 과대추정되는 경향이 있

음을 보고하였다. 중증도별로 구분하여 분석 시 중증도가 상대적으로 낮은 환자군에서는

MAE가 0.056, 높은 군에서는 0.078로 후자에서 예측력이 다소 저하되는 것으로 나타났다. 모

델 검증은 별도의 대장암 환자 123명을 대상으로 이뤄졌는데, 모델적합도 및 예측력 면에서

기본 분석과 유사한 결과를 보여주었다.

Kim et al. (2012b)은 199명의 전이성 유방암 환자를 대상으로 측정된 EORTC QLQ-30과

EORTC QLQ-BR23 자료를 이용하여 EQ-5D-3L 점수를 예측하는 산식(mapping)을 개발하였

Page 140: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 132 -

다. 199명의 환자 중 149명의 자료는 산식(mapping) 추정에 이용하였고, 나머지 50명의 자료

는 산식(mapping) 검증에 이용하였다. EORTC QLQ-30 점수, EORTC QLQ-BR23 점수, 인구학

적 특징 포함 여부에 따라 총 6개의 OLS 모델을 구성하였다. 이 중 EORTC QLQ-30 자료만

사용한 모델에서 설명력 및 예측력이 제일 높게 나왔는데, 수정된 R2는 0.487, MAE는 0.092

였다. 이 결과는 Mukuria et al. (2019)이 수행한 문헌고찰(Mukuria et al., 2019)에서 보고한

것과 유사한 수준이었으나, 방향성 면에서 예측과 상반되는 회귀계수가 일부 보고되었다.

Kim et al. (2012b)은 EORTC C-30 문항 간 알려지지 않은 상호작용을 가능한 이유로 제시하

였고, 유사한 기존 사례도 언급하였으나, 명확한 이유에 대해서는 좀 더 연구가 필요할 것으

로 보인다.

최근에 발표된 Lim et al. (2019)의 연구에서는 299명의 COPD 환자를 대상으로 OLS 뿐만

아니라 GLM (Generalized Linear Model; 일반화 선형 모형), Tobit 모형, Beta 회귀분석 등을

이용하여 COPD assessment test 자료를 EQ-5D로 변환하는 산식(mapping)을 개발하였다. 환

자 자료를 50%씩 나누어 추정 표본과 검증 표본으로 각각 이용하였다. OLS 사용 시 RMSE가

가장 작게 나왔는데, 이때 RMSE가 약 0.11, MAE가 약 0.08이었고, 수정된 R2는 별도로 제시

되지 않았다. 연구에서는 표본 크기가 상대적으로 작고, 중증 환자가 많이 포함되지 않은 점

을 제한점으로 제시하였다.

또 다른 연구(Kim et al., 2016b)에서는 관절염 환자 3,557명을 대상으로 측정된 HAQ-DI

(health assessment questionnaire disability index), 통증-VAS, DAS28 (disease activity

score-28) 자료를 이용하여 EQ-5D 점수로 변환하기 위한 산식(mapping) 연구를 수행하였다.

표본의 80%는 추정을 위해 사용하였고, 나머지 20%는 검증을 위해 사용하였다. HAS-DI, 통

증-VAS, DAS28 포함 여부와 통계 방법(OLS, Tobit 모형, two-part 모형)에 따라 여러 모델을

구성하였는데, OLS 이용 시 수정된 R2가 0.576으로 가장 높게 나타났고, RMSE는 0.1654,

MAE는 0.1222로 보고되었다. 참고로 RMSE와 MAE는 검증에서 조금 더 높게 나타났다.

나머지 세 연구(Kim et al., 2014; Park et al., 2017; 이정은 & 안정훈, 2019)에서는 일반대

중 일부 또는 전부를 대상으로 하여 산식(mapping) 연구를 수행하였다. 먼저, Kim et al.

(2014)은 일반대중, 당뇨병 환자, 뇌졸중 환자 2,211명을 연구에 포함하였는데, 이 중 1,660명

의 자료는 추정을 위해 사용하였고, 551명의 자료는 검증을 위해 사용하였다. 이 외에도 대

장암 환자 123명의 자료를 별도로 수집하여 이를 산식(mapping) 검증에 이용하였다. 이 연구

에서는 일반 도구 SF-36 자료를 EQ-5D 점수로 변환하기 위해 OLS, two-part 모형, 다항 로

지스틱 회귀 모형을 이용하여 분석하였다. 원 도구와 목표 도구를 모두 일반 도구로 사용하

여 분석한 결과 수정된 R2는 0.6366 ~ 0.7476으로 상대적으로 높은 설명력을 보여주었고, 이

때 RMSE는 0.133 ~ 0.160, MAE는 0.087 ~ 0.109 수준으로 나타났다. Kim et al. (2014)은 일반

대중에서 뇌졸중 환자까지 다양한 HRQoL 수준을 포함한 자료를 이용하여 산식(mapping)을

Page 141: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 133 -

도출하였고, 별도의 환자 자료를 이용하여 추가로 이를 검증하였기 때문에, 다양한 환자군에

서 이 산식(mapping)을 이용하는 게 가능할 수도 있다고 언급하였다. 다만, 외부 검증 자료에

포함된 환자의 중증도가 상대적으로 낮았기 때문에, 중증 환자를 대상으로 산식(mapping)을

좀 더 재검증할 필요가 있다고 언급하였다.

이정은 & 안정훈 (2019) 연구에서도 일반대중 220명을 대상으로 수집된 HINT-8(HRQoL

Instrument with 8 items)(일반 도구) 자료를 이용하여 EQ-5D-3L 점수와 EQ-5D-5L 점수를

예측하는 분석을 수행하였다. OLS를 이용하여 분석한 결과, 수정된 R2가 EQ-5D-3L에서는

0.53, EQ-5D-5L에서는 0.66으로 후자에서 좀 더 높은 설명력을 보여주었다. 그러나 RMSE,

MAE 등 오차와 관련된 정보나 검증 여부에 대한 언급이 별도로 제시되지 않아 산식

(mapping)의 질을 평가하기가 어렵고, 모든 영역에서 ‘문제 없음’으로 응답한 사례가

EQ-5D-3L의 경우 51.4%, EQ-5D-5L의 경우 47.3%로 보고되어 중증도 별로 산식(mapping)을

추가 검증할 필요가 있을 것으로 보인다.

마지막으로 Park et al. (2017)은 소양증-VAS 자료를 EQ-5D-3L 점수로 변환하는 산식

(mapping)을 개발하기 위해 268명의 일반대중을 대상으로 단면연구를 수행하였다. 가상의 건

강상태 세 개를 각 참가자에게 제시하고, 이를 소양증-VAS와 EQ-5D-3L를 이용하여 평가하

도록 하였다. 수집된 자료의 50%를 추정에 사용하였고, 나머지를 검증에 사용하였다. 응답자

의 반복측정(repeated measure)을 고려하여 다수준(multilevel) 분석을 수행하였는데, 분석 결

과 Log likelihood가 345.32, RMSE가 0.157, MAD가 0.145로 오차 수준이 다른 연구와 비교시

다소 높게 보고되었다.

연구 원 도구 목표 도구 대상 인구종속변수

통계방법모델 적합도 및 예측력

Kim et al.(2012a)

EORTC QLQ-C30

EQ-5D-3L(Lee et al.,

2009)

다양한 암n=893

(별도 검증 표본[대장암]

n=123)

EQ-5D 점수

OLSadj.R2 : 0.516RMSE : 0.095MAE : 0.069

Kim et al.(2012b)

EORTC QLQ-C30EORTC

QLQ-BR23

EQ-5D-3L(Lee et al.,

2009)

전이성 유방암n=199

(추정 표본 n=149; 검증 표본 n=50)

EQ-5D 점수

OLS

QLQ-C30adj.R2 : 0.487MAE : 0.092

QLQ-BR23adj.R2 : 0.246

MAE : -

Kim et al. (2014)

SF-36EQ-5D-3L(Lee et al.,

2009)

일반 한국인, 당뇨병

외래환자, 뇌졸중 환자

EQ-5D 점수

(EQ-5D 항목 수준)

OLS(Two-part model)

(Multinomial

adj.R2 : 0.6366 – 0.7476RMSE :

<표 39> 국내 산식(mapping) 연구

Page 142: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 134 -

(3) 산식(mapping) 절차 및 보고 관련 권장 사항

ISPOR Task Force에서 개발한 지침(Wailoo et al., 2017b)을 비롯하여 산식(mapping) 절차

및 보고 관련한 지침이 최근 여러 개 출판되었다(Longworth & Rowen, 2013; Wailoo et al.,

2017b; Ara et al., 2017; Petrou et al., 2015). 이러한 지침 개발의 영향으로 산식(mapping) 연

구는 양적으로나 질적으로 개선되고 있는 것으로 보고되었다(Mukuria et al., 2019). ISPOR

Task Force 지침(Wailoo et al., 2017b)과 이를 수정·변경한 Ara et al. (2017)의 지침에서는

산식(mapping) 연구 시작 전부터 보고까지의 전 과정을 포괄적으로 다루고 있다. 이에 반해

Longworth & Rowen (2013)이 개발한 지침에서는 산식(mapping) 개발 자체에 좀 더 초점을

두고 권장 사항(recommendations)을 제시하고 있다. 이 지침에서는 EQ-5D를 목표 도구로 설

정하여 설명하였으나, 이는 다른 일반 도구에도 동일하게 적용될 수 있다.

Longworth & Rowen (2013)에 따르면 산식(mapping)을 도출하는 과정은 크게 ① 산식

n=2211(추정 표본 n=1660; 검증 표본 n=551)(별도 검증 표본 대장암 환자 n=123)

logistic model)0.133-0.160

MAE : 0.087-0.109

Kim et al. (2016b)

HAQ-DIVASDAS28

EQ-5D-3L(Tariff

명시 안함)

관절염(n=3557)

(추정 표본 80%; 검증 표본 20%)

EQ-5D 점수

OLS(Tobit model)(Two-part model)

adj.R2 : 0.576RMSE : 0.1654

MAE : 0.1222

Park et al. (2017)

소양증-VAS

EQ-5D-3L(Lee et al.,

2009)

일반 한국인n=268

(추정 표본 n=137; 검증 표본 n=131)

EQ-5D 점수

Multilevel 분석(동일 환자 여러

관찰값 제공)

Log likelihood : 345.32

RMSE : 0.157MAD : 0.145

Lim et al.(2019)

COPD assessment test (CAT)

EQ-5D-3L(Lee et al.,

2009)

COPDn=299

(추정 표본 50%; 검증 표본 50%)

EQ-5D 점수

OLS(GLM)

(Tobit 모형)(Beta 회귀)(Two-part

모형)

adj.R2 : NARMSE : 약 0.11MAE : 약 0.08

이정은 & 안정훈(2019)

HINT-8

EQ-5D-3L(Lee et al.,

2009)EQ-5D-5L(Kim et

al., 2016a)

일반 한국인(n=220)

(검증에 대한 언급 없음)

EQ-5D-3L index

EQ-5D-5L index

OLS

EQ-5D-3Ladj.R2 : 0.53

EQ-5D-5Ladj.R2 : 0.66

COPD: chronic obstruction pulmonary disease, DAS28: disease activity score-28, HAQ-DI: health assessment questionnaire disability index, GLM: generalized linear model, HINT-8: HRQOL instrument with 8 items, MAE: mean absolute error, OLS: ordinary least squares, RMSE: root mean square error, VAS: visual analogue scale

Page 143: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 135 -

(mapping)을 도출할 자료의 구성 요소 정의, ② 모형 설정(model specification), ③ 통계적 추

정방법 선정, ④ 모델 적합도(model fit)와 예측력(predictability) 확인, ⑤ 도출한 산식

(mapping)을 원하는 대상 자료에 적용하는 단계로 구분할 수 있다. 이를 좀 더 세분화하여

추정 표본(estimation sample), 종속 변수(dependent variable), 독립 변수(independent

variable), 모형 선택 및 설정(model selection and specification), 모델 유형(model type), 성능

(performance), 검증(validation), 불확실성(uncertainty) 면에서 고려사항을 제시하였는데, 이에

대한 자세한 설명은 표 40을 참고할 수 있다.

참고로 이 지침들에서는 산식(mapping)의 한계점과 주의사항 등도 함께 제시하였는데, 특

히 Ara et al. (2017)은 ① 원 도구와 목표 도구 간 중복되는 개념이 거의 없는 경우, ② 대상

집단에 원 도구나 목표 도구 사용이 부적절한 경우, ③ 부적합한 모델과 모형 설정(model

specification)으로 산식(mapping)이 추정된 경우, ④ 산식(mapping)이 도출된 표본이 이것이

적용되는 자료를 제대로 대표하지 못할 경우에는 해당 산식(mapping)을 이용하는 것이 부적

절(inappropriate)하며 부정확한 결과를 제공할 것이라고 하였다.

<표 40> 산식(mapping) 절차와 권장 사항

항목 산식(mapping) 절차 및 권장 사항

추정 표본(Estimation sample)

Ÿ 추정 표본과 산식(mapping) 알고리즘이 적용될 목표(target) 표본 간 임상적·인구학적 특징이 유사해야 함.

Ÿ 추정 표본과 목표 표본에서 산식(mapping)에 포함된 공변량(covariates)의 분포가 겹쳐야 함.

Ÿ EQ-5D 점수에 영향을 미칠 것으로 생각되는 목표 표본 내에 포함된 변수는 추정 표본에도 포함되어야 함.

Ÿ EQ-5D 자료와 설명 변수(explanatory variable)를 함께 포함하는 자료가 없다면 EQ-5D 자료를 수집해서 산식(mapping)을 추정해야 함.

종속 변수(Dependent variable)

Ÿ EQ-5D 점수(index)Ÿ EQ-5D 영역별 수준(dimension levels)

독립 변수(Independent variable)

Ÿ 질병별 도구 : 총 점수, 요약 점수, 항목 수준 점수, 항목 수준 더미변수, 상호작용항(interaction terms), 제곱항(squared terms), 세제곱항(cubic terms).

Ÿ 일반 도구 : 총 점수, 요약 점수, 항목 수준 점수, 항목 수준 더미변수, 상호작용항, 제곱항, 세제곱항.

Ÿ 임상 도구(clinical measures) : 총점, 요약 점수, 범주형 더미변수, 사회인구학적 변수.

Ÿ 기타 적절한 건강 관련 자료 .

모형 선택 및 설정(Model selection and

specification)

Ÿ 임상적 관계(clinical relationships)에 대한 사전 지식(prior knowledge) 이용.

Ÿ 산식(mapping) 추정 전 표준 통계기법을 이용하여 자료 검토(예 – 빈도, 상관분석).

Ÿ 회귀 모형 추정 위해 사용된 자료에 대해 충분히 기술(예 - EQ-5D 범위와 EQ-5D 분포를 보여주는 그래프 등 포함).

Page 144: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 136 -

마) 이해관계자 의견

(1) 전문가 의견

- 현재는 산식(mapping) 수용이 때때마다 다른 경향이 있음. 산식(mapping)이 언제 이용

가능한지 명확히 할 필요 있음.

(2) 제약사 의견

- 현재 국내 EQ-5D를 기본 분석으로 자료 요청하고 있으나, 임상시험에서 측정된 자료를

EQ-5D 점수로 변화한 산식(mapping)도 기본분석으로 수용해야 함.

Ÿ 비용-효과 모델에 사용된 EQ-5D 예측값의 범위에 대해 충분히 기술.

모델 유형(Model type)

Ÿ Linear ordinary least squaresŸ Tobit 모형Ÿ Censored least absolute deviationŸ Two-part modelŸ Generalized linear model Ÿ Latent class mixture modelŸ Censored mixture model Ÿ Multinomial logit model

모델 적합도 및 예측력(Performance)

Ÿ 모델 적합도(goodness of fit)- 통계적 유의성, 회귀계수의 방향(sign)과 크기(size), R2, 수정된 R2,

AIC, BIC.- 모델 적합도 검정을 위해 추가로 Ramsey RESET 검정, Park 검정,

Jarque-Bera 검정 등을 수행.- 모델 가정(model assumptions)이 타당한지 그래프를 이용하여 검토.

Ÿ 예측력(predictive ability) - Root mean squared error(RMSE) and mean squared error(MSE) - EQ-5D 또는 예측값의 중증도 범위(severity range)에 따라 RMSE,

MSE, mean error, mean absolute error(MAE)- 관측된 EQ-5D 점수와 예측된 EQ-5D 점수를 이용한 그래프

검증(Validation)

Ÿ 검증 표본(validation sample)에 적용 시 개발된 산식(mapping) 알고리즘의 적용(application) 및 평가(assessment)

Ÿ 검증 표본은 추정 표본과 상관없는 별도의 환자 자료일 수도 있고, 산식(mapping) 추정에 사용할 자료를 무작위로 추정 표본과 검증 표본으로 분리할 수도 있음.

불확실성(Uncertainty)

Ÿ 질 가중치의 불확실성은 경제성평가에 반영되어야 함. 여러 개의 가능한 산식(mapping) 알고리즘을 이용하여 질 가중치에 대한 민감도 분석을 수행할 수 있음.

출처: Longworth & Rowen (2013) ※ EQ-5D를 목표 도구로 하여 설명하였으나, 이 권장 사항은 다른 목표 도구에도 동일하게 적용될 수 있음

참고 : Ramsey RESET 검정, model misspecification(잘못된 모형 설정) 검정; Park 검정, 이분산성(heteroscedasticity) 검정; Jarque-Bera 검정, 정규성(normality) 검정

AIC: Akaike’s information criterion, BIC: Bayesian information criterion

Page 145: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 137 -

바) 지침 개정방향 제언

산식(mapping) 절차 및 보고 관련한 지침이 최근 여러 개 개발되었고, 이러한 지침 개발의

영향으로 산식(mapping) 연구가 양적으로나 질적으로 개선되고 있는 것으로 나타났다. 이를

반영하여 지침 개정판에서는 일반 도구로 측정된 자료가 없을 경우 산식(mapping)도 수용 가

능하다고 명확히 언급할 것을 제언한다. 다만, 이 경우 평가자가 산식(mapping)의 질 평가를

충분히 할 수 있도록 다음과 같이 몇 가지 항목을 보고하도록 할 필요가 있다.

- 선호에 기반한 일반 도구를 사용하지 않은 경우 이에 대한 이유를 충분히 설명하도록

명시한다. 산식(mapping)을 통해 선호에 근거한 값으로 변환 시 산식(mapping)에 대한

문헌고찰을 수행하고, 산식(mapping)의 구축방법 및 한계점에 대해 자세히 기술하며, 민

감도 분석을 통해 산식(mapping)과 관련된 불확실성을 충분히 검토하도록 명시한다.

- 또한, 산식(mapping)을 사용하는 경우에는 다음 항목에 대한 정보를 추가로 제공하도록

한다.

① 원 도구와 목표 도구

② 목표 도구에 적용된 tariff(출처 및 선호도 측정 대상)

③ 산식(mapping) 개발 연구에 포함된 표본 크기

④ 산식(mapping) 개발 연구에 포함된 응답자의 인구학적·임상적 특징과 산식

(mapping) 이 적용된 연구에 포함된 응답자의 인구학적·임상적 특징의 유사성 검

⑤ 모형 설정(model specification)의 근거

⑥ 통계적 예측 방법(model type)과 선정 이유

⑦ 모형 적합도 및 예측력, 가능하면 중증도 수준에 따라서도 모형 적합도 및 예측력

관련 정보 제공

⑧ 산식(mapping)의 검증(validation) 여부 및 검증에서의 모형 적합도 및 예측력

⑨ 산식(mapping)의 한계점

⑩ 산식(mapping) 사용에 따른 효용 불확실성 검토

⑪ 산식(mapping) 결과와 임상시험에서 수집된 원 도구로 측정된 자료 비교

Page 146: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 138 -

5) 직접측정 관련 세부지침

가) 현 지침

(1) 지침 내 추가 설명

현 지침에서는 시나리오에 기반하여 건강상태의 효용을 직접 측정할 시 (SG와 TTO 방법

에 대한 설명 외) 보고해야 할 항목은 제시하고 있으나, 시나리오 구성 및 평가 방법에 관한

세부 지침은 별도로 제시하고 있지 않다.

(2) 직접 측정 시 보고해야 할 항목

자료 제출자가 선호도를 직접 측정하는 경우, 다음 항목에 대한 정보를 제공한다.

․ 사용된 도구, 선정 근거 제시(신뢰도, 타당도, 실행용이도)

․ 표본 크기

․ 응답자의 건강상태(해당 질환 관련) 및 인구학적 특징(적어도 연령, 성별)

․ 인터뷰 방법(우편/전화/대면/인터넷)

․ 표본 지역

․ 응답률

․ 조사자 간의 차이 평가

․ 완전한 건강의 정의

․ 시나리오에 근거하여 선호도 도출한 경우, 별첨 5에 근거할 것

*별첨 5 : 시나리오에 근거하여 선호도를 도출한 경우 고려해야 할 항목

1) 각 시나리오에서 건강상태 도출의 근거를 제시하고, 각 치료법과 관련된 환자의 경험을 반영하기 위하

여 어떤 방법을 사용하였는지 설명할 것.(예를 들어 환자를 대상으로 한 포커스 그룹을 근거로 했는지,

소규모 인터뷰는 했는지 등)

2) 시나리오가 건강상태의 선호도를 타당하고, 민감하게 측정할 수 있는지 및 포괄성이 있는지 여부를 제

3의(independent) 검토자가 평가했는지 보고할 것.

3) 일반 대중을 대상으로 하므로 표현 용어는 가능하면 간단하게 할 것.

4) ex post 관점 (즉 응답자가 현재 환자라고 가정함)을 취하여, 응답자가 다른 질병이 있을 가능성 및 진

단 관련된 가능성 등을 배제함.

5) 표현 및 단어선택에 따라 응답자가 다르게 반응할 수 있으므로, 응답자에게 치료와 관련된 전체적인 정

보를 최대한 제공하며, 어떤 방법으로 제공하였는지 제시할 것. 이를 통하여 응답자의 이해정도를 평가

하는 것이 권장됨.

6) 스폰서(sponsor) 비뚤림을 막기 위하여 가능하면 스폰서(sponsor) 이름은 언급하지 않도록 함.

7) 일반 대중 대상으로 질문할 때, 응답자가 집중도를 높일 수 있고 시각 보조기구(visual aid) 등을 사용할

수 있기 때문에 일반적으로 대면 인터뷰가 더 선호될 수 있다. 만약 대면 인터뷰를 사용한 경우, 조사자

의 경험/교육정도 등을 명시함.

Page 147: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 139 -

나) 기존 제출자료 검토 결과

표 41에서 제시된 바와 같이, 지난 5년간(2014-2018)11) 직접 측정방식을 이용하여 질 가중

치를 도출한 경우는 총 9건이었다. 직접 측정방식을 선택한 이유에 대해 명확히 설명한 사례

는 거의 없었으나, 자료 분석 결과 직접비교 임상자료 부재 6건, HRQoL 자료 부재·제한 2

건, 질병별 도구 사용 1건이 가능한 이유로 파악되었다.

시나리오 구성을 위해 초기 문헌고찰을 수행한 사례가 총 4건, 문헌고찰과 더불어 EQ-5D

및 K-ALSFRS-R(Korean amyotrophic lateral sclerosis functional rating scale-revised)을 토대

로 시나리오를 구성한 사례가 1건, 기존연구에서 개발된 시나리오를 이용한 사례가 2건,

EQ-5D와 SF-6D를 토대로 구성한 사례가 1건, 언급 없음이 1건 있었다. 시나리오 초안에 대

한 임상 전문가 검토는 모든 사례에서 이루어졌다.

시나리오는 총 4개~18개로 구성되었고, 대체로 증상, 치료반응, 이상반응 등이 고려되었다.

응답자에게 완전한 건강상태의 정의를 제공한 사례는 총 7건 있었고, 나머지 2건에서는 이에

대한 별도의 언급이 없었다.

직접측정은 한국 일반대중을 대상으로 한 사례가 8건, 영국 일반대중을 대상으로 한 사례

가 1건 있었으며, 대체로 갱서베이(gang survey) 방식으로 수행되었다. 1건을 제외한 모든 사

례에서 응답자 특징에 관한 정보가 제공되었다.

질 가중치 측정의 주 방법으로 TTO를 사용한 사례가 7건, SG를 사용한 사례가 1건, SG와

TTO를 모두 사용한 사례가 1건 있었다. 이 외에도 EQ-5D 또는 VAS 등이 함께 사용된 사례

가 6건 있었다. TTO 사용 시 기준 시간을 살펴보면 10년 3건, 20년 2건, 30년 1건, 24개월 1

건으로 다양하게 나타났으나, 기준 설정에 대한 이유에 대해서는 대체로 별도 언급이 없었

다.

11) 2014~2019년 5년간 심평원에 건강보험 등재의 목적으로 제출된 경제성평가 자료 47건(CUA만 포함).

사례 대상 질환시나리오 문헌고찰

시나리오 구성완전

건강상태 정의

질 가중치도출방법

표본 가능한 직접측정 이유

1

전이성 거세 저항성 전립선암

예n=8, 증상, 치료반응, 이상반응

언급 없음

TTO(기준: 10년)

EQ-5D-3L, EQ-VAS

n=280, 5개(서울, 인천, 부산, 광주, 대전)

거주 일반남성

직접비교 임상자료 부재

2전신역형성대세포림프종

기존연구에서 개발된 시나리오

n=6, 반응률과 이상반응

예TTO(기준:

20년)

n=123, 서울 거주

일반대중

직접비교 임상자료 부재

<표 41> 건강상태 시나리오에 근거한 질 가중치 직접 측정방식 사례 분석

Page 148: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 140 -

다) 외국 지침

호주(PBAC, 2016) 지침에서는 직접 측정방식에 대해 간단한 지침을 제공하고 있으나, 캐

나다(CADTH, 2017)와 영국(NICE, 2013) 지침에서는 이에 대한 권장 사항이나 지침을 제공

3골수섬유화증

기존연구에서 개발된 시나리오

n=4, 증상 및 일상생활 장애

예TTO(기준:

20년)

n=128, 서울 거주

일반대중

질병별 도구 사용

4다발성경화증

언급 없음

n=18(세부 건강상태 포함),

일상생활 장애,

이상반응, 치료법

예TTO(기준: 30년), VAS

n=106, 서울 거주

일반대중

직접비교 임상자료 부재

5분화

갑상선암

EQ-5D와 SF-6D를 토대로 구성

n=7, 치료반응, 이상반응

예TTO(기준: 10년), VAS

n=100, 영국 일반대중(한국인 선호도 반영위해

인구사회학적 특성 보정)

직접비교 임상자료 부재

6만성 심부전

예n=5, 증상, 이상반응

언급 없음

TTO(10년 기준)EQ-5D-5L

n=200, 서울 거주

일반대중

HRQoL 자료 없음

7비소세포폐암

n=5+7, 5개(말기암 반영하여 사망까지의 시간으로 시나리오 구성),

7개(이상반응)

예TTO(기준: 20년

– 불명확)

n=205, 서울거주 일반대중

직접비교 임상자료 부재(비교대안 3개)

8근위축성측삭경화

문헌고찰,

K-ALSFRS-R과

EQ-5D를 토대로 구성

n=9, 증상, 일상생활 장애

예SG

EQ-5D-3L

n=202, 서울 거주

일반대중

직접비교 임상자료 부재

9고형암의 골전이

예n=9, 증상,

치료예

SGTTO(기준: 24개월)

EQ-5D-5L EQ-VAS

n=400, 전국 거주

일반대중(특징에 대한 기술

없음)

HRQoL 자료

없음(불확실)

※ (최초 제출 자료의) 주요 기본분석을 기준으로 분류 HRQoL: health-related quality of life, K-ALSFRS-R: Korean amyotrophic lateral sclerosis functional rating scale-revised, SG: standard gamble, TTO: time trade-off

Page 149: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 141 -

하고 있지 않다(표 42).

(1) 캐나다(CADTH, 2017)

캐나다 지침에서는 사용의 편리함(ease of use), 비교가능성(comparability), 해석가능성

(interpretability) 등의 이유로 EQ-5D나 HUI와 같은 일반 도구를 이용한 간접 측정방식을 권

장하고 있다. TTO나 SG 등의 방법을 이용하여 질 가중치를 직접 측정하는 방식은 설계 및

수행이 복잡하고, 건강상태를 어떻게 기술하느냐에 따라 질 가중치가 크게 달라질 수 있다고

만 언급하고 있다. 건강상태 시나리오 구성 방법이나 이에 대한 적절성 평가 관련한 세부 지

침은 별도로 제시하고 있지 않다.

(2) 호주(PBAC, 2016)

현 지침에서는 건강상태 시나리오 기반 직접 측정방식에 대해 단계별로 자세히 설명하고

잠재적 편향을 최소화하라고 언급하고 있으나, 이에 대한 구체적 방안은 제시하고 있지 않

다. 다만, 임상시험 기간을 벗어나는 건강상태를 시나리오에 포함할 때에는 임상시험에서 평

가한 건강상태도 시나리오에 함께 포함하여 검증할 것을 언급하고 있다.

이전 지침(예 – version 4.5(PBAC, 2015))에서는 직접 측정방식에 대해 좀 더 구체적인 지침

을 제시하였는데, 주요 내용은 다음과 같다.

Ÿ 각 시나리오에서 기술한 건강상태의 도출 근거를 제시하고, 치료법에 대한 임상 결론

(therapeutic conclusion)과 시나리오에 기술된 내용 간의 연관성을 설명할 것.

Ÿ 각 치료법 관련 환자의 경험을 시나리오에 반영하기 위하여 어떤 조치를 취했는지 설명

할 것(예를 들어, 환자 대상 포커스 그룹을 근거로 했는가?). 또한, 응답자는 건강상태의

구성 속성(attribute)이 5개~9개가 넘어가면 인지 과부하(cognitive overload)로 인해 제대

로 차이를 인식하고 응답하기 어려울 수 있는데, 다양한 환자 경험으로부터 이러한 속성

을 어떻게 선택하였는지 설명할 것.

Ÿ 타당성(validity), 신뢰성(reliability), 변화에 민감성(responsiveness), 임상적 중요성(clinical

importance) 면에서 시나리오를 평가할 것. 각 시나리오에서 반영하고 있는 기간과 선택

에 근거한 질 가중치 도출방법에서 가정한 기간을 비교하여 평가 및 보고할 것.

Ÿ ex post 관점(즉, 충분한 진단 후 진단된 대로 건강상태를 경험하는 것으로 가정. 미래에

발생할 수 있는 불확실한 위험에 대한 고려는 하지 않음)을 취하는 것을 선호하므로, 관

련 없는 내용(예를 들어, 진단 과정 및 가능한 여러 예후(prognoses))은 배제할 것.

Ÿ 표현 및 단어선택에 따라 응답자가 상당히 다르게 반응할 수 있으므로, 가능하면 응답자

에게 치료와 관련된 전체적인 정보를 제공할 것. “암” 등의 질병 라벨링(labelling) 또는

프레이밍(framining) 효과에 주의할 것. 건강상태에 대한 추가 질문을 통해 응답자의 이해

Page 150: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 142 -

정도를 평가하는 방안도 고려할 것.

Ÿ 시나리오 개수를 정당화할 것.

Ÿ 응답자의 이해를 높이기 위하여 대면 인터뷰가 더 선호됨. 전화 인터뷰나 우편 조사 등을

이용할 경우 이에 대한 정당화를 할 것.

Ÿ 논리적 순서에 따라 정보를 제공하고 필요시 시각적 자료를 이용할 것.

Ÿ 스폰서 비뚤림을 최소화하기 위하여 인터뷰 수행 시 스폰서 이름은 언급하지 않을 것.

Ÿ 자료 제출시 응답자에게 제공된 정보도 함께 제출할 것.

(3) 영국(NICE, 2013)

영국 NICE 본 지침에서는 건강상태 시나리오에 근거한 직접 측정방식에 대해 언급하고 있

지 않다. 다만, EQ-5D를 이용한 간접 측정방식의 대안을 설명하는 NICE DSU TSD 11(Brazier

& Rowen, 2011)에서는 시나리오(vignette)의 타당도를 중요하게 언급하고 있다. 시나리오

(vignette)의 타당도는 시나리오가 얼마나 엄격(rigour)하게 설계되었느냐에 달렸는데, 심층 면

접 등의 광범위한 질적 작업, HRQoL 자료, 제 3자에 의한 독립적 검토 등을 토대로 시나리

오를 기술한다면 시나리오의 타당도가 개선될 수 있다고 하였다. 그럼에도 불구하고 건강상

태 시나리오는 환자의 경험을 충분히 반영할 수 없고, HRQoL 자료에 근거하지 않은 직접 측

정은 NICE 기준에 부합하지 않으나, 검증된 HRQoL 도구로 측정된 자료가 없을 경우에는 제

한적으로 사용할 수도 있다고 언급하였다.

국가 지침 내용 원문 요약

캐나다 CADTH 지침(4판)(2017)

(Direct methods of measurement refer to methods that enable the direct translation of preferences onto a utility scale, while indirect methods require a conversion scale to derive utilities. The most common direct methods include time-trade-off, standard gamble, and discrete choice experiments.) Direct approaches are complex to design and implement and, unless individuals’ own health states are being measured, likely to result in estimates that are highly dependent on the validity of the descriptions of the health states.76,77 (p45)

직접 산출은 설계하고 수행하기에 복잡함. 건강상태 기술의 타당도에 따라

추정값이 매우 달라질 수 있음.

호주PBAC 지침

version 5(2016)

(Scenario-based methods use vignettes to describe the symptoms of a health state to a sample population, usually a representative general population sample, from which utility weights are elicited using an accepted preference-based method. Methods to elicit preferences include the standard gamble, time trade-off and discrete choice experiments, and other stated preference methods.) If using a scenario-based utility valuation to value health outcomes beyond the time horizon of the trial, include one or

임상시험 기간을 벗어나는 건강상태를 시나리오에 포함할 경우 임상시험에서 평가한 건강상태도 시나리오에 함께 포함하여 검증.

<표 42> 시나리오 기반 효용 직접측정 관련 해외 주요국 지침

Page 151: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 143 -

라) 기타 문헌고찰 결과

건강상태 시나리오(vignette)에 기반한 직접측정은 표준화된 설문을 이용하는 대신 문헌고

찰, 임상 자료, 환자 경험, 전문가 의견 등의 다양한 자료를 토대로 질병과 치료의 영향

(impact)을 기술하고, 이에 대한 질 가중치를 TTO나 SG 등의 선택에 근거한 도구를 통해 추

정하는 방법이다. 일반 도구나 질병별 도구로 측정한 적절한 자료가 없을 때 하나의 대안으

로 종종 사용된다(Tosh et al., 2011). 직접측정은 환자나 일반대중 모두를 대상으로 수행할

수 있는데, 기관 제출용으로 준비할 때에는 해당 기관의 선호를 반영하여 대상을 선정한다.

시나리오는 서술식 또는 개조식 형태로 기술될 수 있는데, 이에 대한 자세한 예는 기존 문헌

을 참고할 수 있다(예 - 관절염(Iqbal et al., 2012), 조현병(Briggs et al., 2008), 당뇨병(Matza

et al., 2007), 천식(Lloyd et al., 2008), ADHD(Loyd et al., 2011; Matza et al., 2005), 우울증

(Revicki & Wood, 1998), 만성 통증(Eldabe et al., 2010), 암(Tolley et al., 2013)).

그러나 직접측정의 경우 구체적 기준이 없기 때문에 자료제출자에게 유리한 방향으로 건

강상태가 기술될 수 있고, 표준화된 도구를 사용하지 않기 때문에 비교가능성(comparability)

이 떨어질 수 있다는 단점이 존재한다(Blumenschein & Johannesson, 1998; Dolan et al.,

1996; Brazier et al., 2017). 건강상태가 어떻게 기술되느냐에 따라 질 가중치가 크게 변할 수

있음에도 건강상태 시나리오의 구성이나 평가 방식에 대한 공식 지침이 아직 개발되지 않았

more health states captured and valued within the trial in the scenario-based study to validate the commonality of the trial-based and scenario-based utility weights. Present supporting evidence for any claim of increased sensitivity of a scenario-based approach to identify real differences in utility. Describe all stages of a scenario-based study in detail and explain efforts to minimise potential bias. It is difficult to minimise the many sources of analyst bias that are intrinsic to the scenario-based utility approach, including the nonblinded nature of the construction and presentation of the scenarios (eg incomplete inclusion and differential focus on alternative aspects of quality of life), the design of the methods to elicit values, and the analysis and interpretation of the results. (p78)

시나리오 기반 연구에 대해 단계별로 자세히 설명. 잠재적 편향을

최소화.

영국 NICE 지침 (2013)

본 지침에는 언급 없음

NICE DSU TSD 11 (Brazier & Rowen, 2011):Vignettes that have not been based on HRQL data do not meet the NICE Methods Guidance for alternatives to EQ-5D. However, vignettes may have a limited role where there are no data available using validated HRQL measures. (p23)

HRQoL 자료에 근거하고 있지 않은 건강상태 시나리오는 EQ-5D 대안으로 부적합. 그러나

검증된 HRQoL 도구로 측정한 자료가 없을 경우 제한적으로 사용할 수도 있음.

Page 152: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 144 -

다(Brazier et al., 2017).

다만 최근에 Brazier et al.(2017)은 건강상태 시나리오(vignette) 구성(construction)과 가치평

가(valuation) 관련하여 다음과 같은 몇 가지 지침(good practice suggestions)을 제시하였다.

Ÿ 건강상태 시나리오의 개수는 환자 집단의 중증도 분포를 반영해야 함.

Ÿ 건강상태 시나리오는 이를 가치평가 해야 하는 응답자에게 명확하게 이해되어야 함.

Ÿ 건강상태 시나리오는 임상 전문가 인터뷰, 환자 인터뷰, 임상시험 자료, 기존 문헌 등

의 다양한 출처를 통해 도출된 최적의 근거(best available evidence)를 바탕으로 작성

되어야 함. 이러한 목적을 위해 환자나 임상 전문가 대상 질적 연구를 수행할 시에는

합의(consensus)가 이루어지고, 더 이상의 새로운 정보가 나오지 않을 때까지 인터뷰를

진행함.

Ÿ 강도(intensity)나 빈도(frequency)에 관한 진술을 제시하고자 할 때는 가능하면 환자 수

준의 양적 자료를 사용하도록 함. 이에 대한 예는 문헌(예 – Lloyd et al., 2011; Matza et al., 2014a)을 참고하도록 함.

Ÿ 건강상태에 대한 라벨링(labelling)이나 속성(attribution)은 명확성(clarity)을 위해 필요할

수도 있으나(Matza et al., 2014a), 관계없는 정보(extraneous information)를 끄집어내거

나 편향된(biased) 반응을 유도할 수 있으므로 되도록 사용하지 않음(Rowen et al.,

2012).

Ÿ 불확실한 진술은 응답자가 가치평가 할 때 어려움을 초래할 수 있으므로 피해야 함(예

- “이러한 증상이 있을 수도 있다”).

Ÿ 만약 건강상태 시나리오가 시간상의 변화를 기술하고 있다면(즉, 경로 상태(path

states)), 여기서 도출된 질 가중치를 모형에 적용할 때에는 시나리오에서 가정한 총 소

요 시간(예 – 가치평가 기간)도 함께 고려하여야 함(Matza et al., 2014b).

Ÿ 해당 기관(예: NICE, SMC, CVZ, 기타 기관)에서 인정하는(recognized) 방법(methods)과

대상(population)을 이용하여 건강상태 시나리오(vignette)를 가치평가 해야 함.

추가로 시나리오에 대한 근거의 객관성과 질을 높이기 위해서는 (1) 체계적 문헌고찰 및

임상 자료를 통해 초안 작성, (2) 임상 전문가 검토 후 초안 재수정, (3) 환자 포커스그룹 인

터뷰 등을 통해 환자 경험 반영, (4) 일반인을 대상으로 사전조사를 실시하여 시나리오 검토

및 수정, (5) 본 연구 수행 등의 절차를 거치는 것이 필요하다(예: Matza et al., 2014b).

마) 이해관계자 의견

(1) 전문가 의견

Page 153: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 145 -

- 제시된 의견 없음

(2) 제약사 의견

- 직접 측정에 대한 지침 제시 (시나리오 예시 등)

바) 지침 개정방향 제언

질 가중치 직접측정 시 건강상태 시나리오에 대한 근거의 객관성과 질을 높이기 위해 다

음과 같이 세부지침을 제공할 것을 제언한다.

- 건강상태 시나리오(vignette)를 구성하여 자료 제출자가 직접 질 가중치를 측정할 경우,

이에 대한 정당화를 하도록 한다. 건강상태 시나리오 구성 과정, 응답자 추출과 모집 방

법 등을 포함한 전체 가치평가 과정을 자세하게 기술하도록 명시한다. 민감도 분석을 통

해 직접측정과 관련된 불확실성을 충분히 검토하도록 명시한다.

- 건강상태 시나리오에 대한 근거의 객관성과 질을 높이기 위해 다음의 주의사항을 고려

하여 시나리오(vignette)를 작성하고, 제시된 과정을 토대로 직접측정을 수행하며, 자료

제출 시에는 다음 보고 항목을 고려하여 보고하도록 한다.

- 건강상태 시나리오(vignette) 작성 시 주의사항

Ÿ 건강상태 시나리오의 개수는 가능하면 환자 집단의 중증도 분포를 반영하여 정할

것.

Ÿ 건강상태 시나리오는 응답자가 쉽고 명확하게 이해할 수 있도록 기술할 것.

Ÿ 건강상태 시나리오는 임상 전문가 인터뷰, 환자 인터뷰, 임상시험 자료, 기존 문헌

등의 다양한 출처에서 도출된 최적의 근거(best available evidence)를 바탕으로 작

성할 것. 특히, 중재군 간 차이는 확실하고 명확한 최적의 근거를 바탕으로 기술

할 것.

Ÿ 부작용이나 증상 같은 경우는 (구별하기 어려운 차이보다는) 크게 영향을 주는 것

들을 위주로 시나리오를 구성할 것.

Ÿ 강도(intensity)나 빈도(frequency)에 관한 진술을 포함할 때에는 가능한 한 환자

수준의 양적 자료에서 도출된 근거를 바탕으로 작성할 것.

Ÿ 불확실한 진술은 응답자가 가치평가 할 때 어려움을 초래할 수 있으므로 최대한

지양할 것(예 - “이러한 증상이 있을 수도 있다”).

Ÿ 질병명(condition labeling)과 질병 속성(attribution)을 기술하는 것은 명확성을 위해

필요할 수도 있으나, 편향된 반응을 유도할 수도 있으므로 주의하여 사용할 것.

Page 154: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 146 -

- 직접측정 과정

Ÿ 문헌고찰 및 임상자료를 통해 주요 증상, 치료 효과, 부작용 등을 파악

Ÿ 이를 토대로 임상 전문가 및 환자 인터뷰를 위한 구조화된 인터뷰 가이드 작성

Ÿ 임상 전문가와의 인터뷰 통해 건강상태 시나리오 초안을 작성하고, 환자와의 인터

뷰 통해 환자가 경험한 치료 및 증상 등을 시나리오에 반영

Ÿ 일반 대중을 대상으로 사전 조사(pilot study) 실시. SG나 TTO 등과 같은 선택에

근거한 방법을 이용하여 건강상태의 질 가중치를 측정. 일반 대중이 쉽고 명확하

게 이해할 수 있도록 건강상태가 기술되어 있는지 확인하고, 필요시 문구 수정

Ÿ 일반 대중을 대상으로 최종 가치평가 연구 수행

- 직접측정 시 보고 항목

Ÿ 시나리오 작성을 위한 문헌고찰 과정 및 최종 고찰에 포함된 연구

Ÿ 임상 전문가 인터뷰를 위한 임상 전문가 선정과정 및 기본 정보(임상 전문 분야,

해당 분야 경력 기간 등)

Ÿ 환자 인터뷰 수행 여부 및 인터뷰 수행 시 환자 선정과정 및 환자에 대한 기본

정보(연령, 성별, 질환의 중증도 등)

Ÿ 사전조사(pilot study) 관련 정보 : 일반 대중 모집방법 및 참여자 수 등

Ÿ 최종 건강상태 시나리오와 완전한 건강의 정의

Ÿ 최종 가치평가 연구 관련 정보 : 일반 대중 모집방법, 참여자 수, 응답률, 응답자

의 인구학적 특징(연령, 성별, 거주 지역, 해당 질환 관련 건강상태 등), 조사 방법

(대면 인터뷰/온라인 조사/우편 조사 등), 직접측정 방법(SG, TTO 등) 및 과정, 각

시나리오의 질 가중치 결과(평균, 중위수, 표준편차, 최댓값, 최솟값 등) 등

Page 155: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 147 -

6) 효용의 MCID

가) 현 지침

언급 없음

최소한의 임상적으로 의미 있는 차이를 지칭하는 MCID(minimal clinically important

difference) 관련한 내용은 현 지침에 포함되어 있지 않다.

나) 기존 제출자료 검토 결과

2014년~2018년 5년 동안 심평원에 건강보험 등재의 목적으로 제출된 경제성평가 CUA 자

료 47건을 검토한 결과 효용의 MCID에 대한 정보를 제공한 사례는 없었다. 다만, 자료 평가

당시 MCID 이하의 효용값 사용(예: 이상반응과 관련된 비효용(disutility))이 문제된 바 있다.

또한, 임상시험에서 측정된 치료군의 삶의 질 개선의 정도를 보고한 사례도 많지 않아, 삶의

질 개선에 대한 임상적 유용성 검토 자체가 거의 불가능하다는 점이 문제점으로 계속 지적

된 바 있다.

다) 외국 지침

캐나다(CADTH, 2017)와 영국(NICE, 2013) 지침에는 MCID 관련한 언급이 전혀 없다. 호주

지침(PBAC, 2016)에서는 자주 사용되는 일반 MAUI 이외 다른 MAUI 또는 PRO 도구가 사용

되었을 경우 이 도구에 대한 자세한 정보를 별도로 첨부할 것을 명시하고 있는데, 그중 하나

가 MCID이다(표 43).

지침에서는 MCID의 출처로 다음을 제시하고 있다.

Ÿ 프로토콜(표본 크기 계산 등의 이유로 작성되는 경우 많음)

Ÿ PBAC에서 수용된 바 있는 MCID(단, 임상시험 대상과 제시된 적응증(proposed indication)

에 적합해야 함)

Ÿ 문헌에서 흔히 수용되고 있는 MCID(단, 임상시험 대상과 제시된 적응증에 적합해야 함)

Ÿ 스폰서에 의해 수행된 내부 연구(준거기반(anchor-based)법, 전문가 합의(expert

consensus), 통계적 방법(statistically based analysis))

Ÿ 제시된 적응증과 유사한 적응증으로 문헌에서 흔히 수용되고 있는 MCID(단, 제시된 적응

증으로 일반화를 기대할 수 있어야 함)

Page 156: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 148 -

MCID 보고 시, MCID 출처, 도출 방법(준거기반법, 전문가 합의, 통계적 방법 등), MCID가

도출된 연구와의 비교, 대상 인구(population), 결과(outcome) 정의, 도구의 베이스라인

(baseline) 값 등도 함께 표로 제시하도록 하고 있다.

또한, 지침에서는 스케일(scale)로 측정된 경우에는 준거기반법을 선호하며, 생존자료나 이

분형 자료의 경우에는 MCID 결정이 쉽지 않기 때문에 전문가 합의에 근거하여 도출하는 게

일반적이라고 언급하고 있다. 주요 결과변수(primary outcome)가 대리변수(surrogate)인 경우

에는 최종 결과에 의미 있는 변화를 초래할 수 있는 대리변수 상의 변화에 근거해야 한다고

명시하고 있다.

라) 기타 문헌고찰 결과

(1) MCID 정의 및 측정

국가 지침 내용 원문 요약

호주PBAC 지침

version 5(2016)

Where a patient-reported outcome measure is used, or a MAUI that is not listed above, provide, in an attachment, a discussion of (or reference supporting) the (p37): w domains of quality of life, symptoms or function that are

covered by the instrument w scoring method of the instrument w validity of the instrument w reliability of the instrument w responsiveness of the instrument to differences in health

states between individuals and to changes in health states over time experienced by an individual

w clinical importance of any differences detected by the instrument (see Subsection 2.4.4 for guidance on minimal clinically important differences [MCIDs]).

Likely sources for an MCID may be (p38): w the protocol (often for the purposes of powering the study) w a previously accepted MCID by the PBAC, as indicated in a

public summary document, that is relevant to both the trial population and the proposed indication

w a commonly accepted MCID in the literature, relevant to the trial population and the proposed indication

w an internal study by the sponsor (anchor-based analysis, expert consensus, statistically based analysis)

w a commonly accepted MCID in the literature for a similar indication that can reasonably be expected to be generalisable to the proposed indication.

위에서 언급한 MAUI 이외 다른 MAUI나

PRO 도구가 사용되었을 경우 이

도구의 MCID를 포함한 추가 정보

첨부.

MCID의 출처는 프로토콜, PBAC에서

수용된 기존값, 문헌에서 흔히

인용되는 MCID값, 제출자 내부분석. MCID값 인용 시

임상시험 대상 인구와 적응증에 적합한지

검토.

※ 캐나다 CADTH 지침(2017)과 영국 NICE 지침(2013)에서는 MCID에 대한 언급 없음.

<표 43> MCID 관련 해외 주요국 지침 내용

Page 157: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 149 -

환자 중심의 진료(patient-centered care)가 강조되면서 환자의 주관적 삶의 질 또는 경험

이 점차 중요해졌고, 이에 따라 다양한 연구에서 각종 HRQoL 또는 PRO 도구가 중요한 측정

도구로 활용되고 있다(Wyrwich, 2004; Wyrwich et al., 2013). 그러나 PRO는 훈련받은 임상

전문가가 아닌 환자의 평가를 통해 산출되기 때문에, 이에 대한 해석의 어려움이 따른다. 즉,

PRO 도구로 측정된 점수 변화가 과연 의미 있는 변화인지 또는 환자 관리를 다른 방식으로

변경해야 할 정도의 변화인지 등을 판단하기가 쉽지 않다. 통계적 유의성을 근거로 판단하는

방법도 있으나, 통계적 유의성은 표본 크기에 따라 작은 차이에도 유의하게 나오거나 큰 차

이에도 유의하지 않게 나올 수 있다. 따라서 통계적 유의성만으로 임상적 유의성을 판단하는

데에는 한계가 있다. 이에 대한 대안으로 환자에게 중요한 PRO 변화가 어느 수준인지 파악

하기 위한 체계적 시도가 이뤄졌는데, 특히 캐나다 McMaster 대학교 연구진들을 중심으로

관련 연구가 활발하게 수행되었다. 이 연구진들은‘최소한의 임상적으로 의미 있는 차

이’(minimal clinically important difference, MCID)에 대한 기준을 제공하고자 노력하였는데,

Jaeschke et al. (1989)은 MCID를 다음과 같이 공식적으로 정의하였다.

“the smallest difference in score in the domain of interest which patients perceive as beneficial and which would mandate, in the absence of troublesome side effects and

excessive cost, a change in the patient’s management.”(p.408)

이 정의에 따르면 MCID는 환자가 이익(beneficial)으로 인식하고, (번거로운 부작용이나 과

도한 비용이 발생하지 않아도) 환자 관리에 변화가 필요할 수 있는 관심 영역에서의 가장 작

은 점수 차이를 의미한다. 그러나 ‘임상적(clinical)’이란 용어가 환자 일상 경험보다는 임

상 영역(clinical arena)에 더 초점을 맞추는 경향이 있다는 주장이 제기되어(Schünemann et al., 2005a), 이후 같은 연구팀에서는 ‘임상적’이라는 용어를 제외한 ‘최소한의 의미 있는

차이’(minimal important difference, MID)를 사용하기 시작했다(Juniper et al., 1994;

Schünemann et al., 2005b). Schünemann et al.(2005b)은 MID를 다음과 같이 공식적으로 재정

의하였다.

“the smallest difference in score in the outcome of interest that informed patients or informed proxies perceive as important, either beneficial or harmful, and that would

lead the patient or clinician to consider a change in the management.”(p.82)

즉, MID는 환자(informed patients) 또는 대리자(informed proxies)가 중요하다고, 즉 이익

이(beneficial) 되거나 해롭다고(harmful) 인식하고, 환자나 임상의가 관리에 변화를 고려하도

록 만들 수 있는 관심 결과(outcome of interest)에서의 가장 작은 점수 차이를 의미한다. 이

외에도 감지할 수 있는 최소 변화(minimum detectable change, MDC), 감지할 수 있는 가장

작은 차이(smallest detectable difference) 등 다양한 용어가 혼합되어 사용되고 있다. 여기서

는 호주 PBAC 지침에서와 마찬가지로 MCID라는 용어로 통칭하여 사용하였으며, 용어에 대

한 정의 및 변천사는 King et al.(2011) 등의 다른 연구를 참조할 수 있다.

Page 158: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 150 -

HRQoL 도구 및 기타 PRO 도구의 MCID를 추정하는 방법으로는 크게 (1) 준거(anchor)가

될 수 있는 측정 도구를 동시에 이용하여 변동양상을 비교하는 준거기반법(anchor-based

methods)과 (2) 측정결과의 분포 변동에서 통계적 차이를 알아보는 분포기반법

(distribution-based methods)이 있다(Wyrwich et al., 2013). 이 외에도 전문가 합의(consensus),

MAUI를 대상으로 개발된 도구 정의 접근법(instrument-defined approach)(Luo et al., 2010),

미국 FDA(2009) 지침에서 제시한 반응누적분포함수(cumulative distribution of response) 등이

있다.

☐ 준거기반법(anchor-based method)

준거기반법은 준거(anchor)가 될 수 있는 다른 도구를 이용하여 최소한의 의미 있는 차이

를 추정하는 방법이다. 준거는 측정 도구와 상관관계를 보여야만 준거로 사용될 수 있는데,

기존 연구에서는 SF-36 질문 문항 2(즉, 1년 전과 비교한 건강상태), 환자 변화 등급(global

ratings of change), Eastern Cooperative Oncology Group (ECOG) performance status 등의

다양한 도구들을 준거로 이용하였다.

준거기반법은 분석 방법에 따라 다시 세분화될 수 있는데, Coretti et al. (2014)은 이를 ①

회귀 방법, ② 평균 변화 접근법(average change approach), ③ 최소 감지할 수 있는 변화 접

근법(minimum detectable change approach), ④ 변화 차이 접근법(change difference

approach), ⑤ ROC(receiver operating characteristic, 수신자조작특성) 곡선 접근법으로 분

류·정리하였다(표 44). 첫째, 회귀 방법은 관심 도구로 측정된 변화값을 종속변수, 준거 도

구로 측정된 변화값을 주요 독립변수로 하여 OLS 또는 GLM을 수행한 후, 준거 도구의 회귀

계수 값을 관심 도구의 MCID로 추정하는 방법이다. 준거 도구의 값은 더미 변수로 변경하여

분석에 포함할 수도 있는데, 이때 더미 기준값(threshold value)은 환자의 선호나 분석자 판단

에 근거하여 도출될 수 있다. 둘째, 평균 변화 접근법은 준거 도구를 기준으로 반응자

(responders)를 분류하고 이들의 점수 변화 평균값을 MCID로 이용하는 방법이다. 셋째, 최소

감지할 수 있는 변화 접근법은 측정오차(measurement error) 이상의 가장 작은 차이를 측정

하는 방법이다. 준거 도구를 기준으로 비반응자(non-responders)를 분류하고, 이들의 점수 변

화 평균값에 대한 신뢰구간 상한값을 MCID로 이용한다. 넷째, 변화 차이 접근법은 반응자와

비반응자 간 평균 점수 변화 차이를 MCID로 이용하는 방법이다. 다섯째, ROC 곡선 접근법

에서는 양성 반응(positive response)에 대한 민감도(sensitivity) 또는(and/or) 특이도(specificity)

를 최대가 되게 하는 점수 변화값을 MCID로 정의한다(Parker et al., 2011). 검사 X의 민감도

는 질환이 있는 환자 중 검사 X를 통해 양성으로 진단받은 환자의 비중으로 계산할 수 있는

데, 준거기반법에서는 준거 도구에 의해 “향상(improvement)”으로 분류된 환자를 전자라고

볼 수 있고, 관심 도구에서 기준값 이상으로 분류된 환자를 후자라 볼 수 있다. 마찬가지로

Page 159: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 151 -

특이도는 준거 도구에 의해 “향상(improvement)”으로 분류되지 않은 환자 중 관심 도구에

서 기준값 이하로 분류된 환자의 비중으로 볼 수 있다. 분류 정확도(accuracy)는 ROC 곡선의

AUC(area under the curve)로 제시될 수 있는데, 0.7 ~ 0.8 수준이면 적절, 0.8 ~ 0.9 수준이

면 좋은 수준이라고 할 수 있다(Parker et al., 2011).

준거기반법의 주요 한계점으로는 (1) 회상에 기반한 준거 이용 시 회상 비뚤림(recall bias)

이 발생할 수 있고, (2) 어떤 준거 도구를 사용했느냐에 따라 결과가 달라질 수 있으며, (3)

표준화가 상대적으로 어렵고, (4) 준거 도구를 함께 적용 시 응답 과정에서 일치화

(concordance)가 발생할 수 있는 점 등이 있다(Wyrwich et al., 2013; Parker et al., 2011; 배

종면, 2015).

방법 절차 산출물(MCID)

회귀 방법(Regression methods )

w 관심 도구로 측정된 변화값을 종속 변수, 준거 도구로 측정된 변화값을 주요 독립 변수로 하여 OLS 또는 GLM 수행. 준거 도구로 측정된 값은 더미 변수로 변경하여 분석에 포함 가능. 이때 더미 기준값(threshold value)은 환자의 선호 또는 분석자로부터 도출. 다른 공변량이 포함될 수도 있음.

회귀계수

평균 변화 접근법(Average change

approach)

w 준거 도구를 기준으로 분류된 반응자(responders)에서 점수 변화 평균값

평균값

최소 감지 변화 접근법 (Minimum detectable change

approach)

w 신뢰구간이 주어진 상태에서 측정오차(measurement error) 이상의 가장 작은 차이. 준거 도구를 기준으로 분류된 비반응자(non-responders)에서 점수 변화 평균 이용

비반응자(non-responders)에서 감지된 평균 변화의

신뢰구간 상한값

변화 차이 접근법 (Change difference

approach)w 반응자와 비반응자 간 평균 점수 변화 차이 차이

수신자조작특성 곡선 (ROC curves)

w 민감도를 x축, (1-특이도)를 y축으로 한 ROC 이용. 민감도는 준거 도구에 의해 “향상(improvement)”으로 분류된 환자 중 관심 도구에서 기준값 이상으로 분류된 환자의 비중. 기준값으로 중앙값이 흔히 사용됨. 특이도는 준거 도구에 의해 “향상(improvement)”으로 분류되지 않은 환자 중 관심 도구에서 기준값 이하로 분류된 환자의 비중.

양성 반응에 대해 최대 민감도 또는(and/or) 특이도를 제공하는

변화값.AUC(area under the curve)는 분류 정확도

제시.

출처: Coretti et al. (2014) 참조 MCID: Minimum clinically important difference, MDC: Minimum detectable change, ROC: Receiver operating characteristics curve, OLS: Ordinary least squares, GLM: generalized linear models

<표 44> 준거기반법(anchor-based method) 방법 비교

Page 160: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 152 -

☐ 분포기반법(distribution-based method)

분포기반법은 통계학적 분포에 기반하여 MCID를 추정하는 방법으로 다양한 측정법이 존

재하나, 공통 요인은 점수 변화 차이와 변동성(variability) 개념을 이용한다는 점이다

(Wyrwich et al., 2013).

가장 대표적인 방법으로는 효과 크기(Effect size, ES)와 측정의 표준오차(standard error of

measurement, SEM)가 있다. ES는 그룹 간 평균 점수 변화 차이를 표준편차로 나누어 계산할

수 있는데, 표준편차 유형에 따라 다양한 버전이 존재한다(Norman et al., 2007). 분포에 기반

한 ES 측정 방식의 장점은 단위가 없기 때문에 다양한 그룹 간, 결과 간 비교가 가능하다는

점이다. 흔히 ES가 0.2이면 차이가 작고, 0.5이면 중간이며, 0.8 이상이면 크다고 해석한다

(Cohen, 1988). Norman et al.(2003)은 38개의 PRO 연구를 분석한 결과 PRO 도구의 MCID는

표준편차의 0.5배 또는 0.5 ES에 가깝다고 주장하였다. SEM은 오차의 변동성(즉, 측정 오차

의 표준편차)을 보여주는 개념으로 도구의 표준편차× 도구의 신뢰계수 로 계산할

수 있는데, 중요한 변화를 추정할 때 자주 사용된다(Nunnally et al., 1994). 1 SEM은 준거기

반법으로 측정한 다양한 PRO 도구의 MCID와 매우 밀접한 연관성을 보이는 경향이 있어,

SEM을 이용하여 MCID 추정 시 중요한 기준값으로 자주 사용되고 있다(Wyrwich et al., 2002;

Wyrwich, 2004; Wyrwich et al., 2013).

이러한 분포기반법은 마땅한 준거가 없는 상황에서 PRO 점수 변화를 해석할 때 쉽게 사

용할 수 있으나, 임상적 타당성과 반응도를 고려하지 않는다는 단점을 가지고 있다. 따라서

호주 PBAC (2016) 지침에서는 준거기반법을 더 선호한다고 언급하였으며, 미국 FDA (2009)

에서도 분포기반법은 준거기반법을 지지하는 정도의 역할을 할 수 있다고 명시하였다.

☐ 기타

이 외에도 전문가 합의(consensus), 도구 정의 접근법(instrument-defined approach), 누적분

포함수(cumulative distribution of response) 등이 있다. 도구 정의 접근법은 상대적으로 최근

에 개발된 방법으로, MAUI의 MCID 추정에 이용되었다(Luo et al., 2010, McClure et al.,

2017). 이 방법은 환자 자료 없이 시뮬레이션을 통해 MCID를 추정하는 방법으로, MAUI에 의

해 정의되는 건강상태가 한 단계 변할 때, 이에 해당하는 질 가중치 변화를 MCID로 가정한

다. 예를 들어, EQ-5D-5L의 경우 33333으로 정의된 건강상태에서 23333, 32333, 33334처럼

한 건강 영역에서 딱 한 수준만 변화될 때 최소한의 의미 있는 임상적 변화가 발생했다고

가정하고, 이때의 질 가중치 변화를 MCID로 정의한다. EQ-5D-5L로 정의될 수 있는 건강상

태가 총 3,125개인데, 각 건강상태에서 한 단계만 변화해서 만들어질 수 있는 건강상태는 총

25,000개이다(McClure et al., 2017). 도구 정의 접근법에서는 적절한 tariff를 적용하여 25,000

Page 161: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 153 -

개의 건강상태 변화에 따른 질 가중치 변화를 계산하고, 이것의 평균을 MCID로 추정한다.

반응자 누적분포함수는 미국 FDA (2009) 지침에서 제시한 방법인데, 임상적으로 의미 있는

변화에 대해 하나의 값이 아닌 분포로 정보를 제공한다. 이 누적분포함수는 도구 점수의 변

화를 X축으로, 이 점수 변화를 절단점(cut-off point)로 사용 시 누적 반응자(responders) 비율

을 Y축으로 하여 그릴 수 있는데, MCID 추정의 불확실성에 대한 하나의 대안으로 제시되었

다.

(2) MAUI의 MCID 연구 검토

EQ-5D나 SF-6D 등과 같은 MAUI의 MCID 연구도 지난 10여 년간 나름 활발히 진행되었다.

Coretti et al. (2014)은 영국 일반대중의 선호를 반영한 EQ-5D 점수의 MCID를 추정하고자 문

헌고찰을 수행하였고, 총 18개의 문헌을 최종적으로 선정하여 이들의 연구결과를 검토하였

다. 결과는 표 45에 제시된 바와 같은데, 임상시험에서 단면연구까지 다양한 자료와 MCID

도출 방법이 이용되었고, MCID 또한 0.03 ~ 0.54로 다양하게 보고되었다. 같은 연구 내에서

도 사용한 분석 방법과 준거 등에 따라 다양한 값이 도출되었다. 예를 들어, Parker et al.

(2011)은 두 개의 준거와 평균 변화 접근법(average change approach), 최소 감지 변화 접근

법(minimum detectable change approach), 변화 차이 접근법(change difference approach),

ROC 곡선을 이용하여 MCID를 추정하여 0.15~0.54의 범위를 보고하였다. 연구진들은 이 방법

중 최소 감지 변화 접근법이 제일 적절하다고 언급하였는데, 그 이유로는 측정 오류 이상의

값이고, 상태가 향상된 환자들이 보고한 평균 변화값에 가장 근접하며, 준거의 영향을 가장

덜 받기 때문이라고 하였다. 최소 감지 변화 접근법으로 측정한 MCID는 0.46이었다.

또 다른 연구(McClure et al., 2017)에서는 도구 정의 접근법을 이용하여 5개 국가의

EQ-5D-5L의 MCID를 비교하였다. 캐나다, 중국, 스페인, 일본, 영국, 우루과이에서 개발된

EQ-5D-5L tariff를 이용하여 MCID를 추정한 결과 일본 tariff 이용 시 0.048로 가장 낮게 나

왔고, 중국 tariff 이용 시 0.069로 가장 높게 나왔다. EQ-5D 영역별 최댓값을 제외하고 분석

한 경우에는 0.037(캐나다, 영국) ~ 0.058(중국)로 추정되었다.

한국에서는 MAUI를 이용한 MCID 연구가 거의 이뤄지지 않았다. Kim et al. (2015)의 연구

가 거의 유일한데, 이 연구에서는 뇌졸중 환자 487명을 대상으로 10개월간의 EQ-5D와

SF-6D의 점수 변화를 이용하여 각 도구의 MID를 계산하였다. EQ-5D의 경우 국내 tariff

(Lee et al., 2009)를 적용하였으나, SF-6D의 경우 국내에서 개발된 tariff가 없기 때문에 영국

tariff를 적용하였다. 수정된 Rankin scale과 Barthel index를 준거로 하여 최소한의 개선과 최

소한의 악화를 정의하였고, 이 범주에 속한 환자들의 평균 점수 변화를 MID로 정의하였다.

연구에서는 EQ-5D의 MID를 0.08 ~ 0.12, SF-6D의 MID를 0.04 ~ 0.14로 보고하였다.

연구 결과를 종합해 보면 대상 인구, 분석 방법, 준거의 유형, tariff 등에 따라 MCID가 상

Page 162: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 154 -

당히 달라지며, 연구 간 차이뿐만 아니라 연구 내 차이도 무시할 수 없음을 확인할 수 있다.

<표 45> 영국 일반대중의 선호가 반영된 EQ-5D 점수의 MCID 연구

연구 연구설계대상

질환영역측정방법 준거 측정도구 용어 결과

Larsen et al. (2008)

비무작위 임상시험

근골격계(n=98)

단면기준분포(Reg)

- CRD 0.08

Marra et al. (2005)

단면연구근골격계(n=313)

단면기준분포(SD)

- MID 0.05

Solberg et al. (2013)

전향적 코호트 연구

근골격계(n=692)

종단기준준거(ROC)

- Global Perceived Scale of Change

CVS 0.30

Soer et al. (2012)

전향적 코호트 연구

근골격계(n=151)

종단기준준거(ROC)

- Roland Morris Disability Questionnaire

- Numeric rating scale- Pain Disability Index

MCIC 0.03

Parker et al. (2013)

전향적 코호트 연구

근골격계(n=69)

종단기준준거(AC, MDC, CD,

ROC)

- North American Spine Society Patient Satisfaction Scale

MCID 0.24

Parker et al. (2012a)

후향적 코호트 연구

근골격계(n=47)

종단기준준거(AC, MDC, CD,

ROC)

- Health transition index of SF-36

- Patient’s satisfaction after the surgery

MCID 0.14-0.24

Impellizzeri et al. (2012)

전향적 코호트 연구

근골격계(n=99)

종단기준준거(ROC)

- Symptoms specific well-being

- Global Treatment Outcome

MCIC 0.16

Parker et al. (2012b)

후향적 코호트 연구

근골격계(n=53)

종단기준준거(AC, MDC, CD,

ROC)

- Health transition index of SF-36

- Patient’s satisfaction after the treatment

MCID 0.29-0.52

Parker et al. (2011)

후향적 코호트 연구

근골격계(n=45)

종단기준준거(AC, MDC, CD,

ROC)

- Health transition index of SF-36

- Patient’s satisfaction after the treatment

MCID 0.15-0.54

McDonough et al. (2011)

전향적 코호트 연구

근골격계(n=1000)

종단기준준거(AC)

- Symptom satisfaction- Self-perceived health- Oswestry Disability

Index - Progress rating

MID 0.12-0.15

Boonen et al. (2007)

단면연구근골격계(n=120)

단면기준분포(LA)

- SDD 0.36

Staerkle et al. (2011)

단면연구근골격계(n=51)

종단기준분포(SEM)

- MDC 0.36

Kvam et al. (2011)

전향적 코호트

암(n=239)

종단기준준거(AC)

Patient’s perceived improvement

MD 0.08-0.10

Page 163: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 155 -

마) 이해관계자 의견

(1) 전문가 의견(자문회의)

- 질 가중치 적용 시 임상적으로 의미 있는 값인지에 대한 고민 종종 있음. MCID라는 용어

가 주는 부담이 있으므로 이를 완화하여 표현하는 방안 검토 필요.

(2) 제약사 의견

- 없음

바) 지침 개정방향 제언

삶의 질 개선이 과연 임상적으로 의미 있는지 생각해 보는 계기를 제공하기 위하여 다음

연구 분포(SD)

Pickard et al. (2007)

후향적 코호트 연구

암(n=534)

단면기준준거(MDS)분포(SEM,

SD)

- Eastern Cooperative Oncology Group performance status ratings

- Functional Assessment of Cancer Therapy-General score

MID 0.07-0.12

Le et al.(2013)

무작위 비교연구

외상후 스트레스 장애

(n=200)

종단기준준거(Reg, ROC)

분포(SD)

- Clinical Global Impression-Severity

- Clinical Global Impression-Index

- Treatment response status

MCID 0.04-0.10

Stark et al.(2010)

단면연구염증성 장질환(n=502)

종단기준준거(Reg)

- Patient’s perceived improvement after the treatment

MD

향상 : 0.076악화 : 0.109

Shikiar et al.(2006)

무작위 비교연구

건선(n=147)

단면기준준거(AC)분포(SEM)

- Psoriasis Area and Severity Index

- Physician’s Global Assessment

MID/MCID

0.09-0.22

Walters & Brazier (2005)

종단연구혼합

(n=2283)

종단기준준거(CD)

분포(ES, SRM, SD)

- Global Rating of Change

MID 0.07

출처: Coretti et al.(2014)의 문헌고찰 내용 재정리 AC: Average change, CD: Change difference, CRD: Clinically relevant difference, CVS: Cut-off values of success, ES: Effect size, LA: Limits of agreement, MCIC: Minimum clinical important change, MCID: Minimum clinically important difference, MD: Meaningful differences, MDC: Minimum detectable change, MDS: Mean difference score, MID: Minimum important difference, REG: Regression analysis, ROC: Receiver operating characteristics curve, SD: 0.2 or 0.5 standard deviation, SDD: Smallest detectable difference, SEM: Standard error of measurement, SRM: Standardized response mean

Page 164: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 156 -

과 같은 내용을 지침 설명에 포함하는 안을 검토하였다.

- 질 가중치의 변화나 차이가 의미 있음을 증명하기 위하여 자료 제출자는 임상시험에서

사용된 MAUI의 MCID(minimal clinically important difference)를 보고하는 것을 고려할

수 있다. MAUI가 사용되지 않은 경우에는 임상시험에서 사용된 기타 삶의 질 도구의

MCID를 보고할 수 있다. 보고 시에는 MCID의 도출 대상 및 방법 등도 함께 기술한다.

그러나 질 가중치의 경우 다양한 자료원(예, 기존값 인용, 직접측정)에서 도출될 수도 있

고, 대상군의 삶의 질 개선이 반드시 모형에서 사용하는 치료군 간 질 가중치 차이로 드러나

는 것은 아니므로 MCID의 대상 도구가 명확하지 않을 수 있다. 따라서 질 가중치를 다루는

효용 파트에서 이를 언급하기보다는 분석기법에서 CUA 대상 여부를 논의할 때 위의 내용,

즉 삶의 질 개선의 임상적 유용성 검토 관련 내용을 간단히 언급할 것을 제언한다.

Page 165: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 157 -

자. 경제성평가 모형 구축에서의 통계적 고려사항

1) 현 지침

현 지침은 통계적 고려사항을 별도의 지침으로 제시하고 있지 않다. 그러나 통계적 쟁점

사항들에 대하여 주요 이해관계자들로부터 지속적인 요구사항들이 있었던 바, 주요 쟁점 사

항들의 제외국 지침을 검토하고 지침 개정방안을 제언하였다.

2) 효과의 추정

경제성평가 모형 및 적절한 자료원을 선정하고 자료원으로부터 추정된 신청약의 효과를

모형내 모수 추정값으로 사용한다. 경제성평가 모형의 구조 및 목적, 신뢰성, 일치성에 부합

하는 적절한 자료원의 선택 (복수의 자료원 가능) 및 적절한 효과의 추정치를 도출하는 것이

중요하다.

가) 제외국 지침

(1) 캐나다 CADTH

캐나다의 지침에서는 지침 전반에 걸쳐 통계적 사항을 포함하고 있다. 먼저 효과의 추정에

서의 통계적 고려사항은 다음과 같다.

- 통제된 최적의 환경(임상시험에서는 일반적으로 무작위배정 통제 시험, randomized

controlled trial, RCT)에서 수행한 임상시험에서의 처치의 결과를 효과(efficacy)라고 하

고 실제 환경, 즉 일상의 진료환경에서 평가된 처치의 결과를 실제효과(effectiveness)라

고 한다.

- 의사 결정자는 일반적으로 실제 환경에서 처치가 적용된 환자들로부터 도출된 효과에

관심이 있다. 이는 기본분석에서 생존기간과 생존의 질과 관련된 임상적으로 의미있는

결과가 필요하다는 것을 의미한다.

- 중요한 점은 RCT 자료의 어느 정도까지가 실제 환경에서의 실제 효과를 반영하는가를

평가하는 것이다. 이는 임상시험의 외부타당도에 해당한다. 경제성평가에서는 임상시험

의 통제된 효과보다는 실제 효과를 반영하는 것을 의사결정자는 더 의미있게 생각한다.

- 자료에서 실제 효과를 추정하는 경우 임상시험의 환경과 실제 환경에서 차이가 날 수

있는 요인들을 선별해야 한다(예: 순응도). 실제 환경의 요인을 분석에서 고려할 때 중요

Page 166: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 158 -

하게 판단해야 하는 점은 잠재적인 중재효과 수정 요인을 환자의 건강 결과로 연결할

수 있는 자료의 이용가능성을 확인해야 한다.

- 처치에 대한 잠재적인 이상반응을 평가하는 것이 필요하다. 비교하고자 하는 처치와 관

련된 이상반응은 비용과 결과에 영향을 줄 수 있으므로 이를 경제성평가에서 고려하는

것은 중요하다. 특히, 이상반응의 특성, 빈도, 기간, 중증도 등에 따라서 이상반응은 환자

의 순응도, 사망, 병의 상태, 효용, 자원의 사용 등에 영향을 줄 수 있다. 임상적으로 의미

있는 이상반응에 초점을 두어야 하며 이는 실제 환경에서 비교하는 처치의 기대비용과

효과에 영향을 줄 수 있다.

☐ 실제효과와 안전성 평가 모수

- 효과와 안전성을 평가하기 위한 모수는 평가변수에 따라 다른 형태를 가질 수 있다. 예

를 들어, 효과 또는 안전성 변수가 연속형인 경우는 절대위험차이(absolute risk

difference)로 이분형인 경우는 상대위험(relative risk) 또는 오즈비(odds ratio)를 이용하

여 대조군 대비 처치군의 효과의 크기를 측정할 수 있으며 평가 모수로 사용할 수 있다.

- 만일 효과 또는 안전성 변수가 progression free survival (PFS) 또는 overall survival (OS)

와 같이 사건이 발생할 때까지의 시간인 경우는 모수적, 준모수적, 또는 비모수적 생존

분석의 결과인 위험비(hazard ratio)를 평가 모수로 이용할 수 있다. 경제성평가에서 모

수의 추정치로 위험비를 사용하는 경우, 상대적 효과는 분석기간 동안 일정하다고 가정

한다.

- 모수의 추정치로 자료원에서 추정된 위험비를 사용하는 경우, 비례위험의 가정이 적절

한지 전체적인 분석의 맥락에서 평가해야 한다. 이러한 가정의 합리성을 평가할 때, 시

간에 따라서 변하는 다른 변수들이 위험비에 미치는 영향을 고려해야 한다. 실제 환경과

상충하는 정도로 인하여 결과에서 발생할 수 있는 잠재적인 바이어스를 고려하는 것이

중요하다.

- 비교효과의 추정이 타당하지 않거나 치료의 선호로 인하여 비교연구가 비윤리적인 경우

상대적인 조건보다는 절대적인 조건, 즉, 각 중재에 대하여 따로 추정치를 제공하는 자

료원을 이용하는 것이 필요할 수 있다. 이는 이상반응의 위험에 대한 정보를 필요로 하

거나 빠르고 치명적인 질병의 진행이 있는 경우, 처치의 효과를 평가할 때 발생할 수 있

다.

- 이와 비슷하게, MRI 기계나 computed tomography scanner와 같은 새로운 기술을 평가하

는 경우 비교할 수 있는 대안이 없을 수 있다. 이런 경우에 처치의 효과는 확인된 건수

등의 절대적인 값을 이용할 수 있다.

- 절대적인 값은 또한 비율로 제시할 수도 있다. 확률과 비율은 일반적으로 상호교환적으

Page 167: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 159 -

로 사용된다. 의사결정 모형에서 확률을 추정하고자 하는 경우 순간적인 사건 비율

(instantaneous event rate)은 특정한 기간 동안의 확률로 변화하여야 한다.

- 변환을 위해서는 비율이 특정한 기간 동안 일정하다는 가정이 필요하다. 예를 들어, 개

인의 건강상태 사이의 전이를 설명하거나 진단검사의 정확성을 평가하기 위한 민감도와

특이도 등은 확률을 평가 모수로 설정할 수 있다.

☐ 자료원과 타당성 평가

- 실제효과, 이상반응 등에 대한 모수 추정치를 구하기 위한 자료의 출처는 RCT, 관찰연

구, 행정 데이터베이스, 단일군 연구, 전문가 집단의 의견 등이 있다. 경제성평가를 위한

목표 모집단, 비교군, 급여기준 등을 반영한 관련 자료원을 정의해야 한다. 의사결정 문

제에 정의된 대로 임상적 실제효과와 이상반응에 대한 정보를 검색한다. 이러한 검색은

포괄적이고 제3자에 의하여 재현이 가능해야 한다.

- 자료원을 평가할 때 경제성평가의 맥락을 고려해야 한다. 경제성평가 모형의 모수에 대

한 정보를 가지고 있는 자료원을 이용해야 하며, 궁극적으로 평가의 목적에 부합하여야

한다. 이에 대한 평가는 자료원과 의사결정 문제 사이의 차이를 조사하는 것이다. 특정

한 처치를 받을 것 같은 환자의 유형, 특정한 이상반응이 발생할 것 같은 환자의 유형,

처치의 적용방법 또는 용량의 차이, 일반적인 처치와의 차이 등과 같은 다양한 사안을

고려해야 한다.

- 만일 이전의 검색 또는 리뷰가 있는 경우에는 경제성평가의 목적과 부합하는 정도의 범

위, 포함/제외 기준을 평가할 수 있다. 비슷하게 메타 또는 네트워크 메타분석의 경제성

평가 목적 부합성은 범위, 포함/제외 기준 및 이러한 분석이 의사결정 문제와 얼마나 관

련이 있는지 평가한다.

- 모수 추정치의 신뢰성도 고려해야 한다. 이는 추정치의 바이어스와 관련된다. 신뢰성을

평가할 때 자료원의 방법론적 엄격성, 즉, 실제값에 대하여 믿을만한 추정치를 제공할

지에 대한 평가가 필요하다. 베이스라인 특성의 처치군 간의 비균형성과 performance

bias와 detection bias와 같은 잠재적인 바이어스 발생 요소를 고려해야 한다.

- 자료원을 평가할 때 경제성평가 모형의 다른 모수를 추정하기 위하여 사용하는 다른 자

료원과의 일치성을 평가하여야 한다. 자료원 내의 자료의 수집과정과 경제성평가 모형

의 다른 모수들과 관련성이 있는지 고려해야 한다.

❍ 모수의 추정

- 경제성평가를 위해 실제효과 및 이상반응과 관련된 모수를 추정할 때, 이상적으로는 다

양한 자료원 간의 목적 부합성, 신뢰성, 일치성에서의 잠재적인 차이를 고려한 방법을

Page 168: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 160 -

이용하여 모든 가능한 자료원에서 습득한 자료를 통합하여야 한다. 또한, 통합된 자료는

가능한 정보의 전체성을 반영하여야 한다.

- 실제효과 및 이상반응(안전성) 평가변수에 대한 확률분포를 가정해야 하며 불확실성을

평가한다.

- 모든 가능한 자료원으로부터 근거를 합칠 수 있는 방법론의 개발은 현재도 진행 중이다.

모든 가능한 자료원을 합치는 적절한 방법이 없는 경우 메타분석이나 네트워크 메타분

석을 이용할 수 있다. 경제성평가의 의사결정 문제에서 비교군이 둘보다 많거나 직접적

으로 두 군을 비교할 수 없는 경우가 있을 수 있다. 이런 경우, 일반적으로 두 군을 비교

하는 메타분석보다 여러 개의 중재군을 비교할 수 있고 간접비교를 가능하게 하는 네트

워크 메타분석을 선호한다.

- 현재의 경제성평가와 관련이 있는 기 수행된 리뷰 또는 결합이 있는 경우, 현재 고려하

는 자료원을 추가로 분석하여 갱신할 수 있다. 이는 추가적인 목적 부합성, 신뢰성, 일치

성을 고려해야 한다. 이러한 추가분석은 이전의 요약 추정치를 현재 분석에 결합하여 갱

신할 수 있다.

- 단지 하나의 자료원이 있는 경우 또는 자료원 간의 차이가 있어서 자료를 합치기 부적절

한 경우에 각 자료원은 모형의 다른 부분에 사용된 자료원과의 목적 부합성, 신뢰성, 일

치성의 관점에서 평가하여야 한다. 다중의 자료원에서 하나의 자료원을 선택하는 경우

에 어떤 자료원이 이러한 기준 사이에서 가장 적절한지 판단해야 한다. 예를 들어, 모집

단의 수준에서 의사결정을 하는 경우에 비무작위배정 관찰연구 또는 행정 데이터베이스

와 이상적인 환경, truncated horizon, 제한적인 선정/제외 기준 아래에서 수행된 RCT와

비교하는 것은 상대적인 목적 부합성과 각각의 자료원의 신뢰성 사이에 선택을 필요로

한다.

- 비슷하게, 비비교 단일군 연구를 사용하여 효과와 이상반응에 대한 모수추정치의 자료

원으로 사용하는 경우 그 자료원의 환자 성격이 모형에서 다른 모수를 평가하는데 사용

된 자료원과 비슷하더라도 모수 추정치의 신뢰성에 대한 우려가 있다.

- 만일 의사결정이 환자가 보고한 이상반응의 추정치를 바탕으로 하는 경우 이러한 단일

군 연구와 방법론적으로 적절한 전문가 의견을 바탕으로 한 자료원 (이 자료원은 신용도

는 높으나 목적부합성에는 맞지 않을 수 있음) 사이의 트레이드오프가 있을 수 있다. 목

적 부합성, 신뢰성, 일치성 사이에서 가장 적절하다고 판단한 자료원의 선택 과정 및 모

수 추정치 방법에 대해서는 경제성평가 보고서에 상세하게 기술하여야 한다.

- 기본 확률적 분석의 맥락이나 시나리오 분석을 이용하여 이러한 트레이드오프의 잠재적

인 의미를 고려하여야 한다. 즉, 신뢰할 만한 추정치이지만 평가의 목적에 부합하는지에

대한 우려(예: 효과 추정치)는 효과와 구간을 적절하게 변경하면서 확률적 분석을 수행

Page 169: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 161 -

하여 평가한다. 모수 추정치의 효과의 크기는 전문가(expert elicitation) 또는 실증적 자

료로 설명한다.

- 추정된 구간은 효과의 크기와 관련된 불확실성 정도를 반영하여 좀 더 넓어져야 한다.

대안으로 기준 간의 가장 좋은 트레이드오프로 판단되는 자료원은 초기의 기본분석에서

사용될 수 있고 다른 잠재적인 자료원에 대한 그 결과의 민감도는 이어지는 시나리오

분석에서 평가할 수 있다.

- 모수를 추정하기 위한 정보가 부족한 경우, 불확실성 분석은 중요한 역할을 한다. 드문

자료와 그에 따른 불확실성에 대한 영향은 reference case probabilistic analysis에서 사

용되는 분포의 넓이와 형태에 반영되어야 하며 추정치의 또 다른 구조적 가정이나 자료

원을 포함한 시나리오 분석을 통하여 평가하여야 한다. 드문 자료를 종합하는 방법(즉,

사건이 없는 연구 군을 다루는 경우)에 대한 토의는 Cooper를 참조할 수 있음.

(2) 호주 PBAC

☐ 각각의 임상시험(자료원)에 대하여 전체 시험 모집단과 관련된 일차평가변수 및 관련 평

가변수의 결과를 제시한다.

❍ 일반적으로 다음과 같은 세부사항을 제시한다.

- 위험수준(at risk) 또는 결과에 해당하는 대상자 수

- (만일 적절하다면) 사건이 발생한 대상자 수

- 사건이 발생한 대상자의 비율, 군별 평군 (표준편차) 또는 중앙값 (사분위 수)

- 각 군별 결과에 대한 신뢰구간

- 결과의 해석

- 후보로 설정된 MCID의 맥락에서의 결과에 대한 논의

❍ 결과표에서 결과 평가의 시점을 제시하는 것은 중요하다. 만일 자료원마다 결과의 측

정시기와 추적관찰 기간이 다르다면 각 결과표 아래에 차이점을 제시한다. 결과해석

에 있어서 임상시험에서 중간분석을 수행하였는지, 이에 따른 조기종료가 있었는지에

대하여 설명한다.

☐ 이분형 자료

- 각 군별 사건 발생 빈도, 상대 빈도, 상대위험 추정치 및 신뢰구간, 위험차이 추정치 및

신뢰구간 등으로 제시한다.

☐ 연속형 자료

Page 170: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 162 -

- 대부분의 임상시험에서 연속형 변수는 베이스라인과 임상시험 진행 중 미리 정한 시점

에서 다시 측정한다. 처치효과는 통계적 방법으로 도출한다. 가장 많이 사용하는 방법은

공분산분석(ANCOVA)이지만 다른 방법도 가능하다. ANCOVA의 결과는 베이스라인을

보정한 평균 변화량의 차이이다. 통계적 보정이 적용된 경우, 보정한 공변수를 제시하고

사용한 통계적 방법의 가정이 적절한지 검토하여야 하며 추정된 처치효과에서의 공변수

보정의 영향 정도를 설명한다.

- 만일 결과변수가 한 번 이상 측정되었고 하나의 시점을 선택하였다면 선택한 시점에 대

한 근거를 제시한다. 선택하지 않은 다른 시점에서의 처치효과가 있는지 검토하고 제시

한다.

- 경제성평가에서 연속형 변수를 범주화하여 분석한 경우 범주화하기 위한 절단점에 대한

근거를 제시한다. 물론 이 절단점은 임상적으로 관련이 있어야 한다. 또한 다른 절단점

을 고려한 민감도 분석을 수행하여야 하거나 군별로 연속형 변수의 누적분포함수를 제

시한다.

☐ 사건까지의 시간 자료 (생존자료)

- 각 자료원별로 카플란-마이어 곡선을 제시한다. (일반적으로 비교군인 경우) 만일 자료

에 접근할 수 없거나 카플란 마이어 곡선이 논문으로 게재되지 않은 경우 이를 명확하게

기술하여야 한다.

- 생존자료의 분석 방법에 관하여 기술한다. 분석의 가정 및 가정의 적절성 검정을 기술한

다. 예를 들어, 생존자료 분석으로 콕스의 비례위험 모형을 수행한 경우 위험비 및 95%

신뢰구간을 제시하며, 비례위험의 가정이 만족하는지 검정하고 결과를 제시한다.

- 만일 비례위험 가정이 만족하지 않는 경우 비교 효과를 추정하기 위한 대안을 제시한다.

제한된 평균 생존시간이 사용된 경우 제한된 평균의 추정치 및 군간 차이를 임상시험

기간 동안의 다양한 시점에서 계산한다.

☐ 순서형 또는 범주형 자료

- 만일 임상시험의 자료가 순서형 또는 범주형으로 측정되는 경우는 연속형 자료에서 제

시한 비슷한 방법을 이용한다. 이런 자료를 분석할 때, 전문 임상통계학자의 자문이 도

움이 된다(특히 이런 자료를 메타분석하는 경우).

- 군 별로 각 시점에서 95% 신뢰구간과 함께 MAUI 결과를 제시한다. 각 시점별로 설문을

할 수 있는 대상자의 수 및 응답한 대상자의 수를 제시한다. 제시하지 못하는 경우 그

이유를 설명하고 시험계획서에 명시된 결과를 제시한다.

- 시험의 중간(또는 적절한)시점까지 구한 평균 효용 가중치 사이의 적분으로서의 군간 차

Page 171: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 163 -

이 및 95% 신뢰구간을 제시한다. 만일 MAUI를 비교하는 다른 방법을 이용하는 경우 그

방법을 자세하게 기술한다.

- 스코어링 알고리즘이 일반 모집단으로부터 도출되지 않은 경우, 가능하면 다른 스코어

링 알고리즘을 이용한 민감도 분석을 수행한다. 포함된 연구에서 둘 이상의 MAUI가 수

행된 경우 그 결과를 비교한 결과를 제시한다.

- 임상시험에서 측정한 다른 평가변수에 대한 결과를 제시한다.

☐ MCID의 맥락에서의 실제효과

- MCID와 관련된 일차평가변수 및 주요한 평가변수의 결과를 설명한다. 대조군과 비교하

는 경우 처치군이 계획한 MCID를 보였는지 기술한다. 신뢰구간이 계획된 MCID보다 작

은 차이값을 포함하였는지 기술한다. 누적분포함수를 제시한다.

- 적절한 통계적 검정을 이용하여 각 군에서 계획된 MCID보다 큰 응답을 달성한 환자의

수를 비교한다. 가능하면 다른 MCID를 이용하여 평가한다.

☐ 비열등성 한계의 적용

- 단측 95% 신뢰구간의 하한(또는 상한)값과 비열등성 한계값을 비교하여 비열등성 한계

가 포함되는지 평가한다. 비열등성 검정은 ITT군과 PP군 모두 수행하고 차이점을 기술

한다. 임상시험에서 비교는 일반적으로 상대적인 측정치를 이용하지만 중요한 차이는

일반적으로 절대 차이로 제시한다. 이런 경우 비열등성 한계를 다른 결과 측정치를 사용

하는 경우 변환하는 방법에 관하여 기술한다. 만일 비열등성이 만족되지 않는 경우 그

이유를 설명한다. 비열등성의 결론을 추가적으로 뒷받침할 수 있는 고려사항을 기술한

다(예: 신청약과 대조약이 같은 종류인데 신청약의 점추정치가 더 좋은 경우, 신청약의

안전성이 좋거나 독성이 낮은 경우).

나) 지침 개정 방안

- 현재 통계적 고려사항을 따로 분리하여 독립적으로 기술하는 지침서는 없다. 통계적인

사항은 전반적인 경제성평가 과정에서 고려되어야 하므로 따로 분리하여 기술하는 것보

다는 지침의 여러 곳에서 필요 시 마다 기술해야 할 필요가 있다. 특히, 모형의 구축,

간접비교 등에서 적절한 통계 및 결과 제시 방법에 관하여 기술해야 한다. 또한, 변화하

는 임상시험 설계 등을 고려한 보정방법 등을 자세하게 기술할 필요는 없으나 주의해야

할 점, 만일 보정 방법을 사용한 경우에 근거와 제한점, 민감도 분석 등에 관한 내용을

포함해야 할 것이다.

Page 172: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 164 -

3) 장기효과 추정을 위한 외삽

가) 현 지침

현 지침에서는 외삽의 타당성 및 가정에 대한 근거를 제시하고 민감도분석을 실시하는 것

을 다음과 같이 권고하고 있다.

☐ 외삽의 정당성

외삽을 위하여 사용되는 가정은 반드시 임상적 타당성을 가져야 하고, 투명하게 보고되어

야 하고, 가정사용을 정당화하여야 한다. 외삽에 대한 여러 가지 가정들의 영향을 비교하기

위하여 여러 가지 시나리오를 고려해야 하는데, 예를 들어 치료효과의 기간 중 치료의 이익

을 언제로 할 것인가에 대한 시나리오는 ① 없음, ② 치료기간과 동일하고 같은 수준으로 유

지, ③ long-term에서 감소 등으로 생각해 볼 수 있다. 모델링 과정에서 연장된 기간에 대하

여 비용과 건강이익을 외삽하는 경우가 있을 수 있다. 치료효과를 외삽하기 위하여 사용되는

가정은 반드시 임상적 타당도를 가져야 하며, 투명하게 보고되어야 하고, 분명하게 정당화되

어야 한다.

❍ 캐나다 CADTH 및 호주 PBAC은 외삽에 대한 좀 더 상세한 가이드라인을 제시하고

있다.

❍ 영국 NICE는 별도의 Technical Support Document를 통하여 상세하게 설명하고 있다.

나) 제외국 지침

(1) 캐나다 CADTH

- 생존자료의 분석에서 자료가 관찰된 기간을 벗어난 장기효과를 추정하기 위해서는 외삽

법이 필요할 수 있다. 장기효과의 외삽은 상태나 질병의 자연사(natural history)와 이용

할 수 있는 자료의 기간을 벗어난 기간에서의 중재의 실제 효과 추정이 필요한 경우에

수행할 수 있다.

- 단기 효과의 모수 추정치를 이용하여 장기 효과를 외삽하기 위하여 일반적으로 모수적

모형을 이용한 생존분석을 사용할 수 있다. 개인 단위의 생존자료를 분석하는 생존분석

법은 많이 개발되어 있다.

- 외삽 모형의 적절성을 고려할 때 중요한 논의사항은 관찰기간을 벗어난 처치효과와 관

련된 가정에 관한 것이다. 먼저 관찰기간을 벗어나서 발생한 효과 추정치의 비율을 보고

Page 173: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 165 -

하고 정당화여야 한다. 이 비율은 단순히 모형에서 고려하는 전체 분석기간에서 추정된

incremental QALY에 대하여 자료가 관찰된 기간에서 추정된 incremental QALY의 비로

측정한다.

- 또한, 처치가 중단된 이후에 축적되는 증가하는 이익 추정치의 비율도 보고하여야 한다.

모형에서 고려하는 전체 분석기간 동안 추정된 incremental QALY에 대하여 처치가 적용

된 기간 동안 추정된 incremental QALY의 비로 측정한다. 이 두 측정값이 임상적으로

가능한 지 평가하는 것은 외삽법의 적절성을 평가하는 데 도움이 된다.

- 어떤 상황이든 지 효과의 모수 추정치 외삽에 대한 근거를 제시하여야 한다. 개인 단위

의 자료를 이용하는 경우, Survival Model Selection Process Algorithm에 정의된 적절한

방법을 이용해야 한다. 확률적 분석을 이용하여 모수의 불확실성에 관한 모든 고려가 필

요하다.

- 구조적 불확실성을 탐색하기 위한 시나리오 분석은 모수적 분석 모형(분포 포함)이 관측

된 자료에 얼마나 잘 적합하는지 평가하기 위하여 비례위험을 가정한 분석과 비례위험

을 가정하지 않은 분석을 각각 실시하고 그 결과를 비교해야 하며 다양한 모수적 분포를

이용해야 한다.

- 자료 관찰 기간을 벗어난 임상적 효과가 지속되는 기간과 그 크기는 외삽에 대한 중요한

판단 근거이다. 외삽의 적절성을 정당화하기 위해서는 외부 자료원을 참조하여야 한다.

적절한 근거없이 상대적인 실제효과(effectiveness)가 처치 동안에 계속 지속된다는 가정

은 부적절하다.

- 처치의 실제효과는 단지 자료가 관찰된 기간 동안만 지속한다고 가정하거나 시간에 따

라 감소한다고 가정하거나 처치 동안은 지속된다고 가정할 수 있다. 이 세 가지 가정 중

에 두 번째 가정과 관련해서 사건 발생 위험의 상대적 감소는 특정한 시점 이후에 감소

를 시작하여 이후 안정적인 감소효과를 보이거나 처치의 효과가 사라질 때까지 시간에

따라 지속적으로 감소한다고 가정할 수 있다.

- 전체 분석기간 중 외삽을 일찍 시도해야 하는 경우 매우 조심해야 한다. 이는 전체 분석

기간에 대하여 평균 생존시간을 추정하기 위하여 잠재적으로 상당한 기간을 외삽해야

한다.

(2) 호주 PBAC

- 관찰된 자료에서의 분석기간에 대한 비용과 효과추정에서 처치와 비교군 간의 모든 중

요한 차이를 추정할 수 없을 경우 외삽은 정당화될 수 있다. 외삽을 하는 경우 외삽방법

에 대한 세부사항을 기술해야 한다.

- 외삽방법을 사용하는 경우 소수의 시험대상자에서 더 이상 사건이 발생하지 않아서 관

Page 174: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 166 -

측된 자료를 신뢰하기 어려운 시점까지는 외삽 모형을 사용하는 것보다 관측된 생존자

료를 이용해야 한다.

- 어느 시점 이후부터 외삽된 전이확률을 사용할 것인지에 대하여 기술하고 근거를 제시

해야 한다. 예를 들어, 임상시험 자료에 적합한 생존곡선이 더 오랜 추적 관찰기간 동안

좀 더 많은 수의 비슷한 환자의 코호트 자료에서 적합한 생존곡선으로부터 벗어나는 시

점을 이용할 수 있다. 민감도 분석에서는 다양한 시점을 선택하여 평가한다.

- 위에서 정한 시점 이후의 전이확률을 외삽하기 위하여 가능하면 관찰된 개인 자료를 바

탕으로 적절하게 추정된 모수적 생존 곡선을 이용한다.

❍ 세부사항은 다음과 같음.

Ÿ 관찰기간 이후에도 비례위험의 가정이 적절한지를 평가한다.

Ÿ 관측된 자료에 다양한 분포를 가정한 모수적 생존분석 모형을 적합한다. (예: 지수,

로그-정규, 로그-로지스틱, 감마, 곰페르츠) 생존곡선 굴절의 다양한 점(point)을 고려

한 비교적 유연한 외삽법을 포함할 수 있다(예: piecewise spline models).

Ÿ 시각적 검사, Akaike’s information criterion (AIC), Bayesian information criterion

(BIC)를 통하여 모형의 적합성을 평가한다. 기본분석을 위한 가장 적절한 모수적 모

형을 선택하고 민감도 분석에서 다른 모수적 모형을 평가한다.

- 관찰기간 이후의 예측값에 대한 타당성을 제시한다. (예: 진행되는 위험비, 처치효과, 교

차지점, 각 군에서의 남은 생존 등)

- 외삽방법으로 추정한 처치효과를 이용하여 분석기간에 대하여 생존곡선을 생성한다. 만

일 처치효과가 유지되거나 증가하지만 이런 현상이 임상적으로 가능하지 않으면, 적절

한 시점에서 두 군의 효과는 동일하다고 가정할 수 있다.

- 외삽한 처치효과를 고려할 때, 처치의 중단 또는 지속에 관한 임상적 결정에 대한 명확

한 고려를 제시하여야 한다. 이와 관련한 모든 가정을 기술하고 정당화하여야 하며 각각

의 처치 비용을 모형화하는 경우 일치성이 있도록 적용해야 한다.

- 경제성평가에서 외삽의 방법에 대한 다양한 참조논문이 있다.

☐ 개인 환자의 외삽에 대한 다른 이슈

- 다중의 중간 또는 결과 사건의 경험을 표현하는 범주형 자료의 경우 어떤 사건에 대한

시간을 모형화하고 합쳐진 사건이 각각의 경쟁적 사건으로의 확률을 정의하기 위하여

다항 로지스틱 모형을 이용하는 두 단계 과정을 이용할 수 있다.

- 가능하다면 시간 변화의 확률을 반영하기 위하여 다항 로지스틱 회귀분석에 시간 변화

공변량을 포함한다. 다른 대안으로는 각 사건에 대한 독립적인 경쟁 위험 모형을 고려할

Page 175: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 167 -

수 있다. 하지만 이 방법은 다중 사건이 독립이라는 가정으로 인해 모수의 불확실성을

과대 추정하는 경향이 있다.

- 연속형 변수에 대해서는 연속형 변수를 범주화하거나 일반화 추정 방정식 방법을 이용

할 수 있다.

☐ 출판된 생존 결과를 이용한 외삽법

- 만일 개인 환자의 생존자료를 이용할 수 없는 경우 그래프 디지타이저 소프트웨어를 이

용하여 출판된 카플란 마이어 곡선으로부터 생존 확률을 외삽할 수도 있다. 대안으로서

관측된 자료가 불안정한 시점의 마지막 굴절되는 지점 이후에 추출된 생존자료에 대하

여 일정한 위험 함수(지수)나 단조 증가하거나 감소하는 위험 함수(와이블 또는 곰페르

츠)를 적합할 수도 있다. 대안으로서 카플란-마이어 곡선으로부터 무진행으로 남아있는

환자의 수가 적어서 관찰된 자료가 불안정해지는 시점 이전의 생존자료를 추출하여 위

험이 일정한 위험함수(지수함수)나 위험이 단조 증가하거나 감소하는 위험함수(와이블

또는 곰페르츠)를 적합할 수도 있다.

- 다른 생존곡선을 적용한 후 적합도 검정을 수행하고 기본분석으로 가장 적합도가 높은

곡선을 사용해야 한다.

다) 지침 개정방향 제언

- 외삽과 관련한 방법과 주의해야 할 사항을 지침서에 포함해야 한다. 주로 생존분석에서

OS를 추정하기 위한 외삽이 많이 발생하므로 생존분석을 포함하여 외삽부분을 기술할

필요가 있다.

Page 176: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 168 -

4) 처치전환 보정

윤리적인 이유 등으로 처치전환을 고려한 임상시험 설계는 비교적 최근에 수행되고 있다.

이러한 임상시험에서는 일반적으로 대조군에서 progression이 발생하게 되면 그 이후 새로운

처치로 전환을 허용하여 추적관찰을 진행한다. 이 경우 intention to treat 분석군을 이용하여

처치군과 대조군 사이의 OS를 비교하면 대조군의 OS가 과대평가되어 처치군과 대조군 사이

의 OS 차이는 과소평가될 수 있다. 통계적 인과관계 추론의 관점에서 이러한 처치전환을 보

정한 방법론이 개발되고 있으나 현재의 지침에서는 이를 반영하고 있지 않다.

가) 현 지침

현 지침은 처치전환에 대한 통계적 고려사항을 별도의 지침으로 제시하고 있지 않다.

나) 제외국 지침

(1) 호주 PBAC 처치전환 보정

- 기본적으로 처치전환이 없는 자료나 근거를 선호한다.

- 모형에 사용한 자료원 중 처치를 전환한 대상자가 있는 경우 전환의 패턴이 비교군에서

의 현재 임상 관행과 처치에 대한 미래의 임상 시행이 일치하는지 평가해야 한다. 만일

그렇지 않으면 관측된 비교 처치의 효과가 기대되는 처치 효과를 반영하지 않을 수 있

다. 이러한 경우는 보정이 적절할 수 있다.

- 처치 전환을 보정하는 방법의 적절성은 방법에서 사용한 가정에 의존한다. 하지만 이러

한 가정의 타당성을 평가하는 것은 매우 어렵다. 보정방법은 실제 비교 처치 효과를 과

대 추정하는 위험을 낮추는 방법이어야 한다.

❍ 선호하는 방법들

- 임상시험의 각 군에서의 처치 전환의 메커니즘을 설명해야 한다. 각 군에 대해 다음을

기술한다.

• 전환이 일어난 약물

• 전환의 정도

• 비교군에서 처치군으로 전환이 현재 임상환경을 반영하는지의 여부(또는 차이점)

• 만일 처치로 전환한 약물의 리스트가 있으면 처치군에서의 전환이 현재 임상환

Page 177: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 169 -

- 만일 전환(예상되는 전환의 비율)이 현재(비교군) 또는 미래(처치군)의 임상환경과 비슷

하면, 이러한 군에서의 처치전환의 효과를 보정하는 것은 부적절하다.

- 만일 전환(또는 전환의 정도)이 현재의 임상환경을 반영하지 않으면 차이점을 기술하고

다음의 이슈를 다루어야 한다.

- 처치전환을 보정하기 위한 분석방법이 임상시험 계획서에 미리 명시되었는지 기술한다.

처치전환 보정을 설명한 임상시험 계획서의 섹션을 참조하여 기술한다.

- 처치전환 이전의 참여자 특성과 함께 변환군과 변환하지 않은 군의 베이스라인 특성을

제시한다. 만일 시험대상자가 병이나 상태의 악화로 인하여 처치전환이 일어났다면 실

제 악화되어 처치를 전환한 대상자군과 악화되었으나 처치를 전환하지 않은 대상자의

특성을 제시한다.

- 전환의 이유(예: 병세의 악화, 이상반응 등)및 이유별 환자 수를 제시한다.

- 처치전환을 보정하여 생존곡선을 추정하는 몇 가지 방법이 개발되어 사용되고 있다. 만

일 비교군의 추정치가 명확하게 효과가 없는 방향으로 추정된다면 단순한 보정방법은

수용 가능함. 좀 더 복잡한 보정방법들은 타당성을 검정하기 매우 어려운 가정에 의존한

다. (예: inverse probability of censoring weights, a rank-preserving structural failure

time model, 2-stage methods)

- 적용한 방법의 가정과 어떻게 그 가정을 검정하였는지에 대한 세부사항을 보고하고 각

방법의 가정의 적절성을 포함하여 선택한 방법의 정당성을 자세하게 기술해야 한다.

- 처치전환을 보정한 처치효과의 추정치와 관련된 불확실성을 줄일 수 있는 추가적인 근

거와 논의사항을 제시한다. 만일 복잡하거나 새로운 방법론이 사용되었다면 많이 사용

하는 다른 보정방법의 결과도 제시하고 왜 이러한 방법을 사용하였는지에 대한 정당성

을 제시해야 한다.

- 좀 더 복잡한 방법이 사용된 경우 비교를 위하여 좀 더 단순한 방법의 결과도 제시하여

야 한다.

- 방법에 대한 세부적인 논의가 필수적인 경우 기술적인 추가문서로 제시한다.

☐ 처치전환 보정의 결과

- 처치전환을 보정한 처치의 효과를 추정하기 위한 각 방법에 대하여 보정된 추정치와

95% 신뢰구간을 제시한다. 적용한 보정방법들 간의 처치효과의 이질성을 기술한다. 처

치전환이 없는 경우에 대한 처치효과의 추정치 및 95% 신뢰구간을 제시한다.

경을 반영하는지의 여부

Page 178: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 170 -

- 가능하면 처치전환을 보정한 후 각 군의 카플란 마이어 생존곡선 (95% 신뢰밴드를 포함

하여)을 제시한다. 그림과 함께, 임상시험의 추적기간 동안 정기적인 시점별로 중도탈락

된 대상자 및 아직 사망이 발생하지 않은 대상자의 수를 제시하는 각 군별 위험 빈도표

를 작성한다.

- 복잡한 통계적 방법을 사용한 경우 처치전환이 없는 처치군(예: 과거 대조군)을 연구 보

고한 논문을 충분히 검색한다. 검색된 논문에서의 결과를 현재의 시험에 적용할 수 있는

지 고려한다. 처치전환이 없는 연구에서의 카플란 마이어 곡선을 현재 보정된 카플란 마

이어 곡선과 비교하고 다른 점이 있다면 이유를 설명한다.

- 처치전환 발생 전의 결과를 이용한 추정치(예: PFS)가 있는 경우 그 결과가 임상적으로

관련성 있는 결과(예: OS)의 대리지표가 될 수 있는지 설명한다. 예를 들어, 만일 PFS가

OS의 적절한 대리지표라면 PFS를 변환하여 추정한 OS 추정치와 통계적 방법으로 처치

전환을 보정하여 추정한 OS를 비교한다.

- 가능하면 처치전환을 보정하기 위한 다양한 통계적 접근법을 이용한다. 다양한 방법을

적용한 결과가 비슷하다면 이는 추정치에 대한 불확실성을 줄이고 결과의 신뢰를 높일

수 있다. 과거 대조군과의 비교 또는 대리지표를 이용하여 변환하여 추정한 OS는 통계

적 접근법에서 신뢰성을 높일 수 있다.

☐ 부집단 또는 간접비교를 통한 처치전환 보정

- 부집단 또는 간접비교를 이용하여 처치전환을 보정하는 경우 추정치에 바이어스가 발생

할 위험이 있다. 부집단 또는 간접비교를 이용하는 것은 낮은 수준의 근거라고 할 수 있

다. 따라서, 이러한 방법은 병행하지 않는 것이 좋다.

(2) 영국 NICE

- 임상시험의 대조군에 포함된 환자가 추적관찰 기간 동안 어느 시점에 시험 처치군으로

전환을 허용하는 경우에 처치전환이 발생한다. 처치전환은 암치료제의 임상시험에서 흔

히 발생한다.

- 처치전환이 발생하는 경우 무작위 배정된 대로 군을 유지하여 분석하는

intention-to-treat 분석을 이용하여 OS를 분석하면 결과에 바이어스가 발생할 수 있다.

만일 대조군의 환자가 처치군으로 처치전환하고 새로운 처치로부터의 이익이 발생하면

새로운 치료의 OS에 대한 처치효과는 과소추정된다.

- 생존에 영향을 주는 처치에 대하여 NICE는 분석기간 전체를 고려하는 경제성평가를 필

요로 한다. 이 때 ITT분석은 적절하지 않으므로 처치전환으로 인하여 바이어스가 발생할

Page 179: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 171 -

수 있다.

- 처치전환이 발생한 경우 생존의 추정을 보정하기 위한 다양한 통계적 방법이 있다. 하지

만, 이런 방법은 강한 가정을 바탕으로 하며 가정에 매우 의존한다. 처치전환 시점에서

중도절단된 것으로 간주하거나 처치전환된 대상자를 분석에서 제외하는 단순한 보정방

법은 처치전환이 예후와 관련될 가능성이 높기 때문에 선택 바이어스가 발생할 가능성

이 매우 높다.

- 만일 가정이 만족 되면 이론적으로 바이어스가 없는 결과를 주는 좀 더 복잡한 보정방법

을 사용할 수 있다. Rank Preserving Structural Failure Time Models (RPSFTM)과

Iterative Parameter Estimation (IPE) 알고리즘은 반사실적인 생존시간(처치전환된 환자

에게서 만일 처치전환을 하지 않았더라면 관측했을 생존시간)을 추정하기 위한 무작위

배정을 바탕으로 한 분석방법이다.

- Inverse Probability of Censoring Weights (IPCW) 방법은 관측된 자료를 바탕으로 한 분

석으로 처치전환이 일어난 경우 그 시점에서 중도절단된 것으로 고려하고 처치전환이

일어나지 않은 대상자는 가중치를 이용하여 보정하는 방법이다.

- 이러한 방법별 가정, 장점, 단점을 포함하여 방법론을 NICE TSD에 상세하게 기술한다.

☐ NICE TSD: Rank preserving Structural failure time model (RPSFTM) and iterative

parameter estimation (IPE) algorithm method

- RPSFTM과 IPE 방법은 무작위배정에 근거하여 처치전환을 보정하는 방법이다. RPSFTM

은 모형의 가정을 만족하는 효과를 추정하기 위하여 g-추정치 방법을 사용한다. 반면

IPE 알고리즘은 효과를 추정하기 위하여 반복적인 모수적 과정을 사용한다. 따라서, IPE

방법은 생존시간은 모수적 분포를 따른다는 추가적인 가정이 필요하다.

❍ RPSFTM

- 일반적인 단일 모수 RPSFTM은 각 환자에서 관측된 생존시간(Ti)을 처치를 받지 않을 때

의 생존시간(TAi)과 처치를 받는 동안의 생존시간(TBi) 둘로 분리한다. 처치군으로 무작

위 배정되고 대조군으로 처치전환이 일어나지 않은 군에서 TAi는 0이다. 대조군으로 무

작위 배정되고 처치군으로 처치전환하지 않은 군에서의 TBi는 0이다. 하지만 처치전환

이 발생하지 않은 군(즉 순응이 불완전한 군)에서는 TAi와 TBi 둘다 0보다 크다.

- 이 방법에서 잠재적인 결과변수인 Ui를 다음과 같은 인과적 모형으로 설정한다.

(1)

Page 180: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 172 -

- 여기서 는 중재와 관련된 acceleration factor (AF)다. 대상자가 중재군인 경우는 1로

대조군인 경우는 0으로 이분형 과정을 정의하면 인과모형 (1)은 다음과 같이 다시 정의

할 수 있다.

exp

- 이 모형에서 모수는 g-추정법을 이용하여 추정할 수 있다. ψ의 잠재적인 값들의 범위를

고려한다. 모형 (1)을 이용하여 추정된 Ui로 처치효과인 ψ에 대하여 가능한 값을 포함하

는 범위에 대한 격자 탐색방법을 수행하여 모수를 추정한다. ψ의 실제값은 U(ψ)는 무

작위 배정된 군과 독립이다. Mark와 Robins (1993)에 기술된대로, 베이스라인(반사실적)

생존곡선은 두 군 간에 동일하다는 RPSFTM g-검정은 비모수적으로 로그순위 검정이나

윌콕슨의 검정을 이용할 수 있고 모수적으로는 Wald 검정을 할 수 있다. RPSFTM 방법

으로 추정한 반사실적 생존시간이 주어지면 Cox의 비례위험 모형을 이용하여 보정된 위

험비(hazard ratio: HR)를 추정할 수 있다.

- RPSFTM은 intention to treat 분석에서의 p-value를 유지한다. 보정된 신뢰구간은 이를

기반으로 계산할 수 있다. 즉, 만일 ITT가 통계적으로 유의한 처치효과를 보이지 못하면

RPSFTM으로 보정한 분석도 유의한 처치효과를 보이지 못한다.

- Branson과 Whitehad는 IPE 과정을 통한 모수적 방법을 이용하여 RPSFTM을 확장했다.

RPSFTM과 같은 ACF 모형을 이용하지만 초기의 ψ를 추정하기 위하여 보정되지 않은

ITT 자료에 모수적 failure time model (예: 와이블, 로그-로지스틱, 로그-정규분포)을 적

합한다.

- 처치전환한 대상자의 관측된 failure time은 와 수식 (1)의 반사실적 생존시간 모형을

이용하여 변환되고 처치군과 대조군을 다시 모수적 모형을 이용하여 비교한다. 이 과정

은 ψ를 갱신하고 변환군의 반사실적 생존시간을 다시 추정하는 과정을 반복한다. 이 반

복과정은 가 수렴할 때까지 계속한다.

- IPE와 RPSFTM 방법은 비슷한 가정 기반을 갖는다. 처치가 주어진 시간에 관련된 처치

효과는 모든 대상자에게서 같다 (common treatment effect assumption). 처치 생존시간

의 부재는 무작위 배정군과 독립이다. Branson과 Whitehead방법은 추가적으로 생존시간

이 모수적 분포를 따른다고 가정한다.

- 처치를 받은 군의 반사실적 중도절단 시간과 예후와의 관련성 때문에 IPE와 RPSFTM방

법에서 중도절단은 문제가 있다. Administrative 중도절단 시간인 Ci와 exp 중 최

소값에서 를 재중도절단함으로써 중도절단과 받은 처치 간의 관련성을 단절하여

편향을 줄일 수 있다. 만일 인 경우 를 반사실적 생존시간인

Page 181: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 173 -

의 중도절단 시간으로 대체한다.

- IPE와 RPSFTM방법의 주요한 제한점은 대상자는 항상 “on” 또는 “off” 상태의 단순

한 두 가지 처치 상태 만을 고려한다는 점이다. (즉, 처치를 받는 중 “on” 또는 받지

않는 중 “off”) 비교군이 활성인 경우 이는 분석에서 문제가 발생할 수 있다. 다중의

상태를 고려한 다중 모수 모형을 생각할 수 있으나 이러한 분석은 검정력이 부족하고

인과영향을 의미있게 설명하기 위한 점 추정치를 얻을 수 없는 단점이 있다.

- 두 가지 상태를 고려한 모형으로 제한하여 “on treatment”를 바탕으로 한 IPE와

RPSFTM 분석방법은 “on treatment”가 아닌 기간은 “off treatment”로 간주한다. 그

리고 이런 기간 동안 받은 어떠한 처치도 효과가 비슷하다고 고려한다. 비교군이 위약군

이거나 고식적 치료인 경우 두 상태 모형은 합리적이다. 하지만, 비교군이 활성 처치인

경우이고 사후치료가 비활성인 경우 두 상태 “on treatment”모형은 아마도 임상적으

로 적절하지 않을 것이다. 활성 대조군과 비활성 사후치료를 하나의 “off”군으로 묶는

것은 비교군과 관련된 효과를 희석하고 따라서 처치의 효과를 과대추정할 수 있다.

- 이러한 경우 대조군이 받은 시퀀스와 비교하여 처치군이 받은 전체 처치 시퀀스의 처치

효과를 추정하기 위하여 처치군 분석(treatment group)을 시행하는 것이 합당할 수 있다

(처치 전환을 고려하기 위하여 보정하지 않은 경우). 대조군에서 처치군으로 전환하는

경우 이 대상자는 처치군의 처치 시퀀스로 전환한다고 가정한다.

- 전환한 대상자가 받는 처치 시퀀스는 초기에 무작위 배정으로 처치군에 할당된 대상자

가 받는 처치 시퀀스와 동일하며 그 시퀀스의 상대적 효과는 처치군에서의 상대적 효과

와 비슷하다는 가정이다. 따라서, “common treatment effect” 가정은 처치군 단독을

의미하는 것은 아니고 전환 후 받는 처치의 집합을 의미한다.

- “on-treatment” 분석에서 단순한 two-exposure model 군은 여전히 “on”상태에서

처치를 받은 시간은 추후의 처치 중단을 무시하고 시험군을 시작한 후의 모든 시간과

처치의 “off”상태에서의 시간은 시험 처치를 시작하기 이전의 모든 시간, 만일 전환이

일어나지 않은 경우 대조군 처치를 중단한 시간을 포함하여 합친다.

- 따라서, 이런 분석은 시험 처치 및 활성 대조 처치와 관련된 실제 효과를 희석할 수 있

다. 두 처치군에 대해서 처치 중단 이후의 시간은 다른 처치를 따르기 때문이다. 하지만,

새로운 처치의 인과효과를 제공하지 않는 반면 이 방법은 대조군보다는 무작위 배정으

로 할당된 시험 처치군의 처치효과를 타당하게 추정할 수 있다.

- “on treatment” 분석에서 단지 비교군의 효과를 희석하는 것 보다, “treatment

group” 접근법은 post-treatment가 비슷하고 처치전환한 대상자와 처음부터 처치군에

배정된 대상자에게서 효과가 비슷한 경우와 특별히 시험 처치와 관련된 이익이 처치중

단 이후에도 유지될 때, 두 군 모두의 효과를 희석하고 따라서, 비교군이 활성이고

Page 182: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 174 -

post-treatment와 다른 경우에 선호된다.

- “treatment group” 접근법은 무작위 배정된 군에서 post-study treatments를 받은 군이

실제적 처치의 경로를 대표한다는 가정이 필요하다. 이 경우 만일 post-study therapy에

의해 차후에 발생한 이익이 이전 처치에 따라서 다르다면 실제적 의료기술 평가 또는

경제성평가의 관점에서 이런 이익은 시험처치의 결과로 보는 것이 적절할 수 있다.

❍ Inverse Probability of Censoring Weights (IPCW)

- IPCW는 informative 중도절단이 있는 경우 처치효과를 보정하기 위한 주변구조모형

(marginal structural model)에서 사용되는 방법이다. 임상시험 자료는 대상자의 관측치가

사망 또는 중도절단까지의 시간으로 기록된다. 대조군에서 시험처치로 처치전환하는 경

우, 이 대상자는 전환시점에서 중도절단된다.

- 대조군에 남아있는 다른 대상자들, 즉 처치전환이 발생하지 않은 대상자들의 생존시간

은 베이스라인과 시간에 따른 예후 공변량의 값을 기반으로 계산된 가중치를 이용하여

보정한다. 처치전환 시점에서 인위적으로 중도절단된 대상자는 만일 처치전환이 베이스

라인과 시간의존적인 예후 요인과 관련이 있으면 선택편향이 발생할 수 있다.

- IPCW 방법은 이러한 선택편향을 최소화하기 위하여 안정된 가중치를 이용한다. 처치전

환한 대상자와 비슷한 특성을 가진 전환하지 않은 대상자에게 큰 가중치를 부여한다. 근

본적으로 IPCW는 처치전환하지 않은 대조군의 대상자에게 가중치를 부여함으로써 대조

군에 대한 가모집단(pseudo-population)을 구성한다. 따라서, 상대적으로 적은 수의 대조

군 대상자가 전환하지 않으면 오차가 있을 수 있다.

- 안정화된 가중치를 구하고 이를 이용하여 보정된 처치효과를 추정하기 위하여 주변구조

모형(MSM)을 이용한다. MSM은 가중치, 베이스라인 예후 공변수를 포함하는 시간의존

콕스 모형을 사용할 수 있다. 이 모형의 결과는 IPCW로 보정된 위험비(hazard ratio)로

제시할 수 있다. 카플란-마이어 추정치나 로그-순위 검정도 IPCW로 보정할 수 있다.

- IPCW 방법은 “no unmeasured confounders” 가정에 의존한다. 이는 독립적으로 처치

전환으로 인하여 발생하는 informative 중도절단을 예측할 수 있는 사망에 대한 모든 시

간 의존적인 예후 요인과 관련된 자료가 있어야 IPCW가 바이어스 없는 결과를 제공할

수 있다는 가정이다. 따라서, 이러한 보정방법을 사용하기 위해서는 임상시험에서 보정

에 사용할 변수 및 자료를 미리 충분하게 수집하여야 한다.

- 이 가정의 타당성에 관해서 관측한 자료로는 검정할 수 없다. 처치전환을 고려한 생존모

형은 올바르게 설정해야 한다. 만일 처치전환을 항상 유발하는 공변수가 있다면 이 방법

은 적절하지 않다. 또한, “no unmeasured confounder”의 가정이 성립하더라도 대조군

의 표본수가 작으면 IPCW의 결과는 바이어스가 있을 수 있다.

Page 183: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 175 -

다) 지침 개정방향 제언

- 달라지는 임상시험 설계 및 환경을 반영하여 처치전환의 보정을 고려하는 내용을 지침

서에 포함할 수 있다. 영국의 TSD처럼 자세할 필요는 없으나 호주와 같이 보정에서 고려

하고 주의해야 할 사항을 포함하여 지침에 기술할 필요가 있다.

Page 184: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 176 -

5) 새로운 시험 설계

가) 현 지침

현 지침은 새로운 시험설계에 대한 통계적 고려사항을 별도의 지침으로 제시하고 있지 않

다.

나) 제외국 지침

(1) 캐나다 CADTH

- 적응형 임상시험설계는 새로운 설계 중 많이 사용하는 설계이다. 적응형 시험설계는 임

상시험 중 중간분석을 실시하고 통계적 방법을 이용하여 제1종의 오류를 적절하게 조정

하여 표본 수, 배정비율, 처치군의 수 등을 변경하여 임상시험을 계속할 수 있는 설계이

다.

- 적절한 자료원을 선택할 때 자료의 해석과 사용에 영향을 줄 수 있는 특성을 고려하여

임상시험 설계를 평가한다. 새로운 임상시험 설계 방법이 개발되고 사용되는 추세이므

로, 다른 자료원이 존재하는 경우, 기본분석에서는 이런 자료원을 이용하고 새로운 설계

로부터의 정보의 영향은 시나리오 분석에서 고려한다.

다) 지침 개정방향 제언

- 새로운 임상시험에 대한 내용은 캐나다 CADTH에서 아주 간략하게 기술하고 있다. 개정

되는 지침서에는 이 내용을 간략하게 포함할 수 있다.

Page 185: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 177 -

6) 비열등성 임상시험 및 비열등성 한계

가) 현 지침

현 지침은 새로운 시험설계에 대한 통계적 고려사항을 별도의 지침으로 제시하고 있지 않

다.

나) 제외국 지침

(1) 호주 PBAC

- 비열등성이란 처치군이 활성 대조군보다 효과와 안전성에서 열등하지 않다는 의미이다.

비동등성 검정에서 통계적 유의성을 확보하지 못하는 것이 적절하게 비열등성을 증명하

는 것은 아니다. 비열등성 검정 방법으로 가장 많이 사용되는 방법은 효과의 군간 차이

의 신뢰구간이 미리 정한 임상적으로 중요한 차이 정도를 포함하지 않는 것이다.

☐ 비열등성을 입증할 변수의 선택

- 일차평가변수 또는 환자와 관련된 가장 중요한 결과변수에 대하여 비열등성 한계를 설

정한다. 만일 처치군이 두 가지의 다른 적응증에 영향을 준거나 두 개의 적응증에 영향

을 주는 두 가지 성분으로 구성되어 있다면 두 가지 적응증에 일차평가변수와 환자와

관련된 가장 중요한 결과변수에 대한 비열등성 한계를 설정한다.

☐ 비열등성 한계 설정의 근거

- 처치군이 활성대조군보다 중요한 차이만큼 비열등하지 않음을 확인할 수 있는 비열등성

한계를 설정한다.

- 결과변수에서 비열등성 한계로 사용할 수 있는 임상적으로 중요하지 않은 차이의 정도

를 제시한다. 비열등성 한계의 설정 방법에 대한 근거를 제시한다. 이는 통계적 방법만

으로는 부족하고 다양한 자료원에서의 근거 및 전문가의 동의가 필요하다. 임상적으로

중요한 최소 차이보다 작은 값으로 설정하는 것이 일반적이다.

☐ 미리 정한 비열등성 한계

- 수행된 임상시험에서 비열등성 한계를 이미 설정하였다면 그 한계를 제시하고 근거를

Page 186: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 178 -

기술한다. 이 한계의 설정 근거를 기술함. 수행된 임상시험의 계획서에 기술된 근거를

제시한다. 만일 수행된 임상시험의 계획서에 기술된 근거가 충분하지 않으면 뒷받침할

수 있는 추가 근거를 제시한다.

- 어떤 비열등성 임상시험은 신약이 위약에 비하여 우월함을 함께 증명할 수 있도록 설계

된 경우가 있다. 하지만, 이런 경우에도 비열등성 한계는 활성 대조군에 비하여 처치효

과의 중요한 감소를 허용한다. 이런 경우, 한계를 재설정하고 비열등성을 다시 검정한다.

☐ 미리 정하지 않은 비열등성 한계

- 만일 비열등성 한계가 미리 설정되지 않았다면 사후적으로 한계를 설정하는 것을 정당

화하는 것은 쉽지 않으며 선호되지 않는다. 이런 경우는 보수적으로 한계를 설정하여야

할 것이다. 사후적 비열등성 한계를 설정하는 경우는 다음을 포함할 수 있다.

• 신약 대비 비교약의 우월성 검정을 실시하였으나 이를 보일 수 없는 경우

• 공통대조군을 통한 신청군과 비교군의 간접비교

• 수행된 비열등성 임상시험에서의 일차평가변수와 경제성평가의 효과의 결과변수

가 다른 경우

- 사후적으로 한계를 설정하는 경우, 가능하면 여러 자료원을 이용하여 한계설정의 근거

를 제시한다. 이때 여러 자료원의 비열등성 한계 설정이 비슷하여야 한다. 비열등성 한

계로 하나의 값을 설정한 근거를 제시한다.

다) 지침 개정방향 제언

- 호주와 같이 간략하게 비열등성 임상시험과 한계를 설명하고 경제성평가에서 비열등성

을 입증하는 경우에 기술해야 할 내용을 지침에 포함할 수 있을 것이다.

Page 187: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 179 -

7) 생존분석 및 생존분석 모형의 선택

가) 현 지침

현 지침은 새로운 생존분석에 대한 통계적 고려사항을 별도의 지침으로 제시하고 있지 않

다.

나) 제외국 지침

영국의 경우 Technical Support Document에서 생존분석 및 외삽에 대한 내용을 자세하게

기술하고 있으며 캐나다와 호주는 외삽 부분에 생존분석에 관하여 기술하고 있다.

다) 지침 개정방향 제언

아래의 내용을 지침에 포함할 수 있을 것이다. 만일 아래의 내용이 지침에 포함하기에 너

무 세부적이거나 좀 더 자세한 내용을 전달하고자 하는 경우는 영국과 같이 세부 지침서나

기술문서로 분리하여 작성할 수도 있을 것이다.

- 시작시점으로부터 사건이 발생할 때까지의 시간을 효과의 평가변수로 사용하는 경우 생

존분석 방법을 적용할 수 있다.

- 임상시험에서는 주로 처치 시작부터 병이 진행되는 시점까지의 시간(무진행 생존) 또는

사망이 발생할 때까지의 시간(전체 생존)을 평가한다.

- 생존자료의 특성은 시간은 0보다 크고 일반적으로 정규분포의 가정이 적절하지 않으며

무엇보다도 임상시험 기간 동안 모든 환자에게서 사건이 발생하는 것은 아니며 또한, 추

적관찰 동안 임상시험에서 중도탈락이 발생할 수 있다. 이러한 대상자의 생존시간은 중

도절단 되었다는 특성을 갖는다.

- 이런 특성을 고려한 생존자료 분석법은 모수적, 준모수적, 비모수적인 방법이 있다. 일

반적으로 생존분석 방법에서는 이러한 중도절단은 무작위로 발생하였다고 가정한다

(즉, non-informative censoring). 이 가정은 평가되어야 한다.

- 생존자료를 이용한 처치군의 효과는 대상자를 추적관찰한 기간 동안에 한하여 평가한

다. 무작위배정 임상시험에서의 생존 비교는 비모수적인 방법인 카플란-마이어 곡선으

로 생존곡선을 추정하고 로그-순위 검정으로 군 간의 차이를 검정할 수 있다. 비교효과

의 추정은 준모수적 방법인 콕스의 비례위험 모형을 이용하여 생존자료를 적합한 후 군

간 효과의 비교 측정치를 위험비(hazard ratio; HR)로 제시할 수 있다.

- 하지만, 의약품 경제성평가에서는 모형의 분석기간 전체의 효과를 추정하기 위해서 추

적관찰 기간 이후의 효과를 외삽해야 하는 경우가 있다. 외삽을 하기 위해서는 분포가정

Page 188: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 180 -

을 하지 않는 비모수적 또는 준모수적 방법보다는 모수적 방법을 이용한다.

- 모수적 생존분석 방법은 가정한 분포에 따라 외삽의 결과가 민감할 수 있으므로 가장

적절한 분포를 선택하는 것이 중요하다.

- 적절한 분포의 선택을 하는 방법은 카플란-마이어 생존 곡선 위에 다양한 분포를 고려

한 분석결과로 추정한 생존 곡선을 겹쳐 그려서 얼마나 시각적으로 잘 적합하는지 평가

할 수 있다.

- 또한, 다양한 모형을 고려할 때 AIC와 BIC 등의 기준값을 이용하는 방법이 있다. 이런

기준값은 가능도 적합값에 생존모형에 포함한 모수 및 자료의 수를 고려한 함수로 정의

에 의하여 이런 기준값이 작을수록 모형이 좀 더 적합하다고 판단한다.

- 로그-누적 위험 그림을 시각적으로 판단하여 모형의 적합성을 판단할 수 있다. 로그-누

적 위험 그림은 log{–log(t 시점에서 추정된 생존곡선)}을 y축에 log(t 시점)을 x축에 그린

그림으로 지수 분포와 와이블 분포의 경우 가정이 적절하면 이 그림은 직선에 가깝게

된다. 다른 분포들을 평가하기 위해서는 수정된 로그-누적 위험 그림을 이용할 수 있다.

- 또한, 카플란-마이어를 적합한 로그-누적 위험 그림은 위험이 어느 시점 이후에 변하는

지, 비례위험모형이 가능한지, 어떤 분포를 적합할지, piecewise 생존곡선을 적합할지에

대한 정보를 줄 수 있다.

- 위에서 언급한 방법은 자료가 있는 구간에서 처치의 효과를 평가하는 데 적절한 방법이

다. 관찰기간 이후에는 자료가 없으므로 위의 방법으로 적절하다고 판단한 모형이 실제

는 적절하지 않을 가능성이 매우 높게 존재한다.

- 하나의 모형에서 군 변수를 포함하여 두 군의 효과를 추정하거나 비교하는 것이 일반적

이다. 이는 비례위험 등의 모형의 가정이 만족되는 경우에 적절하다. 하지만, 모형에서

비례위험 등의 가정이 적절하지 않는 경우는 각 군별로 적절한 분포 가정이 만족하는

생존모형을 적합하여 생존곡선 및 효과를 추정하는 것이 필요할 수도 있다.

- 또한, 관찰기간 동안 적합한 모형에서의 군간 차이를 이용하여 추적관찰 이후를 외삽하

므로 두 군의 차이가 지속적으로 반영되어 전체적인 효과 차이가 과대 추정될 가능성이

높다. 이는 보수적인 모형을 선택해야 하는 근거이다.

- 따라서, 적절한 외삽을 선택할 때에는 다양한 방법으로 평가하여야 하며 그 결과는 임상

적인 추론과 적합하여야 한다.

- 다양한 모형을 적합한 후 그 중에서 가장 적절하고 상대적으로 보수적인 모형을 선택하

여 기본분석으로 사용하여야 한다.

- 불확실성을 평가하기 위해서 여러 가지 다른 가정에서의 결과도 민감도 분석으로 제시

하여야 한다.

- 만일 처치군과 대조군의 생존곡선이 추적관찰 기간 동안 역교차하거나 만나는 경우는

Page 189: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 181 -

그 시점 이후의 군 간 효과는 동일하다고 가정하는 것이 합리적이다.

- 이 경우 한 가지 문제는 임상시험의 관찰기간이 길어서 두 군의 생존곡선이 교차함을

확인하는 경우에는 그 시점 이후의 효과차이가 없다고 외삽하지만 만일 임상시험의 관

찰기간이 짧은 경우 그 기간 동안의 효과의 차이가 관찰기간이 긴 임상시험과 비슷하고

이 후에 만날 가능성이 높지만 자료의 부재로 인하여 장기효과가 있는 것으로 외삽될

수 있다. 이 경우는 단기 관찰한 임상시험을 자료원으로 사용하는 경우 효과가 과대추정

될 수 있으므로 주의해야 한다.

- 경우에 따라서는 관찰기간 동안은 임상시험 자료를 사용하고 관찰기간 이후는 외부의

과거(historical) 자료원을 이용하는 경우가 있다. 이 경우는 자료원의 타당성, 즉 외부 자

료원이 얼마나 현실을 반영하는지 임상시험 자료원과는 차이가 없는지 등에 대하여 자

세하게 평가하여야 한다.

Page 190: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 182 -

차. 할인율

1) 현 지침

가) 주요 지침

미래에 발생하는 비용과 결과를 현재가치로 평가하기 위해 비용과 결과 모두 연간 5%의

율로 할인한다. 더불어 비용, 결과 모두 할인하지 않은 경우(0%)와 3%, 7.5%의 할인율을

적용한 경우를 민감도 분석을 통해 제시한다.

나) 지침 내 추가 설명

2006년에 경제성평가 지침 초판을 발간한 이후 10여년간 5%의 동일한 할인율을 적용해 왔

으나, 국내의 경제상황이 변화하여 사회적 할인율이 지속적으로 하향 조정되어 경제성평가

지침의 할인율도 인하의 필요성이 있다는 주장이 꾸준히 제기되어 왔다. 이에 할인율을 어느

정도 인하할 것인지, 또한 과거와 같이 보건의료분야에 대한 정책적 배려로 사회적 할인율보

다 낮은 할인율을 적용할 것인지에 대한 검토가 필요하다.

... 할인율(discount rate)의 수준과 관련하여서는 국가별로 약간의 차이가 있는데, 이는

각국이 처한 경제현실, 그리고 공공투자부문의 경제성 분석에 사용하는 공지된 할인율

값이 존재하는지, 그 값이 얼마인지에 따라 달라진다. 보건의료기술평가와 관련한 다수

가이드라인에서는 5%를 기본 할인율로 제시하고 있다. 그리고 할인이 결과에 미치는 영

향을 살펴보기 위해, 그리고 나중에 다른 할인율을 적용한 경우와 비교할 때를 대비하여

할인을 하지 않은 경우와 3%의 할인율을 적용한 경우를 민감도 분석하도록 하고 있다.

우리나라의 경우 공공투자부문의 타당성 분석에는 7-13%의 할인율이 사용되어 왔다. 그

러나 한계생산성과 소비이자율의 하락으로 최근에 올수록 적정 할인율이 낮아지고 있는

바, 이규방 등(2001)의 연구에 의하면 1999년과 2000년의 평균 사회적 할인율은 7.3% 수

준이었고, 향후 몇 년 동안은 7-8%의 수준을 적용하는 것이 바람직하다고 한다. 그러나

이 같은 할인율은 일반 공공투자사업의 타당성 평가에 적용하는 할인율이고 수자원개발

사업, 환경시설사업, 낙후지역 개발사업 등 간접적 편익이 크거나 정책적 배려가 필요한

사업에 대해서는 다른 할인율을 적용할 수 있다. 이규방 등(2001)은 이 경우 일반 공공

투자사업의 타당성 평가에 적용하는 할인율보다 2% 정도 낮은 할인율을 적용하는 것이

바람직하다고 지적하였다.

Page 191: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 183 -

2) 기존 제출자료 검토 결과

기존에 심평원에 제출된 50건의 경제성평가 자료를 살펴보면, 할인을 수행한 경우가 45건

(90%), 할인을 하지 않은 경우가 5건(10%)로 나타났는데, 후자의 경우는 분석기간이 1년 이내

인 것으로 파악된다.

할인을 수행한 45건 가운데 할인율에 대한 민감도 분석 시행 여부를 살펴보면, 1건을 제외

한 44건에서 민감도 분석을 시행하였다.

할인율에 대한 민감도분석 시 사용된 할인율의 종류가 매우 다양하게 나타났는데, 우선 경

제성평가 지침에 따른 할인율(0, 3, 7.5%)을 적용한 경우가 29건(65.9%)으로 가장 많았고, 그

다음은 0%, 7.5%를 적용한 경우가 5건(11.4%)이었으며, 그 밖에 지침에 제시되지 않은 할인

율을 적용한 경우도 10건(22.7%)이나 되었다.

한편, 일반적인 예상처럼 낮은 할인율을 적용할수록 ICER가 낮아지는 경향을 보였으나 급

여 여부 결정에 영향을 미칠 정도의 큰 변화는 아닌 것으로 파악되었다. 낮은 할인율을 적용

한 경우에 ICER가 반대로 높아지는 경우도 1건 존재하였다.

<표 46> 기 제출된 경제성평가 자료에서 할인 적용 현황

구분 빈도 구분 빈도

할인

시행 45

민감도분석

시행 44

미시행 5 미시행 1

계 50 계 45

<표 47> 기 제출된 경제성평가 자료에서 민감도분석에 적용된 할인율 현황

구분 빈도(%) 구분 빈도(%)

0%, 3%, 7.5% 29 (65.9) 0%, 7% 2 (4.5)

0%, 7.5% 5 (11.4) 2.5%, 7.5% 1 (2.3)

3.5%, 7% 4 (9.1) 3.5%, 6.5% 1 (2.3)

3%, 7% 2 (4.5) 계 44 (100)

3) 외국 지침

가) 캐나다 CADTH

2017년에 개정된 캐나다 지침(4판)은 2006년 지침(3판) 이후 11년 만에 개정된 것으로 여기

서는 먼저 사회적 할인율에 대한 정의를 내리고 있는데, 이는 정부 투자에 할당된 자원의 한

계 사회적 기회비용(marginal social opportunity cost)을 반영해야 하며, 정부 채권의 실질 이

Page 192: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 184 -

자율과 유사하다고 한다.

이를 근거로 경제성평가 시 비용은 주정부 채권 실질 이자율을 이용하여 할인하며, 결과는

예산 제약이 존재한다는 가정 하에 실질 이자율에서 비용-효과 역치(cost-effectiveness

threshold)의 증가율을 뺀 할인율을 적용하는 것이 이론적으로 맞지만, 비용-효과 역치에 대

한 불확실성 및 그것의 예상되는 변화에 대한 불확실성으로 인해 실제로는 비용과 결과 모

두 동일한 할인율을 적용할 것을 권장하고 있다.

구체적으로, 기본분석에서는 1년 이후 발생하는 비용과 결과 모두 연간 1.5%의 할인율을

적용하여 현재가치로 환산하는데, 이 때 할인율 1.5%는 주정부 채권의 명목 이자율에서 캐나

다 중앙은행의 목표 물가상승률(현재 연간 2%)을 보정한 값이다.

불확실성을 반영하고 할인율 변화에 따른 영향을 파악하기 위해 0%와 3% 할인율을 사용

한 민감도 분석을 수행해야 한다고 하며, 지침 개정(4판) 전의 분석과 비교할 목적인 경우에

필요하면 기존 할인율(5%)을 적용한 민감도 분석을 추가로 수행할 수 있다고 한다. 한편, 시

간에 따라 가변적인 할인율(non-constant discount rate)을 적용할 때 미치는 영향을 보고자

할 경우 민감도 분석에 포함할 수도 있다고 한다.

나) 호주 PBAC

호주 지침에서는 기본분석으로 비용과 건강 결과 모두 연간 5%의 할인율을 적용해야 한

다. 민감도분석의 경우 비용과 결과 모두 3.5% 및 0% 할인율을 적용하여 제시하도록 하고

있다.

필요하다면 기본분석의 할인율이 아닌 다른 할인방법(예: 다른 고정 할인율, 기간에 따른

차등 할인율 적용 등)을 사용하여 추가분석 결과를 제시할 수 있으며, 이 때 사용한 방법에

대해 근거를 제시하도록 하고 있다.

다) 영국 NICE

비용효과성은 여러 해에 걸쳐 발생하는 비용과 건강 결과의 현재가치를 반영해야 하는데,

비용 및 건강 결과에 대해 3.5% 할인율을 동일하게 적용해야 한다고 한다.

아울러, 기본분석과 함께 비용과 결과 모두 1.5% 할인율을 적용한 민감도분석 결과를 제출

할 수도 있다고 한다. 특히 해당 치료가 없었더라면 사망하거나 심각한 건강 상실을 경험했

을 환자의 건강을 회복시키고 해당 건강 결과가 적어도 30년 이상 지속되는 경우에는 비용

과 결과에 1.5% 할인율을 적용한 민감도분석 결과가 고려될 수 있다고 한다.

라) 기타 지침

독일의 경우 비용에 대해 3%, 편익에 대해 1.5%의 할인율을 적용하며, 할인율에 대한 민감

Page 193: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 185 -

도분석을 위해 다른 시나리오도 제시해야 한다.

프랑스의 경우 2005년 이후로 정해진 4%의 사회적 할인율을 비용과 효과에 대해 동일하게

적용하며, 분석기간이 30년 이상인 경우 2% 할인율을 적용한다. 할인율에 대한 평가 결과의

강건성 확인을 위해 민감도분석이 필요하다.

덴마크의 경우 재무부에서 정한 사회적 할인율인 4%를 비용과 효과에 대해 동일하게 적용

한다.

노르웨이의 경우에도 재무부에서 정한 사회적 할인율 4%를 비용과 건강 결과에 동일하게

적용한다. 아울러, 이 할인율은 실질 이자율이기 때문에 의약품 경제성평가에 물가상승률을

적용해서는 안 된다고 되어 있다.

스웨덴의 경우 비용과 효과에 대해 3%의 할인율을 동일하게 적용해야 한다. 민감도분석에

서는 비용과 효과에 동일하게 0%와 5%의 할인율을 적용한 경우 및 비용은 3%, 효과는 0%

할인율을 적용한 경우에 대해서도 제시하도록 되어 있다.

4) 기타 문헌고찰 결과

☐ 민간투자사업의 수익률에 관한 연구(이규방 등, 2001)

이규방 등(2001)은 SOC 시설에 대한 경제적 타당성 분석 및 투자효과 평가에 필요한 사회

적 할인율을 도출하기 위한 연구를 수행한 결과, 향후 몇 년간 7~8% 할인율을 적용하는 것

이 바람직하다고 판단하였고, 도로, 철도, 항만 등 일반적인 공공투자사업에는 7.5%의 할인율

을 적용하고, 수자원개발사업, 환경시설사업, 낙후지역 개발사업 등 간접적 편익이 크거나 정

책적 배려가 필요한 사업에 대해서는 2%p 정도 낮은 할인율을 적용하는 것이 바람직하다고

하였다.

☐ 공기업·준정부기관 사업 예비타당성조사 수행을 위한 일반지침 수정·보완 연구(제2판)

KDI 공공투자관리센터(2018)에서 발간한 이 연구보고서에 따르면, 사회적 할인율은 공공투

자사업의 경제적 타당성 평가에 영향을 미치는 중요한 파라미터의 하나라고 규정하고 있다.

1999년 정부의 예비타당성조사제도 도입에 따라 자본의 잠재가격에 기초하여 사회적 할인율

을 정하는 방법을 택하였는데, 실질 7.5%의 할인율을 적용하기 시작하였다(수자원 부문의 경

우 장기로 고려하여 6%). 이 후 경제여건의 변화에 따라 2004년 사회적 할인율은 6.5%로 인

하하고(수자원 부문 30년까지 6.5%, 이후 20년은 5% 차등 적용), 2007년에 다시 5.5%로 인하

하였다.

적정 사회적 할인율 추정을 위해서 기준이자율, 사회적 시간선호율(social time preference

Page 194: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 186 -

rate), 재무적 할인율 등을 고려하는데, 사회적 시간선호율을 추정식에 따라 계산하여 본 결

과 5.0~5.5%가 적정 범위인 것으로 나타났으며, 기준이자율을 살펴보아도 이 범위 안에 있으

며, 재무성 분석의 실질 할인율도 4.5%가 적정한 것으로 분석되었다.

2017년 8월 기재부가 예비타당성조사제도를 개편할 때, 시장 금리 및 경제성장률의 하락

추세 등 경제 여건의 변화를 반영하여 사회적 할인율을 4.5%로 하향 조정하여 제시하였으며,

이에 따라 공공기관 예비타당성조사에서 사회적 할인율 4.5%를 동일하게 적용하도록 하고

있다.

☐ 공공투자 사업의 경제성분석을 위한 사회적 할인율 추정(최지은 등, 2015)

2008년 금융위기 이후 시장이자율의 지속적인 하락에 따라 공공투자사업의 조달금리 역시

하락하였다는 점에 착안하여, Ramsey 방식을 적용하여 시간 선호율, 소비의 한계효용 탄력

성, 1인당 실질 소비 연간 증가율을 추정하는 방식을 통해 공공투자사업의 사회적 할인율을

추정한 결과 여러 가정에 따라 3.3~4.5%의 값이 도출되었고, 기존 사회적 할인율 5.5%의 추

가 인하 필요성을 제안하였다.

☐ Discounting and the Evaluation of Health Care Programs (Paulden M., 2017)

캐나다에서 지침 개정을 위해 할인율에 대해 검토한 보고서(Paulden, 2017)에서는 경제성평

가지침(4판) 개정 시 할인율을 5%에서 1.5%로 인하하기로 하였다. 이는 주정부 채권

(provincial government bonds)의 실질 이자율을 반영한 것으로, 1.5%는 주정부 채권 명목 이

자율에서 Bank of Canada가 제시한 물가상승률 목표치 2%를 뺀 값이다. 민감도 분석을 위해

0%, 3% 할인율 사용하며, 개정 전 할인율인 5%는 이전 연구와 비교 목적으로 사용 가능하다

고 하며, 시간에 따라 가변적인 할인율(time-varying discount rate) 적용은 민감도분석으로

제시가능하다고 한다.

5) 이해관계자 의견

☐ 경제성평가제도개선 TF

(제약사 의견) 한국에서의 할인율 역시 사회적 할인율의 하향 조정과 제외국 보건의료부문

할인율 하향 조정을 고려하여 현재에 비해 낮게 조정되어야 할 것으로 보인다. 외국의 할인

율을 참고하는 경우 1.5~5%까지 가능하고, 사회적 할인율의 수준을 참고하여 낮게 설정할 경

우 2.5% 내외의 할인율도 가능해 보인다.

(심평원 의견) 우리나라의 경우 최초 2006년「의약품 경제성평가 지침」을 제정한 이후에

Page 195: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 187 -

약 10년간 동일한 할인율을 적용하여 왔으나, 그 동안 국내의 경제상황이 변화하여 사회적

할인율이 지속적으로 하향 조정되었다. 현행 경제성평가 지침의 할인율은 국내의 사회적 할

인율보다 높아 조정의 필요성은 있다. 다만, 기존에 정책적 배려로 사회적 할인율 대비 2%

정도 낮은 할인율을 경제성평가 할인율에 적용하였으나, 사회적 할인율이 낮아지고 있는 상

황에서 동일한 비율을 적용하는 것은 불확실성이 있다. 또한, 제외국의 사례를 참고 시, 다수

의 국가에서 사회적 할인율 대비 경제성평가의 할인율을 낮게 설정하고 있으나, 일부에서는

동일하게 설정하고 있고, 정책적 배려하는 방식에서도 차이가 있어, 국내에 적용 가능한 가

장 타당한 방식에 대해 충분한 논의가 필요하다.

☐ Scoping 자문회의 결과

할인율 수준에 대해 전문가 사이에 이견이 존재하였다.

- KDI 할인율(4.5%)과 동일하게 가져갈 것인지 검토 필요

- KDI와 할인율을 꼭 맞춰야 하는지 의문이 있음

- 미국 사례를 보면 보건의료 분야의 할인율이 다른 분야 할인율보다 높음. KDI가 4.5%라

면 우리는 5%를 유지하는 게 맞을 수도 있음

비용과 결과에 동일한 할인율을 적용하는 것에 대해서도 나온 의견은 아래와 같다.

- 비용과 효과의 할인율을 다르게 하는 것은 고려하지 않는지 궁금함

- 현재의 majority는 같아야 한다는 것임

☐ Scoping 의견조사 결과

제약사 응답자(9명) 중 대부분(7명)이 할인율 인하를 제안했는데, 대부분 3% 수준으로 인하

할 것을 제안하였으며, 3.5% 혹은 3% 미만을 제시한 경우도 있다. 3%로 인하할 경우 민감도

분석을 위한 할인율은 0%, 1.5%, 5%를 제안하였다.

연구자(3명, 모두 경제성평가 수행 경험 있음) 모두 할인율 인하를 제안했는데, 예비타당성

조사 할인율(4.5%)과 동일 수준 혹은 3% 수준으로 인하를 제안한 경우와 현실화 필요성만

제안하고 구체적인 수치를 제시하지 않은 경우도 있었다.

☐ 전문가 자문회의 결과

할인율을 인하하는 것은 필요하며, 기재부 예비타당성조사 지침과 같은 할인율(4.5%)을 적

용하되 분야별 차등 적용은 하지 않는 것을 제안하였다.

- 실질 금리가 하락하는 추세이기 때문에 할인율도 하향 조정이 필요하며, 할인율이 높은

경우 미래 세대에게 이득이 되는 중재들의 가치가 작게 평가될 수 있기에 할인율 하향

조정이 필요하다.

Page 196: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 188 -

- 분야별로 투자수익률, 미래 위험이 다르기 때문에 분야별로 할인율을 달리 하는 것도 가

능하지만, KDI에서 분야별 할인율을 인정하지 않는 점을 고려할 때 기재부 예비타당성

조사 지침과 같이 맞추는 것이 실무에서 혼란이 적을 것이다.

❍ 할인을 할 때 비용과 결과에 동일한 할인율을 적용해야 한다.

- 비용과 효과에 할인율을 달리 적용하는 것이 타당하다는 해외 연구들이 있지만 우리는

전반적으로 기재부 예비타당성조사 지침(편익과 비용에 대해 다른 할인율을 인정하지

않음)을 따르기로 했기 때문에 달리 적용한다면 논리적 모순이 발생한다.

❍ 분석기간에 따라 할인율에 차등을 둘 것인지에 대해서는 기재부 예비타당성조사 지침

을 따라 30년 이후부터 3.5%를 적용하는 것도 가능해 보인다.

- 일반적으로 장기 이자율이 단기 이자율보다 낮기 때문에 장·단기 할인율을 서로 달리

적용해도 괜찮을 것이다.

- 분석기간이 30년 이상인 철도와 수자원 사업은 운영 30년 동안은 4.5%를 적용하고 이후

는 3.5%의 할인율을 적용하는 기재부 지침과 연동하는 것이 좋을 듯하다.

6) 지침 개정방향 제언

사회경제적 여건 변화에 따라 사회적 할인율이 지속적으로 내려가는 상황에서 경제성평가

를 위한 할인율 또한 인하하는 것이 필요하다. 다만, 할인율을 어느 수준까지 낮추느냐 또한

보건의료 분야의 특수성을 고려하느냐에 대한 합의가 필요하다.

이번 지침 개정에서는 경제성평가에 적용할 적정수준의 할인율을 예비타당성조사에 적용

되는 할인율과 동일한 4.5% 수준으로 할 것을 제안한다. 경제성평가 지침이 처음 만들어질

당시에는 사회적 할인율이 7.5%로 매우 높았던 상황에서 보건의료 분야에 대한 정책적 배려

및 다른 나라의 할인율 수준 등을 고려하여 5% 할인율 적용을 제안한 바 있다.

그동안 사회적 할인율이 지속적으로 인하되어 4.5%까지 낮아진 상황에서 보건의료 분야에

대한 정책적 배려 차원에서 추가적으로 더 낮은 할인율을 적용하는 것보다 예비타당성조사

적용 할인율과 동일하게 하는 것이 정책의 일관성 면에서 타당하다고 판단된다. 아울러, 다

른 나라의 할인율 범위를 고려할 때에도 적정 수준이라 판단된다.

비용과 결과에 동일한 할인율을 적용하는 것에 대해서는 이전과 다름없이 동일하게 적용

하며, 민감도분석을 위해서는 할인하지 않는 경우(0%)와 3% 할인율을 적용할 것을 제안한다.

분석기간에 따라 할인율을 달리 적용하는 것에 대해서는 두 가지 입장이 있을 수 있다. 하나

는 예비타당성조사 지침을 따라 30년 이후부터 3.5%를 적용하는 것이며, 다른 하나는 분석기

간과 무관하게 4.5%를 적용하는 것이다. 전자는 결과가 장기에 걸쳐 나타나는 경우 특히 세

대간 선택 문제와 관련된 경우에 미래세대의 편익을 더 반영해야 한다는 입장이나, 후자는

Page 197: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 189 -

경제성평가의 주요 적용대상이 의약품이며 그 편익이 대부분 당사자에게 발생한다는 점을

들어 기간에 따른 차등 할인율 적용이 타당하지 않다는 입장이다.

보건의료 분야의 경제성평가 대상 분석기간이 30년 이상 장기인 경우에 기본분석에서는

전 기간 4.5% 할인율을 적용하는 것으로 하며, 어린이에 대한 치료와 같은 경우처럼 필요하

다고 판단할 경우 30년 이후부터 3.5% 할인율을 적용한 것을 민감도분석으로 제시할 수도

있을 것이다.

Page 198: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 190 -

카. 모형 구축

1) 개정이 필요한 영역

경제성평가제도개선 TF, 관련 단체 의견조사 결과 특별한 의견이 없었고, 전문가 자문회의

결과 타당도 평가 관련 보강 의견이 있었다.

2) 현 지침

각 치료대안의 최종 결과를 직접 관찰할 수 없을 때, 모형을 구축하여 이를 추정하게 된

다. 모형을 이용하는 경우 모형이 필요한 이유에 대해 서술하고, 모형의 구조와 관련한

다음 사항에 대해 구체적으로 상술하도록 한다.

∙모형이 적용되는 인구집단

∙모형의 종류

∙모형에 사용된 가정

∙모형의 구조(질병상태, 분석 기간, 주기 길이)

∙이전확률 등 모형의 모수(parameter)

∙비용/결과

또한 검토자가 모형의 구조와 분석과정을 한눈에 볼 수 있게 표 또는 그래프로 모형 구

축 결과를 제시하고, 각 단계마다 해당 질병 상태에 있는 사람들의 수(코호트 시뮬레이

션인 경우), 비용 등을 기술하도록 한다.

모형 구축과정에서 사용한 자료원에 대해서는 투명하게 기술하도록 하고, 다른 나라에서

개발된 모형을 이용하는 경우는 해당 모형을 국내 상황에도 적용 할 수 있을 지 검토하

여 이를 보고서에 기술토록 한다.

이전 지침에서 모형의 구조(structure), 자료(data) 및 투명성(transparency) 관련된 권고 사

항은 있으나 타당성 부분은 보강이 필요한 것으로 사료된다.

3) 기존 제출자료 검토 결과

기존 심평원에 제출된 자료 50건 중에서 비용최소화분석을 수행한 2건 제외한 마르코프

모형이 전체 제출된 보고서의 80% 이상이며, dynamic modeling 또는 DES 등은 없었다. 외적

타당도 등 validation은 전체의 68.7%가 수행하지 않았다. 타당도는 모형의 신뢰도 및 질에

Page 199: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 191 -

상당히 중요함(Eddy et al, 2012; Afzali & Karnon, 2011; Sculpher et al, 2001; Phillips et al,

2001)에도 불구하고 대체로 수행되지 않았다. 국내 경제성평가 목적으로 제출된 모형 중에서

기존 경제성평가 문헌고찰을 하지 않은 것이 약 73%이고, 외적 타당도 및 cross-validation은

거의 되지 않아 개정이 필요하다.

<표 48> 제출된 모형의 유형

구 분 건 수 %

마르코프 40 83.3

결정수형 3 6.3

Microsimulation (1st order monte carlo simulation) 2 4.2

기타 2 4.2

언급없음 1 2.1

총 48* 100

*비용최소화분석 2건 제외; 기타 = partitioned survival model, UKPDS

<표 49> 기존 모형 고찰

고찰방식 건 수 %

기존문헌 선택적 언급 11 22.9

체계적 문헌고찰 2 4.2

언급 안됨 35 72.9

총 48* 100

*비용최소화분석 2건 제외

<표 50> 외적타당도 평가

구 분 건 수 %

O* 15 31.3

X 33 68.7

총 48 100

*전문가 자문, 다른 자료원 비교; 자료원의 타당성, 독립성 대체로 언급 안 됨.

<표 51> cross-validation

고찰방식 건 수 %

O 5 10.4

X 43 89.6

총 48 100

Page 200: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 192 -

4) 외국 지침

가) 캐나다 (CADTH 2017)

☐ 모형의 structure, data incorporation 등의 개념화 (model conceptualization)

모형 구조는 임상적으로 적절해야 하고, 필요하다면 임상전문가의 의견을 받아야 한다. 또

한 현재 결정해야 하는 질문에 적절해야 하고, 모형의 구조는 현재 가용한 자료에 따라 모형

의 방향이 결정되면 안 된다. 그러나 가용한 자료는 모형 개발 과정을 제한하여 모형 구조가

수정되어야 할 수도 있다. 타당도가 검증되고 잘 구성된 모형이 이미 있다면, 이 모형을 고

려하여 모형을 만들어야 한다. 즉 기존 모형개발자와 접촉 및 협력하여(collaborate), 또는 단

순하게 기존 모형과 유사한 구조적 가정, 또는 유사한 natural history 자료(관련된다면)를 쓸

수 있다. 기존 모형을 인지하고 모형을 개발하는 것은 모형의 타당도 등에 도움이 된다. (기

존 모형 문헌고찰 필요함을 제시)

모형을 얼마나 자세히 구성하는 것이 바람직한 것인지를 결정하는 것은 매우 어렵다

(Roberts et al., 2012). 임상 pathway와 관련된 모든 자세한 내용을 포함할 필요는 없으나, 치

료군과 대조군 간에 비용과 효과 간에 차이가 도출될 수 있는 수준에서는 포함해야 한다. 그

러나 필요 이상으로 복잡할 필요는 없다.

다양한 모형 구조가 있고, 코호트 모형(마르코프), 환자단위 이전 모형(마이크로시뮬레이션

또는 1st-order), dynamic model, discrete event simulation 모형 등이 있다. 모형 구조 선택에

대한 근거가 제시되어야 하고, 선택된 모형은 방법론적으로 타당

하고 투명해야 하며, good modeling practice guideline을 따라야 한다(Roberts et al., 2012,

Eddy et al., 2012; Siebert et al., 2012; Caro et al., 2012; Briggs et al., 2012). 자료 제출자는

잠재적인 건강상태의 이질성 및 dynamic evolution을 같이 고려해야 한다.

☐ 모수 값 포함(incorporating parameter estimate)

Natural history: baseline characteristics과 효과값이 같은 자료원이라면, 사용된 자료원이

대표성이 있는지 고려해야 한다(Dias et al., 2013). baseline 자료는 특히 캐나다 세팅에 해당

하는 값이어야 한다. 만약 baseline 값이 임상값과 별개의 값이고 캐나다 값을 대표하는데 보

다 더 적절하면(예를 들어 청구자료 또는 코호트 관찰연구), baseline 값은 별개의 값을 쓰는

것도 합리적일 수 있다. 만약 하나 이상의 자료원이 적절하다면 시나리오분석 등을 수행할

수 있다. 만약 국내(캐나다) 값이 없고 외국에서 관찰된 값과 상당히 다를 것으로 믿을만한

근거가 있는 경우, 시나리오 분석을 통하여 그 영향을 평가할 수 있다. 자료원(예를 들어 전

Page 201: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 193 -

문가 의견 등)은 설명되어야 하고 그 근거가 제시되어야 한다. natural history 자료가 불완전

한 경우, 시나리오 분석 등을 통하여 구조적 불확실성(structural uncertainty)을 탐색한다.

효과값 포함: baseline 대비 상대값(Dias et al., 2013) 또는 절대값(Cooper et al., 2015)으로

고려할 수 있다. 만약 효과값이 시간에 따라 변한다면 그에 대하여 보정해야 한다.

부작용 포함: 모형에 포함된 부작용 값이 어떻게 찾아졌고 포함시킬 때 어떤 방법을 썼는

지 설명해야 한다. 부작용이 건강결과나 의료이용/비용에 미미한 영향을 끼치는 경우, 부작용

은 포함시키지 않는 것이 더 바람직할 수 있다. 만약 치료 관련된 부작용의 비용, 유병률,

disutility 값을 제시하다면 투명성은 증가된다.

치료와 관련 없는 건강결과 포함여부: 아직 논쟁적이다. 환자가 완치되어 오래 살면서 생

기는 부작용이나 건강결과를 포함하는 것의 여부는 아직 논쟁적이다. 관련 없는 건강 결과는

별도의 시나리오 분석을 통하여 제출할 수 있다(may).

☐ 전문가 의견 도출

자료가 부족한 경우 전문가의견으로 수치 값을 얻을 수 있다. 전문가 의견도출은 1) 자료

부족한 부분에 대한 파악 2) 대표성있는 전문가 집단 파악 3) 도출법 적용 4) 전문가에게 도

출된 자료의 합성 단계로 나눌 수 있다(Bojke et al., 2010; Bojke et al., 2014).

연구자는 적절한 자료원을 찾기 위하여 지속적으로 노력해야 한다.

☐ 모형 calibration (Karnon et al., 2011; Stout et al., 2009)

모형에 사용되지 않은 자료원과 모형 결과값을 비교하여 미지의 모수를 측정하는 방법으

로 정의된다.12) 현재 가용한 자료로 부족한 부분을 calibration을 통하여 측정할 수 있다. 칼

리브레이션 방법은 routine하게 사용되지는 않으며, 연구자는 적절한 자료원을 찾기 위하여

노력해야 한다.

☐ 모형 타당도 검증(model validation)

face validity는 모형구조, 가정, 모수 등이 임상 현실을 잘 반영하는지에 대한 정성적 평가

이다. 대체로 모형 개발 초기에 수행되며 iterative하게 지속적으로 평가된다.

내적 타당도(internal validity 또는 internal verification)는 수학적 계산과 모수 산출에 대한

질 평가이다. 모형 개발에 직접 관여하지 않은 독립적인 사람이 수학적 logic의 합리성과 에

러에 대한 확인으로 각 equation과 코딩 정확도, 모수가 원래의 자료를 잘 반영하고 있음을

포함한다. 코딩정확도는 double programming (두 명의 독립적 프로그래머가 모형의 한 부분

12) the estimation of unknown model parameters by achieving agreement between the model outputs and other sources of data that are external to the model and not used to parameterize the model

Page 202: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 194 -

을 구축), 0 또는 극값을 입력하여 모형 검사, 결과값이 알려진 것과 같은 시나리오로 검사

등을 포함한다. 직관과 반대되는 검사 결과는 내적 타당도에 문제가 있음을 나타낼 수 있다.

유사한 다른 모형이 있다면 연구자는 선행 모형과 비교해야 한다(cross-validation). 그러나

모형 간 유사한 구조, 방법, 자료원을 사용한 것이 아니라면 cross-validation은 의미가 없다.

모형 예측값이 실제값(신뢰할 수 있고 가능하면 모형에 사용되지 않은 독립적인 자료원)과

일관되는지를 고찰하는 외적 타당도(external validity) 검증이 수행되어야 한다(Eddy et al.,

2012). 만약 자료원과 모형예측값 간에 상당한 차이가 있다면 신뢰도, 일관성 등의 측면에서

설명해야 한다.

타당도 검증은 구체적으로 어떤 방법으로 했는지 자료로 상세히 제시되어, 이 모형을 검토

하거나 사용하는 사람이 신뢰할 수 있도록 한다.

나) 호주 (PBAC 2016)

☐ 모수의 모형 포함 관련

치료군 별로 효과가 다른 전이확률의 경우 일반적으로 임상자료에서 산출된다. 각 전이확

률 값은 점 추정치 및 범위(95% 신뢰구간)을 ISPOR TF 2012 (Briggs et al., 2012)을 참고하여

산출하는 것을 권고한다.

☐ 외삽

환자 수가 적어 관찰자료의 수치의 신뢰도가 적어지는 지점 전(before)까지는 실제 관찰값

이 모형에서 추정된 값보다 선호된다. 이때 외삽된 값이 적용된 시점에 대하여 외부 자료를

이용하여 정당화하고, patient-level 자료를 활용하여 적절한 parametric survival curve를 산

출하는 것이 권고된다. proportional hazard 가정이 충족되었는지, 다양한 생존모형을 적용하

고, 모형의 fit은 시각적 및 AIC/BIC로 평가한다. Bagust et al. (2014), Grieve et al. (2013),

Karnon et al. (2011), Latimer et al. (2013)의 논문을 참고한다.

☐ 모형의 operational validation (주로 타당도 검증 관련 제시)

모형에서 치료군/비교군의 traces를 제시하도록 하여 외적 타당도를 평가한다. trace를 통

하여 모형의 논리가 적절한지 평가하고, 모형에 사용되지 않은 기존 연구값과 비교한다. 기

존의 다른 모형과 cross-validation 수행하도록 한다.

AdviSHE (Verner et al., 2016) 를 이용하여 타당도를 평가하도록 한다.

Page 203: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 195 -

다) 영국 (NICE 2013)

☐ 모형 방법

모형에 대한 가정과 근거를 명확히 제시하고, 가정 관련 현실적인 대안이 있다면 민감도분

석을 통하여 그 효과를 평가하도록 한다. 모형이 필요한 사례로는 1) 모든 근거자료가 하나

의 임상시험에서 얻을 수 없는 경우 2) 임상시험의 환자군이 전체 환자군을 나타내지 않을

경우 3) 중간 지표가 사용된 경우 4) 적절하지 않은 비교군이 선정된 경우 5) 관찰기간을 넘

어가는 경우 등으로 제시한다.

치료 효과 값은 체계적 문헌고찰에 근거해야 하고 구조적 가정은 온전히(fully) 정당화되어

야 하며 input 자료는 명확히 근거가 제시되어야 한다.

모형 개발에 사용된 방법과 모형 타당도 검증에 대한 결과값은 제시되어야 한다. 결과값은

각 부분별로 나눠서(disaggregated) 제시되고, 생명연장(Life year gained), 사망률, 임상 결과

지표의 빈도 등은 표로 제시되어야 한다(should).

최종지표가 중간지표보다 더 의미있으며, 최종지표를 쓸 수 없는 경우 중간지표를 쓰되 최

종지표와의 관계를 명시해야 한다. 모형 구축을 위한 자료원을 찾고 비평적으로 평가하는

(critically appraise) 과정은 분석대상 인구집단과 비교하여 그 적절성이 설명되어야 한다

(justified).

관찰기간을 넘어서서 외삽하는 경우 내적/외적 타당도가 검증되어야 한다. 외적타당도는

기존의 역학자료와 외삽된 자료를 비교하는 것과 임상적/생물학적 현실성 (plausibility)를 고

려하는 것 등을 포함한다. 관찰된 값과 외삽된 값의 상대적 fit을 비교하여 내적 타당도를 평

가하는 경우, 통계적 방법의 한계도 같이 기록되어야 한다. 치료효과는 외삽 기간동안 1) 없

거나 2) 지속되거나 3) 감소하는 등의 다른 시나리오도 같이 고려되어야 한다.

임상시험에서 교차투여(cross-over)가 되어 ITT 분석이 더 이상 적절하지 않은 경우,

switching에 대한 통계적 보정값이 제시될 수 있다. 교차투여된 환자만 제외하고 분석하는 단

순 보정은 지양하며 선택된 방법의 상대적 장·단점에 대해서는 그 선택 근거에 대하여 제

시되어야 한다. 고려되어야 할 요인으로는 임상시험에서 교차투여가 행해진 기전, baseline에

분석 가용한 자료의 현황, 시간 의존적인 요인, 환자가 계속 남아있을 때 기대되는 치료 효

과 등에 근거할 수 있다.

라) EUnetHTA (2015/2019)

☐ 모형의 유형(표 52) 참고

수용 가능한 모형의 유형에 제한은 없으며(“all kinds of models accepted”) 대체로

decision tree와 마르코프가 언급되었다. 벨기에의 경우 모형이 복잡하면 가용한 자료가 부족

할 가능성이 높으므로, 모형은 가능한 간단하게 만들도록 권고하였다.

Page 204: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 196 -

소프트웨어 유형으로 네덜란드(TreeAge와 Microsoft Excel만 수용가능함), 핀란드

(Microsoft Excel), 영국 (Microsoft Excel, TreeAge, Winbugs or R) 등을 언급하였다.

☐ 외삽

대체로 다양한 시나리오로 민감도 분석 하도록 하였다. 폴란드와 프랑스의 경우 optimistic,

pessimistic, neutral 3가지 가정으로 외삽하는 것을 언급하였고, 스코트랜드와 영국의 경우 효

과가 1) 관찰기관 이후 없음 2) 관찰기관 이후 지속 3) 관찰기관 이후 지속적 감소 의 시나

리오로 분석하도록 권고하였다.

☐ 타당도

2015년 내적/외적 타당도 언급하였고 2019년 보고서의 경우 AdviSHE (Verner et al., 2016)

활용한 타당도 검증을 구체적으로 제시하였다. cross-validation 시 모형이 dependent 한 경우

그 가치가 낮아지며, 모형 간 값이 다른 경우 그에 대한 설명이 제시되어야 한다. 외적 타당

도의 경우 independent 한 자료를 이용하여야 하고, 비교할만한 해야 하며 타당한 결과값 이

어야 한다.

EUnetHTA (2019): model verification (기술적 정확도) & validation (타당도)에 대하여 다음

과 같이 제시하였다.

1) Face validity : 모형의 구조, 가정, 모수, 분포, 결과값이 합리적인가?

2) Internal validity (내적 타당도, technical verification): 모형이 맞게 구축되었는가?

3) Cross model validation (모형 간 타당도): 독립적으로 개발되었으나 유사한 결과를 예측

하는 다른 모형과 유사한 값을 제시하는가?

4) External validation (외적 타당도): 모형에 사용되지 않은 외부 자료와 모형의 결과값을

비교했을 때의 결과는?

각 타당도 항목에 대하여 AdviSHE (Verner et al., 2016)로 타당도 체크하는 것을 제안하였

다.

<표 52> EUnetHTA (2015) 국가별 모형 관련 지침 정리

국가수용가능한 모형과 요구되는 구체적 사항들

(Acceptance of modeling and specific requirements)

AustriaModelling acceptedAll kinds of modelsInternal and external validation should be analysed

BelgiumModedlling acceptedMarkov and decision trees are mentioned as major categoriesExtrapolation should be presented scenarios

Page 205: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 197 -

Internal and external validation requirements

Croatia Modelling accepted; No further information available

Czech Republic Modelling accepted; All kinds of models

Denmark Modelling accepted; No further information available

England

Modelling acceptedMicrosoft Excel, DATA, Winbugs or R is recommended(process guide). If extrapolation, compare severalalternative scenariosThe methods of quality assurance used in the development of the model, and model validation should be detailed

Estonia and Latvia

Modelling acceptedNo further information available

Finland Modelling accepted; No further information available

France

Modelling accepted; Many types of model can be usedEffect of extrapolation tested in scenariosThe ability of a model to produce results that areconsistent and suited to the reality of the decision-making process is tested

GermanyModelling accepted;All kinds of modelsRequirements on validation

HungaryModelling acceptedAll types of models are acceptedModelling software is not specified

Ireland

Modelling acceptedAvailable modelling techniques including decision-treeanalysis, state transition or Markov models, anddiscrete-event simulation.No requirement on methods for extrapolationValidation requirements exist

Italy

Modelling acceptedAll types of models are accepted, requirements ondocumentation and motivationNo specific program of modelling methods recommendedModels should be carefully validated

The Netherlands

Modelling acceptedIn general: Markov, decision trees, discrete-eventsimulations (template for applicants) Only models in MS Excel or TreeAge are accepted (template for applicants)Internal and external validation is required

Norway

Modelling acceptedThe choice of approach should be justified.Requirements on documentation of extrapolationModels should be carefully validation

Poland

Modelling acceptedMarkov model is accepted. Other models are not mentioned.If data in the model are extrapolated over time horizon ofthe primary trials, the following scenarios should beanalyzed: optimistic, pessimistic and neutral.Internal and external validation are required

Page 206: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 198 -

자료원: EunetHTA 2019

자료원: EUnetHTA 2019

Portugal

Modelling acceptedThe following types of models are accepted: Decision trees, Markov’s Model, Extended revision of literature relevant to the clinical and economic analysis of the problem.There is no specific program recommended. External validation is recommended.

Russia Modelling accepted; No further information available

ScotlandModelling accepted; There is no requirement on methods for extrapolation. Requirements on internal or external validation are not stated

SlovakiaModelling acceptedNo further information available

SloveniaModelling acceptedNo further information available

Spain

Modelling accepted (Spanish recommendation, Osteba, AETSA, CatSalut)All types of models (only decision trees and Markov models addressed in Osteba)No additional information concerning programs or methods for extrapolation or internal/ external validation.

SwedenModellin acceptedNo further information available

SwitzerlandModelling acceptedNo further information available

Page 207: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 199 -

<표 53> AdViSHE 평가도구 (Verner et al., 2016)

설명 기준

A. Validation of conceptual model

A1 Face validity전문가에게 모형 개념의 적절성에 대하여 자문했는가?

Which experts? Why? 어느정도까지 적절하다고 동의했는가?

A2cross validity

다른 모형과 비교했는가? 안했으면 왜 안했는가?

B. Input data validation

B1 Face validity13)

전문가에게 input data의 적절성에 대하여 자문했는가?

Which experts? Why? 어느정도까지 적절하다고 동의했는가?

B2Model Fit testing14)

input data 가 만약 회귀분석에 근거한다면 통계검증 수행했는가?

했으면 설명, 안했으면 왜 안했는가?

C. Validation of computerized model

C1 외부검토 모형전문가에게 검토받았는가? Which experts? Why?전문가는 독립적인가? 안했으면 왜 안했는가?

C2Extreme value testing15)

코딩 에러를 찾기 위하여 극값을 넣고 돌렸는가?

안했으면 왜 안했는가?

C3Testing Traces

환자를 추적하여 모형의 로직이 맞는지 파악하였는가?

안했으면 왜 안했는가?

C4Unit testing16)

모형의 sub module 별 검사했는가?검사, 기준, acceptance norm 등이 사전에 제시되었는가?

D. Operational validation

D1Face validity testing

모형 결과값의 적절성 관련하여 전문가에게 자문했는가?

Which experts? Why? 어느정도까지 적절하다고 동의했는가?

D2cross validation testing

유사한 문제를 다루는 다른 모형의 결과와 비교했는가?

- 발표된 결과만 비교했는가 아니면 다른 모형에 직접 접근했나?- 만약 차이가 있다면 차이에 대하여 설명할 수 있는가?

D3Validation against outcomes17)

다른 자료원을 사용했을 때 나온 결과에 대하여 타당도 검증했는가?

안했으면 왜 안했는가?

D4

Validation against emprical data

empirical data와 비교하였는가? dependent/indenepdent validation (모형 구축 사용 여부에 따라)

안했으면 왜 안했는가?

E. Other validation technique

E1Other validation technique18)

다른 타당도 방법이 사용되었는가? 짧게 요약 제시

Page 208: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 200 -

마) 해외지침 소결

☐ 모형은 대체로 기존의 ISPOR & SMDM TF (2012) 등에서 제시된 바와 큰 방향은 유사하

다.

임상 현실에 부합하고, 효과값은 SR을 통하여 제시; 영국은 유일하게 cross-over에 대하여

언급하였다. 모형이 투명하게 제시되어 재현될 수 있어야 함이 일관되게 강조되었다.

SMDM-ISPOR 2012 modeling 관련한 논문들이 언급되었다(Roberts et al., 2012; Siebert et al.,

2012; Eddy et al., 2012; Karnon et al., 2012; Pitman et al., 2012). 캐나다는 가장 광범위하게

모형에 대하여 제시하였고 외삽 관련하여 영국, 호주는 구체적으로 언급하였다.

타당도 관련되어 최근 지침이 대체적으로 보강되었으나 그 구체성(예를 들어 AdViSHE 적

용 정도; 호주, EUnetHTA는 권고)에 차이가 있다.

☐ AdviSHE (Verner et al, 2016): 기존의 문헌의 내용 대비 새로운 내용은 없으나 상당히

구체적으로 제시하였다.

지침의 목적이 일관된 정책결정, 현재 과학 수준을 반영하면서 현실성도 고려한다고 했을

때, AdviSHE는 정책결정자에게는 도움될 수 있으나 자료제출자(제약사)에게 부담이 될 수 있

다. 타당도의 중요성(모형의 신뢰도 & 질)을 고려 시, 타당도는 중요하므로 보다 유연히 제

시할 필요 있다,

AdviSHE 에서 A1, B1, C1, D1에 명시된 “전문가에게 자문받았는가”의 전문가는 C1의 모

형전문가를 제외하고는 모두 명확하지 않고(예를 들어 임상의사? 통계학자? 경제학자?) C1,

C3, D3, E1의 경우 실현가능성이 낮다.

5) 지침 개정방향 제언

13) potential for bias; generalizability to the target population;availability of alternative data sources;14) Examples of tests include but are not limited to: comparing model fit parameters (R2, Akaike information criterion

(AIC), Bayesian information criterion (BIC)); comparing alternative model specifications (covariates, distributional assumptions); comparing alternative distributions for survival curves (Weibull, lognormal., logit); testing the numerical stability of the outcomes (sufficient number of iterations); testing the convergence of the regression model; visually testing model fit and/or regression residuals

15) Examples include but are not limited to: zero and extremely high (background) mortality; extremely beneficial., extremely detrimental., or no treatment effect; zero or extremely high treatment or healthcare costs.

16) turning sub-modules of the program on and off; altering global parameters;17) Alternative input data can be obtained by using different literature sources or datasets, but can also be constructed

by splitting the original data set in two parts, and using one part to calculate the model outcomes and the other part to validate against.

18) double programming (two model developers program components independently and/or the model is programmed in two different software packages to determine if the same results are obtained).

Page 209: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 201 -

항 목 현 지침 내용 개정 방향

모형의 구조(structure)

- 질병상태 또는 치유(또는 악화)과정은 질병의 생물학적 특징을 잘 반영해야 하며, 모형 구조에 근거가 된 자료원 및 설명을 모두 제시. 가능하면 간단하고 투명해야 함.

- 모형 구조의 적절성을 분석 목적에 근거하여 정당화할 것 - 모든 관련된 가정은 근거를 제시해야 하며, 충분한 영역에서 민감도분석이 이루어져야 함. 임상자료보다 긴 관찰기간을 외삽할 경우, 다양한 시나리오에 근거하여 불확실성을 검토하는 것이 권고됨

그대로

자료(data) 선정, 분석 및

포함

- 모형의 목적에 적합한 자료가 선정되었는지 제시하는 것이 권고됨.

- 자료의 선정은 체계적으로 선택되었고, 배제된 문헌의 경우 근거를 제시하는 것이 바람직함.

- 모형에 포함된 자료원은 충분히 자세히 설명하여 검토자가 평가할 수 있도록 함.

- 점 추정치인 경우는 민감도 분석에 사용되는 영역을 제시하고, 확률분포로 이용할 경우 분포를 명시하고 근거를 제시하는 것이 바람직함.

그대로

타당도

- 포함된 자료원은 서로 상충하지 않는지, 내적/외적 타당도에 대하여 논의하는 것이 권고된다. 모형의 분석대상 인구집단이 국내 급여대상 인구집단에 일반화될 수 있는지 논의하는 것이 권고된다.

내적타당도,외적타당도,

cross-validation calibration 등 구체적 언급

<표 54> 모형 구축 개정방향

☐ 현재 지침에서 모형의 타당도 부분을 추가하고, 큰 방향을 해외 지침과 유사하게 가도록

하는데 AdviSHE를 어느 선까지 적용할지(즉 기본분석으로 할지, 아니면 선호한다고 할

지) 논의가 필요하다.

❍ validation 관련하여 AdviSHE 등의 도구 도입에 대해서는 논의 필요 (extensive 함)

❍ 지침의 목적이 현재 과학 수준을 반영하면서 현실성도 고려한다고 했을 때, AdviSHE

는 자료제출자 (제약사)에게 상당한 부담이 될 것이나 타당도의 중요성 (모형의 신뢰

도 & 질)을 고려 시, AdviSHE는 표준화된 객관적 평가 도구이므로 고려가 필요하다.

☐ 1안. 타당도의 중요성 강조 (캐나다 지침 및 ISPOR TF; Eddy 등 2012, AdviSHE 등 제출

선호 (권고 아님)

제약사의 현실성 고려하여, 이번에는 Eddy/EUnetHTA 논문 수준으로 권고하고 AdviSHE 는

선호한다고 하여 유연하게 적용하는 것을 제안한다. 다음은 EUnetHTA (2019) 원문이다.

1) Face validity : 모형의 구조, 가정, 모수, 분포, 결과값이 합리적인가?

2) Internal validity (내적 타당도, technical verification): 모형이 맞게 구축되었는가?

3) Cross model validation (모형 간 타당도): 독립적으로 개발되었으나 유사한 결과를 예측

Page 210: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 202 -

하는 다른 모형과 유사한 값을 제시하는가?

4) External validation (외적 타당도): 모형에 사용되지 않은 외부 자료와 모형의 결과값을

비교했을 때의 결과는? 차이가 있으면 설명하시오.

☐ 2안. AdviSHE 권고

타당도 평가의 표준 기준을 제시한다는 의의가 있으나 제약사에는 부담이 될 수 있다. 제

약사 등 이해당사자의 의견 수렴이 필요하다. 이 때 C1, C3, D3, E1의 경우 실현가능성이 낮

으므로 제외하고 진행하는 것을 제안한다.

Page 211: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 203 -

타. 진단검사 동반 약물

1) 현 지침

현 지침에서는 진단검사 동반 약물에 대한 별도 지침이 제시되어 있지 않다.

2) 기존 제출자료 검토 결과

진단검사 동반 약물은 진단검사를 통해 선별된 환자를 대상으로 투약이 이루어지는 약물

을 말하며, 기존에 경제성평가 자료를 제출한 50건 중에서는 6건이 이에 해당하였다.

가장 먼저 검토된 건은 국소 진행성 또는 전이성 비소세포폐암 환자의 2차치료제로, FISH

(fluorescence in situ hybridization; 형광동소교잡반응) 검사 결과 역형성 림프종 인산화효소

(ALK) 양성 진단을 받은 환자에게는 신청약제를, 음성 진단을 받은 환자에게는 기존치료제

투여하는 대안과 FISH 검사 없이 전체 환자에게 기존치료제를 투여하는 기존 치료법을 비교

하는 경우였다(“test and treat”vs“treat all”). 경평소위 논의 결과 검사 후 치료 전략과

모두 치료 전략을 비교하는 기본 모형 수용을 수용하였으나, FISH 검사의 위양성․위음성 진

단에 따른 결과도 경제성평가 모형에 반영하는 것이 적절하다는 의견이 제시된 바 있다.

이어 논의된 건은 “BRAFV600E 변이가 확인된 수술이 불가능하거나 전이성인 흑색종(1차

치료)”를 대상으로 한 것으로, 전형적인 환자맞춤형 모형(진단검사 과정 및 유전자 변이 발

현율을 반영한) 구축을 하지 않고, BRAF 양성환자만을 대상으로 한 모형을 구축한 후 유병

률의 역수로 진단검사비용을 추가하였다. 당시 제약사 측에서는 환자 맞춤형 모형과 제시된

모형이 결과적으로 동일한 결과를 가져옴을 주장하였는데, 경평소위에서는 기댓값은 동일할

지라도, BRAF 양성환자만을 대상으로 하여 구축된 모형에서는 진단검사의 민감도, 특이도

등을 둘러싼 불확실성을 확인할 수 없음을 지적하였다.

이후에도 T790M검사, PD-1검사 등 약물사용과정에서 진단검사가 동반된 건들이 제출되었

는데, 진단검사의 민감도, 특이도가 반영된 전형적인 환자맞춤형 모형이 아닌, 유병률의 역수

로 검사비용만을 추가한 모형이었다. 이에 경평소위에서는 기심의사례 및 검사법의 민감도,

특이도에 대한 정보가 제한적임을 고려하여 검사비용을 고려하는 선에서 제출 모형을 수용

한 바 있다.

3) 외국 지침

많은 국가들에서 진단법에 대한 평가위원회를 별도 운영하고, 평가 지침 또한 별도 운영하

Page 212: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 204 -

고 있다. 그러나 진단검사와 약물이 서로 결합된 경우에 대한 평가 지침을 제공하는 경우는

많지 않았다. 본 연구에서는 진단검사 동반 약물에 대한 평가지침을 언급한 호주와 영국의

사례를 검토하였다.

가) 호주

호주에서는 진단기술은 MSAC에서, 의약품은 PBAC에서 평가한다. 그러나 진단검사와 의약

품이 서로 연계된 상호의존기술(codependent technologies)은 두 위원회에서 함께 검토하는

방향으로 나아가고 있으며, PBAC 가이드라인에서는 상호의존기술(codependent technologies)

에 대해 별도의 항목을 할애하여 상세지침을 제시하고 있다(product type 4).

지침에서는 “다른 기술(예, 병리학적 검사 혹은 영상 기술)의 사용으로 한 의료기술(예 의

약품)의 건강성과가 개선될 때 두 기술이 상호의존적이라고 한다”고 정의하였으며, 다음과

같은 정보를 요구하고 있다.

- 직접 근거(Direct evidence): ‘직접 근거’ 는 현재 사용되는 진단 검사/검사 전략을 받

는 그룹과 제안된 진단검사/검사전략을 받는 그룹을 직접 비교하는 연구로, 진단방법에

따라 환자 건강성과에 미치는 영향을 직접 측정할 수 있다는 장점이 있다.

- 연계 근거(Linked evidence): 제안된 검사/검사전략의 임상적 효과를 가늠하기 위하여 제

안된 검사/검사전략과 현재 사용되는 검사/검사전략 간 정확도를 비교한 결과와 별도의

자료원을 통해 확인한 치료효과에 대한 근거를 연계한다.

- 바이오마커 검사와 의약품 간의 관계를 분명히 할 것. 특히 바이오마커 수준에 따라 치

료효과가 달라지는 것인지(치료효과의 modification), 예후 효과 때문인지, 아니면 둘 다

에 기인한 것인지를 분명히 하여야 한다. 상호의존기술을 통합하여 제출한 신청서(An

integrated codependent submission)는 의약품이 검사를 통해 확인한 바이오마커와 상호

작용하여 환자의 건강성과를 개선한다는 것을 입증하여야 한다. 만약 상호의존적 기술

이 배경적 예후 효과와 치료효과 수정 모두에 대한 근거를 가지고 있다면, 배경적 예후

효과를 통제한 순치료효과를 제시도록 한다.

상호의존기술에 대해 PBAC과 MSAC이 요구하는 근거를 충족시키기 위해 요구되는 정보는

모두 62 항목으로 각 항목들은 (T), (M), (O)로 표시되어있다: (T)/검사, (M)/의약품, (O)/양쪽

모두에 겹침. 이하 PBAC이 제시하는 구체적 지침은 부록으로 제시한다.

나) 영국

영국은 동반진단검사(Companion diagnostics)라는 표현을 사용하여 지침을 제시하고 있다.

지침에 따르면 특정한 바이오마커의 존재 여부에 따라 기술의 사용이 달라질 수 있는 바, 오

직 특정한 기술의 치료결정을 지원할 목적으로 진단검사가 수행된다면, 진단검사에 따른 관

Page 213: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 205 -

련 비용은 임상효과, 비용효과의 평가에 포함되어야 한다. 그리고 진단검사 비용을 포함하지

않은 결과를 민감도 분석으로 제시하여야 한다. 필요한 경우 진단검사의 정확도를 검토하고,

경제성평가에 포함하도록 한다.

현실에서는 해당 기술의 임상시험에 사용된 것과 다른 대안적 진단검사절차도 가능할 수

있다. 필요하다면 대안적 검사를 사용할 가능성(임상시험에 사용하는 것과 진단정확도가 다

를 수 있다)이 대상환자군의 선택과 해당 치료법의 비용효과성에 영향을 미칠 가능성에 대해

서도 검토한다.

국가 지침 내용 원문

호주PBAC 지침

version 5(2016)

Product type 4 – Codependent technologies 로 section 전체 할애 (p144~)

영국 NICE 지침 (2013)

The use of a technology may be conditional on the presence or absence of a particular biomarker (for example a gene or a protein). If a diagnostic test to

establish the presence or absence of this biomarker is carried out solely to support the treatment decision for the specific technology, the associated costs of the diagnostic test should be incorporated into the assessments of clinical and cost effectiveness. A sensitivity analysis should be provided without the cost of the diagnostic test. When appropriate, the diagnostic accuracy of the test for the particular biomarker of treatment efficacy should be

examined and, when appropriate, incorporated in the economic evaluation.5.9.2 The appraisal will take account of any requirements of the marketing authorisation, including tests to be completed and the definition of a positive test. In clinical practice in the NHS, it may be possible that an alternative diagnostic test procedure to that used in the clinical trials of the technology is used. When appropriate, the possibility that using an alternative test (which may differ in diagnostic accuracy from that used in the clinical

trials) may affect selection of the patient population for treatment and the cost effectiveness of the treatment will be highlighted in the appraisal guidance.

5.9.3 It is expected that assessments of multiple companion diagnostic test options will generally be undertaken in the NICE diagnostics assessment programme. (p93-94)

<표 55> 진단검사 동반 약물 관련 해외 지침 내용

4) 기타 문헌고찰 결과

진단검사를 동반한 약물은 때로 개인맞춤형의약품이라는 용어로도 불리기도 한다. 따라서

개인맞춤형의약품의 경제성평가를 둘러싼 여러 논의는 진단검사 동반 약물의 평가에도 그대

로 적용할 수 있다.

Page 214: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 206 -

대체로 많이 언급되는 내용은 비교 대상, 진단검사의 민감도·특이도에 대한 정보를 어떻

게 고려할 것인지, 바이오마커의 유병률이 결과에 미치는 영향, 서로 다른 자료원 연계에 따

른 불확실성 같은 것들이 있다.

먼저 ISPOR 개인맞춤형의약품 SIG에서 낸 보고서(Fulkner et al., 2012)에서는 개인 맞춤형

의약품의 경제성평가모형은 현실의 의사결정을 반영하여야 하며, 이때 고려되는 선택은 신약

A와 기존 약 B 사이에서가 아니라, “모두 치료”전략과 “검사후 치료”전략 사이에서의

선택임을 강조하였다. 이 경우 바이오마커의 유병률이 중요해진다. 보고서에서는 위양성, 위

음성률과 위양성, 위음성의 결과 또한 모델에서 고려되어야 한다고 강조한다. 그 외에도 저

자들은 검사결과와 치료전략, 그리고 환자 성과들 간의 관계가 서로 다른 문헌으로부터 도출

될 경우, 이 과정에서 불확실성이 매우 커질 수 있는 바, 모형의 액면 타당도(결과가 make

sense한지), 외적 타당도(결과가 일반화 가능하고 현실 자료와 일관된지)에 대한 평가가 필요

하며, 개인맞춤형의약품의 가치를 입증하기 위해서는 직접적인 근거 생산이 요구된다는 점도

언급하였다.

Annemans et al. (2013)은 개인맞춤형의약품의 경제성평가를 둘러싼 방법론적 이슈를 검토

하면서 다음과 같은 권고를 하였다. i) 민감도, 특이도, 위양성, 위음성, 예측도가 명료하게

고려될 필요가 있다, ii) 바이오마커의 유병률이 중요하다, iii) 검사가 가진 특성은 임상적 효

용으로 연결되어야 한다(translated), iv) 개인맞춤형의약품의 두 요소, 즉 진단 요소와 치료적

요소가 연계되어 나타내는 가치는 임상시험에서 검토되어야 한다, v) 분석모형이 복잡해질

경우 현실의 진료 pathway를 보다 잘 반영할 수는 있지만 자료부족, 그리고 장기 외삽에 따

른 불확실성 등으로 인해 그만큼 불확실성이 더 커지는 문제점이 있다.

그 외 Annemans et al. (2013)은 QALY 이득이 개인맞춤형 의약품의 가치를 기술하는 최상

의 방법인가에 대해 의문을 제기하며 과정이 주는 효용(process utility), 역량(capability) 등에

대한 고려도 필요하다는 입장을 피력하였다.

서혜선·박미혜 등(2014)은 기존 문헌과 그간 심평원에서 검토한 개인맞춤의약품의 사례를

토대로 개인맞춤의약품의 경제성평가 방법론에 대해 다음과 같이 정리하였는데, 해당 보고서

에서 제안한 내용은 경평소위 심의과정에서 일부 고려되었다.

- 비교대안으로는 선별 검사 없이 전체 환자에게 사용되는 표준치료제 선정

- 전략대 전략을 비교하는 특성상 검사의 성능과 비용이 평가에 포함되는데, 해당 유전자

변이의 유병률 크기 및 진단검사의 가격, 성능에 따라 개인맞춤의약품의 경제성평가 결

과는 달라질 수 있다. 특히 유병률이 평가 결과에 상당한 영향을 미칠 수 있으므로 적절

한 유병률이 모형에 반영되어야 한다.

- 검사의 민감도(sensitivity)와 특이도(specificity) 및 이와 관련되는 위양성(false positive),

위음성(false negative)의 수준이 경제성평가의 모형에서 고려되어야 한다.

Page 215: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 207 -

- 동반진단검사로 도출된 경제성평가결과는 다른 진단검사의 경제성평가결과로 전용될

수 없다.

- 서로 다른 자료원을 사용하여 근거들을 연계하는 경우 해당 자료원의 내적 타당도와 외

적 타당도를 모두 고려하여 수용 여부를 판단하여야 할 것이다.

- 동반진단검사로 도출된 경제성평가결과는 다른 진단검사의 경제성평가결과로 전용될

수없다는 점도 강조하였다.

이어 서혜선·박미혜 등 (2014)은 진단검사-개인맞춤형의약품의 바람직한 경제성 평가모형

으로 다음 그림 8을 제시하였다. 이는 진단검사의 민감도, 특이도를 모두 고려하는 모형이다.

[그림 8] 진단-환자맞춤형 의약품의 경제성평가 모형

그러나 저자들은 현실에서 가용한 자료가 부재한 경우도 있고, 위양성, 위음성 수준이 매

우 낮아 복잡한 모형이 필요치 않은 경우도 있어 위 모형을 좀 더 단순화한 모형을 몇 가지

제시하였다. 그림 9의 (a)는 “검사하지 않은” 대안과 “검사후 치료” 대안을 비교하는 것

으로, 현실적으로 위양성, 위음성 수준 및 이로 인한 건강결과에 대한 정보가 없다면 그림 8

을 적용하는 것이 쉽지 않다는 판단하에, 그림 8을 단순화시킨 모형이다. 한편, (b)는 위양성

과 위음성 비율이 매우 낮아서 이로 인한 건강결과 및 비용에의 영향이 거의 무시할 수 있

는 수준일 경우에 사용할 수 있는 단순화한 평가방법으로 제시된 것이다. 마지막으로 (c)는

제한적인 평가방법으로 유전자 변이가 확인된 환자에게 개인맞춤형의약품과 표준치료제를

투여하는 대안을 비교하는 방법이다. 이는 해당 검사의 임상적 유용성과 비용효과성이 이미

입증되었다는 것을 전제하며, 임상시험은 유전자 변이가 확진된 환자들을 대상으로 실시된

경우이다. 이 경우 진단검사는 효과에는 전혀 영향을 미치지 않고(미치지 않는다고 가정), 비

용에만 영향을 미치게 된다. 즉, 모형의 개인맞춤형 의약품 대안에 유병률의 역수를 곱하여

검사비용 만을 적용한다. 저자들은 위양성, 위음성의 수준이 높아서 이로 인한 영향을 고려

할 필요가 있다면 해당 모형을 적용하는 것이 부적절하다고 제시하였다.

Page 216: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 208 -

(a)

(b)

(c)

[그림 9] 진단검사-개인맞춤형의약품 경제성평가 모형 (단순화)

출처: 서혜선·박미혜 (2014)

그 외 Kip et al. (2018)은 진단검사와 바이오마커의 경제성평가를 할떄 포함되어야 하는

항목을 표로 제시하였으며(부록 참조), Yang et al.(2018) 또한 진단검사의 모형기반 경제성평

가에서 확인할 사항을 체크리스트 형태로 제시하였다(부록 참조).

기존 문헌의 권고사항을 종합하면 다음과 같이 요약할 수 있다.

- 진단검사를 동반한 약물의 경우 비교대안은 약물 대 약물이 아닌 치료전략대 치료전략

Page 217: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 209 -

이다, 바이오마커의 유병률을 고려하여야 한다.

- 진단검사의 민감도, 특이도가 고려되어야 한다.

- 서로 다른 근거를 연계하는 경우 해당 자료원의 내적 타당도, 외적 타당도가 평가되어야

하며, 불확실성 평가가 필요하다.

5) 이해관계자 의견

- 없음

6) 지침 개정방향 제언

진단검사를 동반한 맞춤형의약품의 경우 해당 의약품이 도입되지 않았다면 선별검사 없이

전체 환자군에 표준치료제를 사용했을 것이므로, 이 경우 비교대안은 선별 전 전체 환자군이

된다.

진단 검사 후 치료대상을 선별하는 경우라면, 검사 비용도 포함하여 신청약의 비용-효과성

을 평가하는 것이 바람직하다. 다만, 치료 대상을 선별하는 검사에 해당한다 하더라도 신청

약 투여여부와 관계없이 이루어지는 검사라면 비용에서 제외하고, 신청약 투여를 위해 추가

로 수행되는 검사라면 비용에 포함한다.

바이오마커의 유병률에 따라 선별검사인원 대비 투약인원의 비가 달라지므로, 바이오마커

의 유병률이 고려되어야 한다.

검사의 민감도(sensitivity)와 특이도(specificity) 및 이와 관련되는 위양성(false positive), 위

음성(false negative)의 수준이 경제성평가의 모형에서 고려되어야 한다. 다만, 위양성률과 위

음성률이 무시할 수 있을 정도로 충분히 낮다는 근거가 있다면, 생략하고 간소화한 모형을

사용할 수 있다.

검사, 치료, 건강결과 간의 관련성에 대한 근거가 제시되어야 한다. 직접 근거가 있으면 가

장 바람직하겠지만, 서로 다른 자료원으로부터 도출된 근거를 연계하는 접근도 가능하다. 이

경우 각 근거의 내적 타당도, 외적 타당도가 적절히 평가되어야 한다.

구조, 모수를 둘러싼 불확실성이 충분히 검토되어야 한다.

Page 218: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 210 -

파. 불확실성

1) 개정이 필요한 영역

경제성평가제도개선 TF, 학계 및 관련 단체 의견조사 결과, 전문가 자문회의 결과 모두 특

별한 의견이 없었다.

2) 현 지침

경제성평가는 이용할 수 있는 자료의 부족과 단일한 방법론의 부재 등으로 어느 정도의

불확실성을 내포하게 된다. 따라서 경제성평가를 수행할 때에는 불확실성의 문제를 분명

히 검토함으로써 의사결정자로 하여금 평가결과가 어느 정도 안정적인지를 확인할 수

있도록 하여야 한다.

불확실성을 검토하는 가장 기본적 수단은 민감도 분석이다. 경제성평가 과정에서 사용한

모든 가정과 기타 불확실성을 초래하는 원천에 대하여 단변량(일원) 민감도 분석을 실시

하도록 한다. 단변량 민감도 분석결과, 결과지표에 민감한 영향을 미치는 변수에 대해서

는 다변량(다원) 민감도 분석을 실시할 것을 권장한다. 그리고 민감도 분석을 실시한 모

든 변수와 민감도 분석의 결과를 표나 그래프로 종합하여 제시함으로써 의사결정자가

불확실성의 정도와 양상을 검토할 수 있도록 하여야 한다.

최근에는 비용-효과비 추정 시 점추정치 뿐 아니라 95% 신뢰구간을 함께 제시하고 있으

며, 모형에 사용된 모수의 불확실성을 검토하는 수단으로 확률적 민감도 분석을 실시하

고 있는 바, 이러한 접근 방법도 시도해 볼 것을 권장한다.

또한 비용-효과 분석의 결과를 비용-효과 수용 곡선(cost-effectiveness acceptability

curve)으로 제시하는 것도 권장한다.

3) 기존 제출자료 검토 결과

심평원에 제출된 50건 중에서 단변량분석은 모든 건에서 수행되었으나 2개 이상의 변수를

같이 변화시키는 다변량 분석은 1건만 수행되었고, 확률적민감도분석(PSA)은 전체 중에서 약

40%가 수행되었다. PSA는 반드시 하지 않아도 됨에도 불구하고 40%가 수행되었다.

Page 219: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 211 -

분석 종류* 건수 %

단변량분석19) 50 100

다변량분석20) 1 2

확률적민감도분석 (PSA) 20 40

총 50 100

* 중복 가능

<표 56> 불확실성 평가 유형별 분류

대체로 치료비용(80%), 효용(88%)에서 단변량 민감도분석이 수행되었으나, 다른 문헌값

(78%, 치료비용; 61%, 효용)이 가장 많이 사용되었고 +-10% 등과 같은 임의값도 약 22% 정

도 사용되었다.

<표 57> 모수의 불확실성 평가 (DSA)

구 분* 건 수 %

약가 10 34

약가 제외 의료비용 40 80

Relative effectiveness 11 22

효용 44 88

Baseline risk 18 36

할인율 5 10

기타 29 58

총 50 100

* 중복 가능

<표 58> 모수의 불확실성 평가 (DSA 상세)

구 분치료비용

Relative effectiveness

효용 baseline risk

건 수 % 건 수 % 건 수 % 건수 %

95% 신뢰구간 0 0 6 54 7 16 1 5

서로 다른 문헌 6 78 1 10 27 61 8 45

기타 임의 값* 34 22 4 36 10 23 9 50

총 40 100 11 100 44 100 18 100

* +-10% 등

19) univariate analysis20) multivariate analysis

Page 220: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 212 -

PSA의 경우, 변수의 특징에 따라 대체로 적절한 분포(비용은 gamma, 효용은 beta)가 사용

되었고 사용에 단순하나 권고되지 않는 triangular, uniform 등은 사용되기는 하였으나 33%

미만으로 관찰되었다.

구 분비용 효용

Relativeeffectiveness

건 수 % 건수 % 건수 %

Lognormal 0 0 0 0 2 22

Beta 0 0 9 56 1 12

Gamma 14 82 2 13 0 0

Normal 2 12 3 19 3 33

기타* 1 6 2 12 3 33

총 15 100 16 100 9 100

* triangular, uniform 분포 등

<표 59> PSA에 사용된 분포

국내 현황을 분석한 결과, 총 50건 가운데 대체로 일원민감도분석은 행해지나, 임의의 범

위(+-10%)로 한 경우가 많았고, 2개 이상 변수를 변이시킨 다원민감도분석은 1건밖에 없었다

(2%). PSA는 전체 50개 중 20개(40%)에서 행해졌고, 대체로 적절한 분포가 사용되었으나 아

닌 경우(예: 비용에 대하여 정규분포, 전체 중 12%)도 관찰되었다. 구조의 불확실성과 관련해

서는 관찰기간을 달리한 경우가 가장 많았다.

<표 60> 구조의 불확실성 평가

구 분* 건 수 %

분석대상 인구집단 19 38

time horizon 변화 38 76

extrapolation 모형 16 32

기타 가정을 달리하여 17 34

총 50 100

* 중복가능

4) 외국 지침

가) 영국 (NICE, 2013)

☐ 구조의 불확실성(structural uncertainty): 시나리오 분석(scenario analysis)

Page 221: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 213 -

모형 구조의 가정은 명확히 설명되어야 하고 그 근거 또는 가정을 뒷받침할 수 있는 근거

가 제시되어야 한다. 모형 구조의 가정에 대한 불확실성은 현실성 있는 시나리오에 근거한

별도의 분석을 통하여 탐색되어야 한다. 관찰 기간을 넘어서서 외삽 등의 가정에 대한 불확

실성(다른 가정), 비용 및 효과 자료원의 선택에 따른 불확실성 (다른 자료원) 등의 경우 시

나리오 분석으로 불확실성을 탐색한다.

☐ 자료원 선택에 따른 불확실성: 다른 자료원으로 민감도분석

비용 자료원이 의료기관 간 변이가 크거나, 적절한 효용 자료원이 여러 개 있는 경우 등은

다양한 자료원을 이용하여 민감도분석을 수행하는 것을 권고하였다.

☐ 모수의 불확실성 (Parameter uncertainty): 확률적 민감도 분석 (PSA)

적절한 분포 (distribution) 및 모수 간 correlation 등도 고려되어야 함을 제시하였다. 모수

의 불확실성의 경우 cost-effectiveness plane, cost-effectiveness acceptability curve,

cost-effectiveness acceptability frontier 등으로 결과를 나타낼 수 있음을 제시하였다. 일원민

감도분석, best/worst case 민감도 분석은 결과에 민감하게 영향을 미치는 변수를 파악하는데

도움이 되나, 모수의 숫자가 증가하면서 여러 자료원의 combined 효과를 나타내는데 한계가

있어 모수의 불확실성은 PSA로 나타내도록 권고하였다.

나) 캐나다 (CADTH, 2017)

☐ 구조적 불확실성(structural uncertainty)의 경우 방법론과 관련된 불확실성(methodological

uncertainty)는 scenario analysis를 권고

다른 방법을 쓴 non-reference case와 reference case를 비교하는 것을 권고하였고, 다른

가정, 비용 및 효과 자료원의 선택에 따른 불확실성 (다른 자료원) 등을 이용하여 불확실성

평가하도록 권고하였다.

☐ 모수의 불확실성(parameter uncertainty): 모수의 true value의 불확실성에 대한 평가는

PSA로 할 것 (용어를 PSA 대신 probabilistic analysis로 변경)

모수의 불확실성은 확률적 분포로 표시되고 불확실성은 PSA로 평가하도록 권고하였다. 이

때 비용과 효과의 과소/과대평가를 막기 위하여 모수 간 correlation을 고려하는 것을 권고하

였다.

결정론적 민감도분석(단원, 다원, 역치분석 등)의 경우 모형이 비선형이거나 모수간

correlation된 경우 왜곡된 결과를 가져올 수 있으므로 권고되지 않음을 명시하였다. 불확실

성은 CEAC (cost-effectiveness acceptability curve)와 CEAF (cost-effectiveness acceptability

Page 222: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 214 -

frontier)로 나타내도록 하였다.

다) 호주 (PBAC, 2016)

☐ 모수의 불확실성

PSA의 경우 적절한 분포를 쓰는 것을 제시하였다. 즉 이전확률은 beta, RR/HR의 경우

log-normal, 비용은 gamma, 효용은 log-normal distribution 등의 분포를 쓰고 다른 분포를 쓰

는 경우 근거를 제시하도록 하였다. 변수 간 correlation을 고려하고, 특히 치료군과 대조군의

경우 상대적 치료효과 적용에 joint uncertainty를 고려하도록 권고하였다.

단원 민감도분석은 tornado diagram을 제시하고, 민감한 변수는 다원민감도분석을 수행하

도록 권고하였다. 다원민감도분석 시 DSA에 추가하여 PSA를 제출(즉 기본은 DSA)로 하여 영

국, 캐나다와 다소 다른 방향이다.

☐ 구조적 불확실성 (structural uncertainty): scenario analysis

여러 개의 모형 구조가 정의된 경우, 모형 결과값을 비교하여 다른 구조의 영향을 비교하

도록 하였다. 추가로 호주는 translational uncertainty를 언급하고 있는데, 가정의 변이라는

측면에서 구조적 불확실성의 범위 안으로 볼 수 있다.

<표 61> “translational uncertainty” 사례와 불확실성 분석 권고 예

Translations Incorporated into base-case analysis Suggested uncertainty analysis

연속형 자료를 이분형으로 변형 역치(thresholds)값을 바꿔서 분석

처치전환 보정 다른 보정방법, 보정 없이 치료효과

서브그룹에 근거한 치료효과 ITT 에 근거한 치료효과

치료 효과 자료원 선택 다른 자료원 선텍 또는 메타분석 자료를 자료원을 선택

중간지표를 최종지표로 변환 현실적 값의 범위

관찰기간 이후 자료의 외삽 다른 외삽 지점, 다른 외삽 모형, 추후 치료 효과에

대한 다른 가정

Externally sourced utility values Alternative values or sources (Subsection 3A.5.1)

자료원: 호주 PBAC Guidelines (2016)

라) EUnetha (2019, 2015)

불확실성의 개념에 대하여 정리하였다. ISPOR/SMDM의 Briggs et al. (2012)의 연구와 같은

개념이다.

Stochastic uncertainty는 1st order, random variability between otherwise identical patients

Page 223: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 215 -

로 충분한 iteration/simulation을 통하여 안정된 값을 산출하도록 하였다. parameter

uncertainty (2nd order)는 PSA, structural uncertainty는 가정을 다르게 했을 때 결과값에 미

치는 영항을 평가함을 정리하였다. 또한 모형 구축 과정에서 결과에 영향을 주는 변수를 파

악하여 이에 대하여 민감도 분석을 수행하도록 하였다.

<표 62> 불확실성의 용어 및 개념 정리 (Briggs, 2012)

☐ points for consideration (EUnetHTA 2019)

평균값 뿐 아니라 upper/lower bounds. 값을 파악하는 것이 중요하며 CI 구간이 너무 좁은

것은 우려가 될 수 있음을 제시하였다. 적절한 분포를 사용하여 합리적인 범위 안에 들어올

수 있도록 하였다. 예를 들어 확률이나 utilities는 beta distribution, 비용은 gamma

distribution, RR/HR 의 경우 lognormal distribution을 언급하였다.

이상치를 무시하지 말고, 결과의 불확실성 전체를 반영할 수 있게 포괄적으로 제시(변수나

가정의 포함 여부 및 범위)하는 것을 권고하였고, 변수 간의 correlation을 고려하였는지, 가

용한 자료와 가정에서 critical 한 부족함에 대하여 논의하였는지 고려가 필요하다.

☐ DSA vs. PSA (2015, 2019)

대부분 국가에서 DSA/PSA를 같이 수행하도록 하였다. 민감도 분석에 대해서는 DSA와 PSA

가 모두 다 수행되어야 한다고 EUnetHTA (2015)에서 제시하였다. 2015년 보고서에서는

one-way sensitivity analysis21), multiple sensitivity analysis22)가 많은 국가에서 권고되었다.

21) Austria, Belgium, England, Finland, France, Germany, Hungary, Ireland, the Netherlands, Norway, Scotland, and Spain

22) Belgium, France, Germany, Hungary, Ireland, Norway, Scotland, and Spain

용어 개념 Other Terms

Sometimes Employed

Analogous Concept

in Regression

Stochastic uncertainty

Random variability in outcomesbetween identical patients

동일한 환자 간 결과값의 변이

Variability: Monte Carlo error: first-order

uncertaintyError term

Parameter uncertainty

모수의 불확실성

The uncertainty in estimation of the parameter of interest 모수 측정에서의 불확실성

Second-order uncertaintyStandard error of

the estimate

Heterogeneity이질성

The variability between patients that can be attributed to

characteristics of those patients환자 간 이질성

Variability: observed or explained heterogeneity관찰 또는 설명된 이질성

Beta coefficients

Structural uncertainty

구조의 불확실성

The assumptions inherent in the decision model모형의 가정

Model uncertainty회귀분석 모형의 형태(예: linear,

log 등)

Page 224: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 216 -

parameter uncertainty에 대해서는 많은 국가들에서 PSA를 선호한다고 제시되었다23).

deterministic 모형의 경우 변수 간 관계를 고려하지 않고 평균값을 넣는 경우, 변수간에

correlation 있거나 분포가 치우친 경우를 무시할 수 있는 우려가 있다는 영국 사례가 언급되

었다.

마) 해외 지침 소결

☐ 구조의 불확실성에 대해서는 시나리오 분석, 모수의 불확실성에 대해서는 PSA가 DSA보

다 선호되는 경향이 관찰되나, 호주는 DSA (다원/일원) 선호함.

캐나다의 경우 DSA에 대한 우려를 명시하여 PSA가 기본적으로 수행되는 것을 권고함. 영

국은 이전 버전부터 PSA가 선호됨을 명시하였다. 호주도 PSA를 언급하였으나, 다원 민감도

분석에 있어 DSA가 PSA보다 더 우선된다. 일원 민감도분석으로 제시된 것은 구조적 불확실

성에 따른 시나리오 분석으로 사료된다.

☐ 구조의 불확실성 (structural uncertainty): 시나리오 분석 (scenario analysis)

대체로 모형 구조의 가정(관찰 기간을 넘어서서 외삽 등의 가정에 대한 불확실성), 비용

및 효과 자료원의 선택에 따른 불확실성(다른 자료원) 등의 경우 시나리오 분석으로 호주,

영국, 캐나다 및 EUnetHTA에서 제시되었고 일관된다.

☐ 모수의 불확실성 (Parameter uncertainty): 확률적 민감도 분석(PSA영국, 캐나다) vs. DSA

(호주, EUnetHTA)

일원민감도분석, best/worst case 민감도분석은 결과에 민감하게 영향을 미치는 변수를 파

악하는데 도움이되나, 모수의 숫자가 증가하면서 여러 자료원의 combined 효과를 나타내는

데 한계가 있어 모수의 불확실성은 PSA로 나타내도록 한다(영국); 결정론적 민감도분석(단원,

다원, 역치분석 등)의 경우 모형이 비선형이거나 모수간 correlation된 경우 왜곡된 결과를 가

져올 수 있으므로 권고되지 않는다(캐나다). 적절한 분포 (distribution) 및 모수 간 correlation

등도 고려되어야 함을 제시한다.

호주의 경우 일원민감도분석 및 tornado diagram을 제시하고, 민감한 변수는 다원민감도분

석을 수행하도록 한다. 다원민감도분석 시 DSA 에 추가하여 PSA를 제출(즉 기본은 DSA);

PSA 고려사항들 제시하였다.

EUnetHTA 대부분 국가에서 DSA/PSA를 같이 수행하도록 하였다. 민감도분석에 대해서는

DSA와 PSA가 모두 다 수행되어야 한다고 EUnetHTA (2015)에서 제시하였다.

23) Austria, Belgium, Croatia, England, Finland, France, Germany, Hungary, Ireland, Italy, The Netherlands, Norway, Poland, Scotland, Slovakia, and Spain

Page 225: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 217 -

5) 기타 문헌고찰 결과

<표 63> 결정론적 민감도분석의 장단점

2012. 보험의약품경제성평가 개정방안 연구에서 재인용 및 재구성

<표 64> 확률적 민감도분석의 장단점

2012. 보험의약품경제성평가 개정방안 연구에서 재인용 및 재구성

장 점 단 점

Ÿ 일원 민감도 분석은 사용하기 쉬우며 방법이 논리적이어서 CEA 구조를 이해하기 쉽고, 추가적인 연구(데이터)가 필요한지에 대한 판단을 할 수 있는 기준을 제시함. (Walker and Fox-Rushby, 2001)

Ÿ 질 높은 샘플 데이터가 없는 경우, 단순 민감도 분석은 특정 모수에 관한 불확실성을 설명하는데 가장 효과적임. (Briggs 등., 1994; NICE, 2008)

Ÿ 비용효과분석의 key driver(핵심요소)는 단변량 분석을 통하여 가장 잘 밝혀낼 수 있음(Walker and Fox-Rushby, 2001; NICE, 2008)

Ÿ 다변량 민감도 분석의 경우 모수의 수가 증가하면 해석이 어려움(NICE, 2008; Critchfield and Willard, 1986; Briggs 등, 1994; Walker and Fox-Rushby, 2001; Ades 등., 2006)

Ÿ 분석에 포함되는 모수는 종종 임의로 선택되어지기 때문에 selection bias문제가 있음(O’Brien et al., 1994)

Ÿ 어떤 민감도 분석 결과에 대하여 변동성 수준에 대한 기준이 없어(어느 정도가 robust한지에 대한 가이드가 없어서) 주관적인 해석이 가능(O’Brien 등., 1994)

Ÿ 결정론적 민감도 분석은 모수들 간 상호작용과 상관관계를 반영하기 어렵고, 모수효과를 개별적으로 고려하는 것은 전체 불확실성 수준을 과소평가하기 쉬움(Briggs and Gray, 1999; Briggs, 2000)

장 점 단 점

Ÿ 비용효과분석에서 모수의 불확실성을 알기 위하여 PSA사용을 권장(L Andronis et al., 2009)

Ÿ 확률분포의 사용을 통하여 모든 모수의 불확실성을 특성화 할 수 있으며, 평균적인 비용효과 결과에서 불확실성에 대한 해석도 가능. (Briggs et al., 1994; NICE, 2004)

Ÿ 모수들 사이의 상관관계가 모델에서 정확하게 구체화 되어, 비선형모델에서도 평균 비용과 효과에 대한 정확한 추정치를 제공함.(Ades et al. 2006; NICE, 2008)

Ÿ 모수들간 독립성 가정이 일반적으로 성립되어야 하며(Claxton et al., 2005)

Ÿ 모수 분포의 선택이 타당하지 않은 경우 우려가 있고 (Claxton et al., 2005)

Ÿ 모델구조, 방법, 가정과 관련된 불확실성은 PSA를 통하여 알아내기 어려움.(Briggs et al., 1994; Lord et al., 1999)

Page 226: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 218 -

6) 지침 개정방향 제언

☐ 모수의 불확실성 (Parameter uncertainty): PSA vs. DSA

1) DSA 반대:

- 일원민감도분석은 전체적 불확실성을 과소평가한다. 모수의 분포 및 여러 변수를 같이

변화시키는 PSA가 모형의 불확실성을 더 현실성을 반영한다(Claxton et al., 2005).24)

- 모형이 비선형이거나 모수가 correlation된 경우 DSA는 왜곡된 결과를 가져올 수 있으므

로 권고되지 않는다(CADTH 2016). DSA의 불확실성 범위(극값)는 변수 간 correlation이

있는 경우 왜곡될 수 있다(Ades et al., 2006). 반면, PSA는 joint posterior probability

distribution으로부터 Monte Carlo sampling을 통해서 적절한 불확실성 분석을 수행할 수

있다(Ades et al., 2006).

2) DSA 찬성:

- 민감도를 평가하는데 일원민감도분석이면 충분하며(Meltzer et al., 2001) 일원민감도분

석은 모수 하나의 결과값에 대한 영향을 나타낼 수 있어 고려가 필요하다(EunetHTA,

PBAC); 민감도 분석에 대해서는 DSA와 PSA가 모두 다 수행되어야 한다고 제시된 국가

들이 있고25) 모수의 불확실성 관련 DSA와 PSA로 제시될 수 있다(Weinstein et al, 2003).

3) 제언: 모수의 불확실성도 아직 결정론적 민감도분석을 없애기는 좀 부담스러움. (EU

국가들, 호주)

- 일원민감도분석으로 변수 하나의 변이를 보여주되, 임의적으로 +-50% 등의 값보다 의미

있는(예를 들어 충분한 범위의(95%)) 값을 이용하는 것을 제언한다.

- 심평원에 제출된 자료 중에서 전체 중 40%에 PSA가 제출되었고 대체로 모수의 특징에

부합하는 분포를 사용하였다. 다원민감도분석은 거의 수행되지 않아 PSA를 권고하는 것

을 제안한다. 다원민감도분석에서는 DSA 대신 PSA를 권고하고 변수 간 correlation과 분

포를 제대로 고려하고 triangular, uniform 등의 분포는 저어하도록(Briggs et al., 2012)

명시하도록 하는 것을 제안한다. 일원민감도분석에 대해서는 토네이도 플랏, PSA에 대

해서는 CEAC / cost-effectiveness plane으로 제시하는 것을 제안한다.

☐ 1안: 구조적 불확실성은 일원민감도분석. 모수의 불확실성 관련, PSA와 일원민감도 둘

다 고려된다. 다만 일원민감도분석은 임상적 통계적으로 충분히 광범위한 범위(예: 95%

CI)에서 수행하고, 임의적 변이(예를 들어 +-20%)는 지양하도록 하고26), PSA도 같이 수행

24) 다원민감도분석의 경우 PSA보다 더 시간 걸리고 computationally intensive 함.

25) “Nevertheless, univariate sensitivity analyses are stated to be particularly informative to identify parameters which may have substantial impact on the results of economic evaluations and both the use of DSA and PSA is recommended.”, EUnetHTA 2015

Page 227: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 219 -

하되 모수에 적절한 분포 및 correlation을 고려하여 수행하는 것을 권고한다.

☐ 2안: 모수의 불확실성에 대한 평가로 PSA를 기본분석으로 제안한다(PSA보다 DSA 선호)

DSA도 고려될 수 있으나 임상적 통계적 의미있는 범위에서 수행한다.

26) completely arbitrary 임의적으로 선정된 영역 (+-50%) 으로 민감도분석을 하는 것은 의미 없음 (Briggs, 2012, ISPOR Consensus)

Page 228: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 220 -

하. 부록: 전문가의견 도출 방법

1) 현 지침

【별첨 1】전문가 의견 수집

전문가 의견에 근거할 경우, 본 지침에 제시된 양식(표 1)에 따르는 것을 권장한다.

전문가 의견 수집은 임상시험 연구(무작위 임상시험 등) 결과를 임상현실에 적용시키

는 경우, 외국에서 수행된 연구를 국내 임상현실에 일반화 시키는 경우, 모형의 가정

설정, 자료가 부족하거나 현존 자료들의 신뢰도가 떨어져 가정이 필요한 경우에 근거

로 사용될 수 있다.

전문가 의견은 여러 형태의 자료원 중 가장 근거 수준이 낮다고 보고되었다. 전문가

의견은 타당한 방법론에 의한 과학적 근거를 대체할 수 없으며, 주요 임상효과와 단위

비용 등을 산출하는 경우 전문가 의견에만 근거하여 산출해서는 안 된다.

전문가 의견수집이 사용된 경우, 가용할 수 있는 자료원이 부재함을 확인하며, 도출된

결과 값은 임상적, 통계적으로 타당한 범위 내에서 민감도분석을 수행하여 결과의 견

고함을 관찰하고, 사용된 영역의 근거를 제시한다.

....

<표 65> 전문가 의견수집 제출양식

제공되어야 할 정보 설 명

전문가 선정 기준해당 전문가 혹은 전문가 집단이 선정된 기준을 제시하도록 함 (무작위/ 특정

학회/ 특정 지역/ 병원)

접촉한 전문가 수 명시

참가한 전문가 수불참한 전문가의 특징 및 불참 정도 등이 의견의 대표성에 영향을 미치는 지

평가할 것

의견수렴을 위한방법

전문가가 모두 참석한 회의를 통하여 의견을 수렴하였는지, 개별적으로 접촉하였는지, 설문조사를 통하여 의견을 수렴하였는지 등 의견수렴 방법을

명시할 것

의견 수렴 매체 우편/ 전화/ 대면/ 인터넷

질문 내용질문지 작성의 근거를 제시하고, 만약 사전테스트(pilot test)를 거쳤다면 그

결과도 같이 제시할 것

질문지는 신청약에 중립적인지 평가하고, 근거를 제시할 것

질문지를 포함하고, open/closed question 인지 제시할 것

전문가가 응답한 원문도 제시할 것

합의 도출을 위하여 Delphi/ 다수결/ 평균/ 중위값 근거를 제시할 것

Page 229: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 221 -

주: 관련 질문이 신청약제 혹은 질환과 관련하여 적절하지 않거나 작성이 불가능한 경우에는 그 근거를 제시하도록 함.

현 지침에는 전문가 의견조사시 제출 양식을 비롯하여 비교적 상세한 지침이 제시되어 있

다. 실제 제출된 자료를 분석한 결과를 바탕으로 제출 양식의 개정 필요성을 검토하고자 한

다.

2) 기존 제출자료 검토 결과

☐ 기존 제출자료 중 전문가 의견조사를 포함한 건들을 검토한 결과

❍ 참여 전문가의 수는 2~22명에 걸쳐 분포하였다 (K약은 1명)

❍ 조사결과를 종합함에 있어 다수가 평균값, 혹은 수렴의견을 사용하였다. 세미 델파이

(semi delphi)를 했다고 언급한 건이 3건, 중앙값을 고려한 경우는 1건이었다.

❍ 이해상충여부에 대해서는 밝힌 경우도 있었지만, 아예 언급이 없는 경우도 있었다.

❍ 대체로 전문가의견조사에 사용한 조사지 자체는 제출한 것으로 보인다.

3) 외국 지침

가) 호주

이끌어낸 방법

변이 평가 하나로 평가된 값에 대한 변이를 평가하기 위하여, 정량적 자료인 경우

표준편차 및 극값을 제시하고, 정성적 자료인 경우 이상치(outlier)가 제시되는 것이 권장됨.

이해상충 여부

의견 수집에 참가한 전문가가 신청약과 이해관계가 있는지 여부를 전문가 본인의 서명을 포함하여 기재하도록 함.

(예를 들어 신청약 개발과정에 참여한 경력 유무 등) 이것은 의견수집에 참가한 전문가의 수가 소수일 때 더욱 권장됨.

전문가에게 제시된 background 정보

의견 수집에 참가한 전문가에게 신청약 및 비교약 관련 어떤 정보가 제공되었는지, 사본을 제출하여야 함.

만약 전문가가 전문적(technical)인 의견을 제공하였다면 전문가가 사용한 용어에 대한 정의가 제출되어야 함(어떤 의미로 사용하였는지 명시되어야 함).

각 질문별 응답률특정 집단의 의견을 대표하는지 여부를 평가하기 위하여 비응답자와 응답자

특징을 비교함.

Page 230: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 222 -

❍ PBAC 가이드라인은 부록을 통해 전문가의견 도출 방법에 대한 지침을 제시하고 있

다. 그 내용 중 관련성이 높은 몇 가지만을 살펴보면,

- 전문가 의견이 다른 관찰자료보다 선호되는 것은 아니지만, 관찰자료를 의사결정 상황

에 적용할 수 있을 지에 대한 판단은 도와줄 수 있으며, 이 경우 전문가 의견은 불확실성

을 감소시킬 수 있다고 언급.

- 전문가 의견을 사용할 때에는 조사지나 전문가들에게 제시한 정보의 사본을 제출할 것

- 전문가 의견과 전문가들 간의 변이를 요약할 때, 결과 해석과 더불어 선택한 (도출) 방법

의 한계와 바이어스에 대해 논의하라.

- 다수 처방자가 존재하는 질병에 대해 전문가 의견을 구할 때는 소수 처방자를 대상으로

한 조사에 의존하지 말 것. 이는 불확실성을 높이는 결과를 가져올 것임. 전문가 조사를

통해 도출된 최종 추정치는 PBAC가 효과나 비용-효과성을 과대추정하거나, 재정영향을

과소추정할 위험을 최소화하는 방향으로 사용할 것. 전문가 의견과 관련한 불확실성을

줄이기 위해 도출된 값을 중심으로 한 민감도 분석 결과를 제시하고 서로 다른 추정치에

분석 결과가 민감하지 않음을 분명히 진술하라

❍ 다음은 전문가 의견을 수집하는 방법을 제시한 표이다.

Information to be provided Notes

Criteria for selecting experts

Prefer a random or comprehensive set of prescribers likely to prescribe the proposed medicine, or the appropriate medical specialty group. In general., an advisory board created by the sponsor, or for advising on the drug development program or marketing may not be representative of experts in Australian clinical practice. The generalisability of expert

opinion derived from such boards is difficult to assess Number of experts

approacheda Where the likely number of prescribers is large, it is less acceptable to

provide expert opinion derived from a small number of prescribers

Number of experts who participateda

Assess whether the extent and characteristics of the nonresponders are likely to diminish the representativeness of the opinions provided,

compared with the intended sample approached

Declaration of potential conflicts of interest from each expert or medical specialty group whose opinion was sought

Provide a signed statement from each expert and specialty group specifying any potential conflict of interest and stating the nature of any contractual arrangement, including how much payment was offered and accepted. Where the collection of expert opinion has been contracted out, the contractor should provide this statement, reporting on both the arrangements made between the sponsor and the contractor, and the arrangements made between the contractor and those whose opinions

were sought Background information

provided and its consistency with the

Include a copy of any background information provided in the technical document or attachment. If background information has been provided, ask the experts to define the comparative clinical place of the proposed

<표 66> Table A1.1 Methods to collect and collate expert opinion

Page 231: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 223 -

a Tabulate these information items. b The way the questions are asked is an important source of potential bias in obtaining expert opinion. A particularly influential extension question extends the respondent beyond ‘what’ the opinion is (eg what would be done, what extent of benefit would be clinically important) to ask ‘why’ (eg

explain why would you do this, explain why this is important). Conveying these reasons alongside expert opinion–based estimates might help improve their acceptability. Including these explanations in the technical

document or attachment would allow the opinions to be assessed on the basis of the underlying reasoning rather than only depending on the authority of the experts

나) 영국 & 캐나다

❍ 특별한 지침 없음

4) 기타 문헌고찰 결과

☐ 문헌고찰

❍ Iglesias et al. (2016)은 전문가 판단을 전문가 의견(expert opinion)과 전문가 도출

(expert elicitation)로 구분하였다. 전자는 질적 판단을 끌어내는 것으로 초점집단, 명

totality of the evidence provided in the submission

medicine and the main comparator based on this background information. Including the experts’ definitions in the technical document or

attachment allows an assessment of the consistency of the background information with the evidence provided in the submission

Method used to collect opinions

For example, were the experts approached individually or was a meeting convened? Was any incentive used to maximise responses?

Medium used to collect opinions

For example, was information gathered by direct interview, telephone interview or selfadministered questionnaire?

Questions askedb

Explain the design of the tool (quantitative or qualitative). Describe its development. Indicate whether it was pilot tested and, if so, provide the results of that testing and explain how the results were used to improve

the questions. On a question-by-question basis, assess the extent to which each question is neutral or biased, and the extent to which each question is open or closed. To allow an independent assessment, include the questionnaire or an outline of the interview questions in the technical

document (or attach a copy) Whether iteration was used in the collation of

opinions and, if so, how it was used

The Delphi technique, for example, uses an iterative approach

Number of responses received for each

questiona

Assess whether the extent of any nonresponse is likely to diminish the representativeness of the opinions provided to particular questions,

compared with the intended sample approached

Whether all experts agreed with each response

If not, specify (i) the approach used to finalise the estimates (eg the majority opinion or a Delphi technique could be applied; for quantitative results, point estimates [such as the mean, median or mode] could be presented), and (ii) the approach used to present the variability in the opinions (eg present the range of opinions expressed, including common and outlying views; for quantitative results, measures of variance [such

as confidence intervals, range, centiles] could be presented)

Page 232: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 224 -

목집단기법, 델파이 조사 등을 예로 들었다. 후자는 통계적 형태로 양적으로 표현된

판단을 끌어내는 것으로 정량적 방법(예, roulette, tertile, probability 등)을 사용한다.

저자 등은 전문가들 간의 합의 과정을 통해 전문가 조사 결과를 보고하는 기준을 제

시하였다. 여러 가지 기준을 제시하였지만 참고할 만한 것으로 다음과 같은 것들이

있다.

- 전문가 집단에 대한 정의 – 그들이 어떤 전문성을 가지고 있는지, 왜 조사 대상이 되었는

지를 제시하라. 한명의 전문가로는 충분하지 않다. 해당 전문 분야를 대표할 수 있는 사

람들 중에서 조사 대상자를 선정하는 것이 좋다.

- 전문가의 수: 전문가 선택의 기준과 최종 참여 전문가의 수. 이때 선택의 기준은 상세하

게 제시하고, 참여율 같은 것이 있으면 이 또한 함께 제시하도록 한다

- 전문가 조사 계획서 제출

- 자료수집방법을 상세히 기술하라

- 조사지와 조사 방법을 제시하라

- 전문가들에게 주어진 배경 정보가 있는지, 있다면 이에 대해서도 제시하라

- 설문조사지 등 일체를 제시하라

- 결론 도출 방법

- 개별 응답자의 결과, 합산결과, 분포를 함께 제시.

- 불확실성에 대한 고려

- 윤리적 측면

- 델파이조사를 하는 경우: 반복 횟수, 조사 방법에 대한 상세 기술, 어떻게 이전 라운드에

서의 결과가 전문가들에게 피드백되었는지, 매 라운드마다의 질문지 제시, 매라운드 마

다의 응답률 제시, 델파이조사의 경우 패널의 구성이 결과에 영향을 미칠 수 있다.

❍ 최근 Bojke et al. (2019)도 보건의료 의사결정에 사용하는 전문가 의견도출에 참고할

프로토콜을 개발하였다. 전문가 의견 도출의 주요 원칙과 HTA를 위한 프로토콜은 다

음 표와 같다. 몇가지 내용을 살펴보면

- 전문가 구성에서 있어서는 해당 분야 전문가들이 가진 다양한 견해를 포괄할 수 있도록

구성할 것. 이해상충을 최소화하거나, 이해상충에 대한 기록이 필요. 해당 연구의 내부

자를 포함하지 않도록 하고 최소한 5명의 전문가를 포함하도록 권고함

- 정량적 값을 도출할 때는 가능한 한 단순한, 관찰 가능한 값을 도출하고, 워딩은 분명히

제시되어야 한다고 권고함

- 전문가들의 견해는 개별적으로 도출할 것을 권고함. 그리고 전문가들 사이에서의 변이

를 탐구하라고도 권고함

- 타당도를 평가하기 위하여 내외부 검토가 이루어질 수 있음

Page 233: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 225 -

- 의견 도출 과정에서 대면 접근을 권고. 그리고 전문가에게 도출 의견의 분포를 피드백해

주고, 피드백이후 전문가들은 견해를 수정할 기회를 부여할 것을 강조.

- 전문가들을 대상으로 한 (의견도출과 관련한) 훈련 세션 포함. 훈련의 내용은 바이어스

를 피하고 불확실성을 표현하는데 초점을 맞출 것.

- 시범조사 실시

- 의견 도출 이후에 전문가들이 어떻게 그들의 판단을 형성하였는지에 대한 rationale 수

집.

- 의견 도출과 관련된 모든 방법론적인 선택을 기록하고 정당화할 것.

<표 67> Key principles of SEE in HCDM

Principle Key message

1. Transparency SEE should be transparent and reproducible.

2. Fitness-for-purposeElicited information should be fit-for-purpose to be used as an input

to further analysis.

3. Consistency, but respecting constraints of the decision making context.

The SEE needs to adapt to the practical and logistic constraints faced by different contexts/decision-making bodies, but maintain a level of consistency in methods used across evaluations.

4. Reflecting uncertainty at the individual expert level

SEE must seek to elicit uncertainty in experts judgements.

5. Recognising and acting on biases

SEE must recognise common expert biases and employ strategies to minimise these.

6. Suitability for substantive experts who are less likely to be normative

SEE must utilise methods that are appropriate for experts with lower levels of normative skills.

7. Recognising where adaptive skills are required

When required SEE must employ methods that incorporate or promote the adaptive skills of experts.

8. Recognising between-expert variation

SEE must attempt to capture any between-expert variation, understand the reasons why it exists, and explore its potential impact on the decision.

9. Promoting high performance

SEE must motivate experts to best express their beliefs about a quantity of interest.

<표 68> A reference protocol for HTA

Element Reference methods suggested

Experts

1. Recruitment will be driven by the context, however the structured expert elicitation (SEE) should pursue diversity, representing the full range of valid experts beliefs. Experts should be willing to participate.

2. Focus on gathering substantive expertise or experience. Normative skills can

Page 234: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 226 -

5) 이해관계자 의견

- 없음

be developed during the training session as part of the SEE. 3. Minimize and record conflicts of interest among the experts. Include experts

external to the SEE task, i.e. not those involved in developing the task.4. At least 5 experts should be included in the SEE.

Quantities elicited

1. Simple observable quantities should be elicited where possible; ratios or complex parameters such as regression coefficients should not be elicited directly.

2. Dependence between variables should be captured in SEE. Expressing dependent variables in terms of independent variables is preferable when experts do not have strong normative skills.

3. Wording should be clear and quantities should be decomposed where this means a better fit with experts mental models.

Approach to elicitation

1. Beliefs should be elicited from experts individually, even if a group interaction follows.

2. Although interaction between experts can be structured through face-to-face sessions, constraints in healthcare decision-making (HCDM), such as a lack of experienced facilitators, will usually mean that this will take place via a Delphi style remote process.

2. Between-expert variation should be explored explicitly.

MethodBoth VIM(variable interval method) or FIM(fixed interval method) work well,

however decision makers should aim for consistency across applications.

Aggregation

1. Statistical distributions should be fitted to experts individually-elicited judgements.

2. Following fitting, a summary of the individual distributions should be obtained using linear pooling with equal weighting of experts.

3. Any adjustments applied should be to improve coherence and consistency not reduce variability. Internal and external review can be used to assess validity.

Delivery

1. Face-to-face where possible to allow a facilitator to deliver training to the expert.

2. Feedback to experts should be given during the SEE. Following feedback, experts should be given an opportunity to revise their distributions, either during or after a SEE session.

Training & piloting1. Training is crucial and should focus on avoiding bias and expressing

uncertainty.2. Piloting should be undertaken.

Rationales & documentation

1. Rationales for how the experts made their judgements should be collected post SEE.

2. All methodological choices for the SEE must be documented and justified.

Page 235: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 227 -

6) 지침 개정방향 제언

☐ 검토방향

❍ 1안은 기존 표와 설명 중 불필요하다고 판단되는 부분은 제외하고, 중요한 부분을 부

각시키는 방향으로 수정

- 전문가 선택 기준, 전문가 수, 이해상충

- 전문가에게 제공한 정보와 질문지 사본 제출

- 복잡한 지표보다는 경험을 통해 쉽게 도출할 수 있는 단순한 값 질문. 워딩을 명료하게

- 전문가별 조사 결과 제시

- 전문가 의견을 종합할때에는 평균뿐 아니라 중앙값, 변이 제시. 대푯값으로는 중앙값 선

- 민감도분석

- 조사 계획서 제출

- 의견 수렴의 전 과정 기술

- 조사결과 피드백 여부 제시

❍ 2안은 기존 표와 설명이 충분히 상세하므로 이를 유지하는 안이다.

Page 236: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 228 -

4. 결론

지금까지 현 의약품경제성평가지침에서 개정이 필요한 항목을 확인하고, 항목별 개정 방향

을 제안하였다. 그간 국내에서 진행된 경제성평가 방법론을 둘러싼 논의 내용과 제외국의 지

침 개정 현황을 고찰을 통해 잠정적 개정범위를 결정하고, 이해관계자에 대한 설문조사와 전

문가 자문회의를 통해 개정이 필요한 범위에 대한 의견을 구하였다. 이런 과정을 거쳐 확인

된 개정 필요 항목들에 대해서는 항목별 개정작업을 진행하였다. 그간 제약사가 심평원에 제

출한 자료를 분석하여 현 지침에 대한 준수여부와 준수 정도를 확인하였고, 경제성평가소위

원회 심의 결과를 통해 주로 쟁점이 되었던 내용들이 무엇이었는지, 좀 더 구체적 지침이 필

요한 부분은 무엇인지를 확인하였다. 또한 제외국 지침을 면밀히 분석하여 현재 요구되는 근

거의 수준을 파악하고, 추가로 관련 문헌고찰을 통해 각 항목별로 이론적, 실제적으로 쟁점

이 되고 있는 내용들이 무엇인지를 파악하였다. 마지막으로 이해관계자가 제출한 의견을 함

께 고려하여 지침 개정 방향을 제언하였다.

개정방향을 제안함에 있어 연구진들은 다음 몇 가지를 고려하였다. 첫째, 지침의 구체성,

명료성 확보이다. 현 지침도 경제성평가를 수행할 때 기준이 되는 방향은 제시하고 있으나,

이해관계자에 대한 조사나 전문가 자문회의 결과를 돌이켜보면, 사용자들은 동일한 지침을

두고서도 서로 다른 해석을 하는 경우가 많았다. 가령, 지침에서 명료하게 금지하거나 부정

적으로 언급한 바 없음에도, 지침에 해당 방법론이 구체적으로 제시되어 있지 않기 때문에,

심평원이 해당 방법론을 수용할 의사가 없다고 생각하는 경향도 있었다. 또한 동일한 지침에

대해 서로 다르게 해석하는 경우도 볼 수 있었다. 이에 경제성평가 수행자와 검토자가 각자

의 업무를 수행함에 있어 실질적 잣대가 될 수 있는 명료한 지침을 제공하고자 하였다. 둘

째, 그간 이루어진 방법론상의 진보와 합의수준을 충분히 반영하기 위해 노력하였다. 이를

위해 국내외 지침 뿐 아니라 관련 문헌을 포괄적으로 검토하였다. 셋째, 경제성평가 자료를

준비해야 하는 국내 기업과 연구자의 수용태세도 고려하였다. 아무리 좋은 방향이라 하더라

도 실제 이를 수행해야 할 주체들이 따를 수 없는 지침이라면 유명무실한 지침이 되고 말

것이기 때문이다. 넷째, 일관된 의사결정을 뒷받침할 수 있어야 한다는 점도 고려하였다. 따

라서 기본분석은 지침에서 제시한 방법론대로 수행하고, 다른 타당한 접근은 민감도 분석을

하거나 별도 분석결과를 제시하도록 하였다. 마지막으로 비용-효과성을 둘러싼 불확실성을

중요하게 고려하였다.

이상의 원칙을 바탕으로 각 파트 별로 먼저 현 지침에서 개정이 필요한 부분을 검토하고,

기존에 제출된 신청 건들을 분석하여 국내 경제성평가 수행 현황을 살펴보았다. 이어, 캐나

다, 호주, 영국, 그리고 그 외 국가들의 지침과 기타 문헌 검토를 통해 현재 전세계적으로 통

Page 237: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 229 -

용되고 수용되는 방법론, 자료요구 수준을 확인하였으며, 마지막으로 이해관계자가 제출한

의견을 고려하여 개정안을 마련하였다. 개정 방향과 관련한 제안 내용은 연구진이 준비한 개

정안에 대한 전문가 자문회의를 거쳐 최종 마련되었다.

본 연구에서 제안한 내용들, 그리고 이 보고서와 함께 제시하는 지침 초안은 추후 다양한

이해관계자의 의견수렴 과정을 거쳐 최종 개정 가이드라인으로 확정될 예정이다. 이 보고서

는 추후 발표될 지침의 배경 정보를 제공하는 역할을 한다.

아울러 지침 개정안을 마련하는 과정에서 일부 추가 연구가 필요한 부분이 확인되었다. 추

후 이들 연구가 진행되고 나면 이에 맞추어 추가 지침 개정이 필요할 수 있다. 다른 나라의

지침 개정과정과 우리나라의 지침 개정 과정을 비교해보면 다른 나라는 전면 개정 이전이라

하더라도, 필요한 부분에 대한 원포인트 개정을 실시하고 있으나, 우리나라는 지금까지 심평

원이 공개하는 문서를 통해 심의 방향을 일부 밝히기는 하였으나, 그 외에는 전면 개정때까

지 지침 개정은 하지 않았다. 변화하는 상황에 보다 유연하게 대처하기 위해서는 전면 개정

뿐 아니라 수시 개정 또한 진행할 필요가 있다. 또한 경제성평가를 함에 있어 본 지침만으로

는 충분하지 않다. 다른 나라의 경우를 봐도 의약품 경제성평가지침 외에 비용 매뉴얼, 각종

통계 방법론에 대한 매뉴얼 혹은 문서가 웹사이트에 게시되어 자료 제출을 준비하는 측에서

활용할 수 있도록 하고 있다. 우리나라의 경우 간접비교지침 정도가 제시되어 있고, 비용 매

뉴얼은 한국보건의료연구원에서 2013년에 발표한 책자가 활용되고 있다. 이 지침의 개정과

더불어 관련 지침도 함께 업데이트되거나, 추가로 제공될 필요가 있다.

Page 238: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 230 -

부록 1. 상호의존 의료기술에 대한 세부 지침 (호주)

☐ Section 1 – Context - 다음의 정보는 PBAC에 제출하는 신청서의 Part A, Section 1과 관련된 것

❍ 생물학적표지자, 검사, 의약품에 대한 상세내용

- 추가적 요청 자료

- 1 (O) 검사와 의약품의 현재 급여 상황 기술

- 2 (T) 검사의 sponsor 확인

- 3 (M) 의약품의 sponsor 확인

- 4 (O) 생물학적 표지자에 대한 기술

- 5 (T) 제안된 검사에 대한 기술

- 6 (O) 적응증에 대한 기술

- 7 (O) 적절한 임상 관리 경로(clinical management pathways) 기술

❍ 상호의존성에 대한 rationale

- 추가 요청 정보

- 8 (O) 생물학적 표지자를 정의하라

- 9 (O) 신청약이 제안된 바이오마커를 타켓팅한다는 생물학적 rationale를 제공하라.

- 10 (O) 의약품의 상대적 치료효과를 수정(modify)하는 다른 바이오마커들에 대해 정의하

- 11 (O) 검사를 받게 될 가능성이 있는 사람들 중에서 목표로 하는 상태의 유병률을 정의

하라

❍ 상호의존기술이 현재 임상진료에 미칠 영향

- 추가요청정보

- 12 (T) 제안된 검사가 질병이나 상태의 경로에 대한 것을 포함하여 시간의 흐름에 따라

일관될 것으로 기대되는지를 진술하라

- 13 (T) 제안된 검사가 다른 치료, 그리고/혹은 다른 목적으로 사용될 수 있는지를 제시하

- 14 (T) 제안된 검사가 현재 사용되고 있는 다른 검사에 부가적인 검사인지, 대체적인 검

사인지, 아니면 둘 다 인지(검사결과에 따라 다른 검사에 부가적으로 혹은 일부 검사를

대체하여)를 진술하라.

Page 239: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 231 -

- 15 (T) 제안된 검사가 호주에서 어떻게 제공될지(will be offered)를 기술하라

- 16 (T) 검사를 위해 필요한 biospecimen 혹은 sample을 확인하라. 그리고 이러한

specimen이 그 검사만을 위해 특이적으로 수집될 필요가 있는 것인지, 아니면 다른 목적

으로 이미 수집된 것인지를 확인하라.

- 17 (T) 새로운 somatic mutations의 발생을 모니터하기 위하여, 그리고/혹은 상호의존적

의약품의 용량 혹은 치료중단을 결정하기 위하여 이어지는(subsequent) 검사가 필요한

지를 기술하라 (적절하다면)

- 18 (O) 제안된 의약품이 제안된 검사 외에 해당 바이오마커를 확인하기 위한 다른 특이

적 검사와 함께 사용될 수 있는지를 확인하라. 바이오마커 검사로 가용한 방법들을 기술

하라

☐ Section 2 – Clinical evaluation❍ 직접근거에 기초한 접근(Approach based on direct evidence )

- Section 2a – 바이오마커의 예후 효과

- Section 2d – 상호의존기술의 임상적 평가 (결합사용의 근거)

- 그리고/혹은

- 연계근거에 기초한 접근(Approach based on linked evidence)

- Section 2a – 바이오마커의 예후 효과

- Section 2b – 제안된 검사의 성과(performance)와 정확도

- Section 2c – clinical management의 변화

- Section 2d – 상호의존기술의 임상적 평가(별개)

- 각 Section 2는 이 가이드라인의 Part A에 제시된 단계들을 따른다

❍ 직접 근거 접근(direct evidence approach)

- 추가 요청 정보: 직접 근거

- 19 (O) 바이오마커 검사가 제공된 clinical management와는 무관하게 환자 건강 성과에

서의 차이를 예측할 수 있는지를 결정하라

- 20 (0) 직접근거의 검색이 포괄적이고 선정과정이 편향되지 않음을 확인하라

- 21 (O) 비뚤림, confounding, 직접근거에 제시된 결과에 미치는 우연(chance)의 영향을

평가하라

❍ 연계 근거 접근 (Linked-evidence approach)

- 추가 요청 정보: 연계 근거

Page 240: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 232 -

- 22 (T) 제안된 검사의 분석적 성과(analytical performance)을 기술하라

- 23 (T) 제안된 검사의 성과(performance)를 측정할 때 사용할 참고치 혹은 gold standard

를 정의하라

- 24 (T) 제안된 검사의 진단 정확도나 예측 정확도에 대한 근거 검색이 포괄적이었는지,

그리고 근거 선정 과정이 편향되지 않았는지를 확인하시오

- 25 (T) 제안된 검사의 진단정확도 혹은 예측 정확도를 보고하는 근거가 (i) 양질의 것인

지, 그리고 (ii) 요청된 MBS 목표집단에 적용가능한 것인지를 확인하라

- 26 (T) 진단 정확도 혹은 예측 정확도의 측면에서 제안된 검사의 performance를 보고하

라. 만약 여러 종의 검사가 제안되었거나 혹은 특정 검사를 특정하지 않았다면, 어느 검

사의 performance가 가장 좋은지를 확인하시오, 만약 검사 정확도를 결정할 수 없다면

검사들 간의 일치도나 concordance를 계산하시오

- 27 (T) 어느 검사가 가장 접근성이 좋은지/가용한지/사용되는지를 확인하시오. (몇몇의

검사가 제안되었으나 특정 검사가 특정되지는 않은 경우에만)

☐ section 2c Change in clinical management

- 추가요청자료: 연계 근거

- 28 (O) 검사에 대한 지식이 치료를 담당하는 임상의의 환자 관리에 변화를 가져올 것인

지를 입증하시오. 검사로 바이오마커가 존재한다는 것을 확인하였음에도 management

가 변하지 않은 예를 확인하시오

☐ Section 2d 상호의존기술에 대한 임상적 평가 (따로 separate)

- 추가요청정보: 연계 근거

- 29 (T) 전체 검사 과정에 영향을 미칠 수 있는 안전성에 대한(any safety consideration)

고려 확인

- 30 (M) 제안된 의약품의 치료효과에 대한 근거 검색이 포괄적이었고, 근거 선정 과정이

편향되지 않았는지 확인하라(indicate)

- 31 (M) 제안된 의약품의 치료적 효과를 보고하는 근거가 양질인지를 확인하라

- 32 (O) 적절하다면 바이오마커 상태에 따른 치료효과변경(즉 상호작용)의 근거를 제공하

- 33 (O) 적절하다면 검사를 함으로써 의약품에 가장 잘 반응할 환자를 보다 잘 타켓팅한

다는 근거를 제공하라 (즉 질병이나 상태 악화의 기저 위험을 결정하기 위하여 바이오마

커의 예후 효과를 이용함으로써)

- 34 (O) 검사나 바이오마커 결과에 의해 conditioned된, 의약품의 효과가 환자 관련 건강

Page 241: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 233 -

성과 면에서 임상적으로 중요하고 통계적으로 유의한 효과가 있었는지를 확인하라(안전

성과 효과 모두)

❍ 상호의존기술의 효과의 적용가능성

- 추가요청 정보

- 35 (O) 상호의존기술의 임상적 효과를 지지하는 근거가 호주 국민들에게, 그리고 각 기

술들을 이용하는 상황에 적용가능한 것인지 확인하라.

☐ Section 3 – 경제성평가

❍ 모형의 구조

- 추가요청 정보

- 36 (O) 모형의 구조가 비슷한 상황에서 수행된(검사나 치료 결정전에 시작하는) 다른 경

제성평가와 일관되어 있는지 확인하라

- 37 (O) 모형구조가 항목 7에 따라 제공된 임상적 경로와 일관된 것인지 확인하라

- 38 (O) 적절하다면, 제안된 검사를 이용하는 것과 관련된 비건강 관련 영향에 대한 보충

적 분석을 제공하라

❍ 검사결과와 관련된 전이확률

- 추가요청정보

- 만약 Section 2에서 연계근거접근이 사용되었다면 모형에 다음을 계산하고 포함하라:

- 39 (O) 제안된 검사의 양성 예측 값 (PPV)

- 40 (O) 제안된 검사의 1-PPV

- 41 (O) 제안된 검사의 음성 예측값 (NPV)

- 42 (O) 제안된 검사의 1-NPV

- 43 (O) 모형에서 (i) 진양성 환자와 위양성 환자에서 제안된 의약품과 관련된 (ii) 진음성

과 위음성 환자에서 비교약과 관련된; 혹은 iii) 직접 근거에서 보고된 (검사의 이중 혹은

단일 RCT가 가용한 상황에서) 부작용의 발생률을 제공하라

- 44 (O) 모형에서 모든 검사받은 사람에서 검사와 관련된 부작용 발생률을 포함하라.

- 45 (O) 치료효과변경에 더하여 예후 효과가 작동하는 경우, 절대 치료효과를 제시할 때

모델이 이러한 요소들을 보정하였음을 보장하라

❍ 모형에 포함된 자원 항목과 비용

- 추가요청정보

Page 242: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 234 -

- 모형에 다음 비용을 포함하라:

- 46 (O) 단위 검사비용

- 47 (O) (적절하다면) 샘플링 비용

- 48 (O) 검사 administration 비용

- 49 (O) 검사결과와 치료계획과 관련한 의료진의 환자 상담 비용

- 50 (O) 재검사와 평가할 수 없는 결과의 비용

- 51 (O) 검사와 관련된 부작용 비용

- 52 (O) 제안된 검사의 결과로 추가적으로 실시해야 하는 검사의 비용

- 53 (O) 검사결과가 위양성인 경우를 포함하여 의약품과 관련된 부작용 비용

- 54 (O) 적절한 다른 보건의료자원비용(예, 진단, 의료, 병원, allied health)

❍ 모형에서의 불확실성

- 추가요청정보

- 55 (O) 의약품의 치료효과를 둘러싼 불확실성을 평가하라

- 56 (O) Section 2에서 연계근거접근이 사용되었을 때 검사 정확도를 둘러싼 불확실성을

평가하라

- 57 (O) Section 2에서 연계근거접근이 사용되었을 때 바이오마커의 유병률을 둘러싼 불

확실성을 평가하라

- 58 (O) 적절하다면, 선행요건으로 제안된 검사를 하지 않고 의약품을 PBS에 등재하는 옵

션에 대해 scenario analysis를 제공하라

☐ Section 4 – 임상에서의 의약품 사용

- 추가요청정보

- 59 (O) MBS와 PBS를 통틀어 재정영향분석을 하라. 그리고 결과를 부문별로 나누어라(공

공, 민간, 환자, 기타)

- 60 (O) 검사결과에 의해 결정되는 바이오마커의 유병률에 기초하여 질병부담의 역학적

추정치를 계산하시오

- 61 (O) 검사대상인 모든 환자의 검사비용과 평가불가 혹은 indeterminate 결과가 나왔을

때의 재검비용을 추정하시오. 만약 치료가 시작된 후에도 검사가 요구된다면 (즉, 치료

를 모니터하거나 치료 중단을 결정하기 위하여), 이 비용도 포함되어야 한다. 적절하다

면, 제안된 검사를 선행요구사항으로 하지 않고 의약품을 PBS에 등재시키는 것에 대한

scenario analysis도 제공하라

- 62 (O) 검사와 의약품이 등재된다면 발생할 다른 MBS 비용도 모두 추정하라

Page 243: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 235 -

부록 2. 진단검사의 경제성평가와 관련한 체크리스트

☐ Kip et al. (2018)이 제시한 체크리스트

<표 69> Reporting checklist to indicate which items were included in the health economic

evaluation of diagnostic tests and biomarkers

Items of the Evaluation of Diagnostic Tests and Biomarkers

Included in evaluation

Yes No

Time to presentation Onset of complaints or onset of suspicion by physician and start of diagnostic trajectory

1.1

The study should contain a description of the individuals who enter the diagnostic pathway (i.e., a patient develops a [new] condition or disease, which may or may not result in symptoms or complaints, or undergoes diagnostic testing as part of screening or genetic testing).

1.2

Consider the time to start of the diagnostic trajectory or the time until a monitoring or screening test is (repeatedly) performed (initiated by symptoms/complaints or initiated as part of regular screening or monitoring).(The time between 1.1 and 1.2 is the time during which individuals are at risk of complications from disease and progression, in the absence of a diagnosis and thus also in the absence of treatment.)

Use of diagnostic tests Decision regarding which diagnostic test(s) is/are performed, in which patients, and in

what order

2Specify for which purpose(s) the test is used (e.g., screening, diagnosing,

monitoring, guide dosage, commencement or cessation of therapy, triaging, staging, prognostic) and define the entire diagnostic and clinical pathway.

2.1Consider whether more than 2 (possible) diagnostic strategies can be

compared, each involving a single test or combination of tests.

2.2Consider whether the evaluated diagnostic strategies include multiple tests,

which can be performed in parallel or in sequence.

2.2.1Consider whether some tests of the diagnostic workup are performed

conditional on previous test outcomes, leading to a selection of patients undergoing specific tests.

2.3Consider whether subgroups can be defined based on explicit criteria or

patient characteristics, in which different tests would be performed (not solely dependent on previous test outcomes).

2.4Consider whether different tests are applied based on implicit (shared)

decision making (e.g., perceived condition or risk, or symptom presentation). Test performance and characteristics

Diagnostic test performance and items related to the sampling and testing

3.1 Specify the costs of the diagnostic test

3.2Specify test performance, in terms of sensitivity, specificity, negative

predictive value (and its complement), and/or positive predictive value (and its complement), either or not combined with a decision rule or algorithm.

3.2.1 Describe the evidence base for the estimated test performance.

Page 244: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 236 -

3.2.2Describe the positivity criterion (i.e., cutoff value) applied to the test or

testing strategy

3.2.3

Consider whether the estimated test performance may be biased, for example, due to lack of evidence on conditional dependence or independence, lack of a (perfect) gold standard (i.e., classification bias), verification bias, analytic bias, spectrum bias, diagnostic review bias, and incorporation bias.

3.2.3.1Consider how likely/to what extent bias in the available/applied evidence

affects the estimated test performance

3.2.4Describe how uncertainty/variation in the test performance (receiver

operating characteristic [ROC] curve) was handled or explained, for example, due to interrater and intrarater reliability, or experience of the clinician.

3.2.5Describe the logic, or analysis, applied to choose the cutoff value (i.e., the

point on the ROC curve) for the test, for example, depending on whether the test is used as a single test or part of a sequence of tests.

3.2.6

Describe whether different test performances and cutoff values were considered for different subgroups of patients and/or environmental characteristics. For example: based on specific subgroup(s) of patients, timing of the test in the diagnostic trajectory, or selection of patients based on previous test outcomes (if any).

3.2.7

Consider whether test performance is dependent on disease prevalence (which also includes the impact of spectrum bias on disease prevalence and, as a consequence, on test performance) or affected by other patient characteristics or conditions.

3.2.8Consider whether test performance is based on a combination of tests (and

on a combination of areas under the ROC curves for each test).

3.3Consider the feasibility of obtaining (sufficient) sample and/or usability of the

sample that is obtained.

3.4Consider the occurrence of test failures or indeterminate/not assessable

results.

3.5Consider costs of retesting (after obtaining insufficient/unusable sample or

after test failure or indeterminate/not assessable result).

3.6Consider complications, risks, or other negative/positive aspects directly

related to obtaining the sample and/or performing the diagnostic test (either in the intervention or in the control strategy).

3.7

Consider the time taken to perform the test (including waiting time) until the test result is available or until a management decision or treatment is initiated based on this test result (either in the intervention or in the control strategy).

3.8

Consider the impact of additional knowledge gained by performing the diagnostic test (i.e., for a genetic test) or the occurrence and impact of incidental findings (i.e., the unintentional discovery of a previously undiagnosed condition during the evaluation of another condition).

3.8.1 The impact of incidental findings on performing additional tests is addressed.

Patient management decisions Impact of a test on the diagnosis and/or patient management strategy (based on this

diagnosis)

4.1Clearly specify the impact of the test in selecting the patient management

strategy.

4.2Consider whether other aspects besides test results themselves are part of

the decision algorithm (and included in the evaluation). These may involve a

Page 245: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 237 -

shared decision-making process of the physician with patients/relatives or aspects including coverage or physician adherence to treatment guidelines.

4.3

Consider whether the impact of the test result on resulting/selected diagnosis or management strategy varies across subgroups (this difference should not only be caused by differences in diagnostic performance of the test and does not need to include the impact on costs and/or health outcomes within this subgroup).c

4.4Consider the consistency of test results over time (e.g., genetic mutations

may be affected by treatment prescribed after the initial diagnosis).

4.5Consider the impact of performing the test and providing and interpreting

the result on the time spend/capacity of the health care professional(s) or the patient.

Impact on health outcomes and costs Impact of the patient management strategy on diseased and nondiseased individuals, in

terms of health outcomes and costs

5Evaluate the direct impact of the chosen patient management strategy on

the number of (in)correctly diagnosed individuals, health outcomes, and/or costs.

5.1

Consider the direct impact of the chosen patient management strategy on health outcomes and/or costs. This concerns the entire period in which patient management may affect a patient’s health and/or costs and does not only involve the testing strategy itself.

5.2

Consider whether the direct impact of the chosen patient management strategy on health outcomes and/or costs varies across subgroups. (This does not include only varying the incidence of a certain condition in a sensitivity analysis. The subgroups should be clearly defined and preferably be identifiable based on patient characteristics. c )

5.3

Consider patient’s adherence to treatment (which includes aspects that may indicate (partial) nonadherence (e.g., following only some of the treatment recommendations, as well as aspects that affect the degree of administration of treatment).

5.4Consider the occurrence (and consequences) of treatment-related adverse

events.

5.5

Describe the probability or time it takes to observe that the patient management strategy proves to be effective over time or that the patient cures spontaneously (regardless of whether the patient received a correct or an incorrect diagnosis).

5.6

Describe the probability of or time it takes to repeat or extend the diagnostic workup when the patient management strategy proves to be ineffective, either directly or over time (regardless of whether the patient received a correct or an incorrect diagnosis). This also includes the situation in which the patient receives no treatment or unnecessary treatment.

5.7

Describe the impact of ineffective or unnecessary treatment or management on health outcomes and/or costs (including both side effects and costs and regardless of whether the patient received a correct or an incorrect diagnosis). This also includes the situation in which incorrectly no treatment is provided or in which the treatment is delayed.

5.7.1Consider the impact of delay in treatment initiation on health outcomes

and/or costs.Societal impact

Wider (societal) impact of the chosen diagnostics and management strategy

Page 246: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 238 -

a If an item is included in the quantitative analysis, indicate the corresponding model parameter(s) and evidence source(s).

b If an item is excluded from the quantitative analysis, please explain why the exclusion was necessary.c Existing guidelines indicate that subgroup analyses are relevant when different strategies are likely to be

(sub)optimal in different subgroups. Subgroup specific analyses can then be performed to address multiple decision problems. Here we consider scenarios where different tests may be used in different subgroups, depending on patient characteristics or previous test outcomes.

☐ Yang Y et al (2019)이 제시한 체크리스트

<표 70> Checklist for model-based economic evaluations of diagnostic tests

6.1

Consider the psychological impact of the diagnostic outcome and management strategy on patients, including the value of knowing (in terms of reassurance or anxiety), patient preferences regarding undergoing diagnostic tests, the (accompanying) impact on caregivers or relatives, and so on.

6.1.1

Consider the impact of test outcomes on relatives themselves, regarding the value of knowing (spillover knowledge) and regarding subsequent testing and/or treatment in this group (in case of heritable genetic conditions or contagious diseases).

6.2Consider the additional impact of diagnostic outcome and management

strategy on the health system or health care professionals.

6.3Consider the additional impact of diagnostic outcome and management

strategy for society.

Domain Question

1. Decision problem and scope specified

1. Is there a clear statement of the decision problem?

2 Is the perspective of the model stated clearly?

3 Has the target population been identified?

4 Are the model inputs consistent with the stated perspective?

5 Are the primary outcomes of the model consistent with the perspective, scope and overall objective of the model?

2. Identification and description of comparators

6. Have all feasible and practical options been identified?

7. Have the comparators being evaluated been clearly described?

8. If comparators have been excluded from the evaluation, have these exclusions been justified?

3. Appropriate data identification

9. Are the data identification methods transparent, systematic and appropriate given the objectives of the model?

4. Sufficient detail for data incorporation

10. Have all data incorporated into the model been described and referenced in sufficient detail?

11. Where choices have been made between data sources, are these justified appropriately?

Page 247: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 239 -

Domain Question

12. Are transition probabilities calculated appropriately?

13. Has discounting been conducted?

5. Quality and incorporation of test

accuracy data

14. Has the quality of the test accuracy data been assessed?

15. Have diagnostic accuracy data been derived from high quality data sources (hierarchy of evidence)?

16. Are tests in sequence treated dependently, where appropriate?

6. Quality and incorporation of treatment data

17. Has the quality of the treatment effect data been assessed?

18. Have relative treatment effects been derived from high quality data sources (hierarchy of evidence)?

7. Source and incorporation of cost

data

19. Has the source of cost data been presented clearly?

20. Have costs been inflated to a specific year, where appropriate?

8. Source and incorporation of utility

data

21. Is the source for the utility weights referenced and justified?

22. Are the utilities incorporated into the model appropriately?

9. Model structure 23. Have the reasons behind the type of decision analytic model chosen been fully described and justified?

24. Has a systematic review of existing economic evaluations been carried out?

25. Is the structure of the model consistent with a coherent theory of the health condition under evaluation?

26. Are the structural assumptions underpinning the model transparent and justified?

27. Have the methods used to extrapolate short-term results to final outcomes been documented and justified?

28. Has the time horizon been stated and justified?

29. Has cycle length of Markov models been justified?

10. Uncertainty 30. Has parameter uncertainty been addressed via sensitivity analysis?

31. Has probabilistic sensitivity analysis been carried out? If not, has this omission been justified?

32. If data are incorporated as point estimates, are the ranges used for sensitivity analysis stated clearly and justified?

33. If data have been incorporated as distributions, has the choice of distribution for each parameter been described and justified?

34. Have structural uncertainties been addressed via sensitivity analysis?

Page 248: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 240 -

<표 71> Checklist questions with poor performances n (%)

The percentages might not add up to 100% due to rounding. Percentages were calculated by n/N (i.e. n/a are excluded)

Domain Question

35. Have alternative assumptions related to final outcomes been explored through sensitivity analysis?

36. Has value of information analysis been done?

11. Validity 37. Has the face validity been reviewed by someone external to the model developers?

38. Has the mathematical logic of the model been assessed? (e.g. using null and extreme values)

39. Have the model and its results been compared to the findings of other models and studies, and any disagreements or inconsistencies been

explained (cross-validity)?

Questions Met Partially met

Not met

N (Excluding n/a)

If comparators have been excluded from the evaluation, have these exclusions been justified?

19 (50) 15 (39)

4 (11) 38

Has the quality of the treatment effect data been assessed?

10 (20) 15 (29)

26 (51) 51

Are transition probabilities calculated appropriately? 19 (66) 6 (21) 4 (14) 29

Are tests in sequence treated dependently, where appropriate?

11 (32) 8 (24) 15 (44) 34

If data have been incorporated as distributions, has the choice of distribution for each parameter been

described and justified?

12 (26) 30 (64)

5 (11) 47

Have structural uncertainties been addressed via sensitivity analysis?

0 (0) 12 (22)

43 (78) 55

Has the face validity been reviewed by someone external to the model developers?

16 (29) 15 (27)

24 (44) 55

Have the model and its results been compared to the findings of other models and studies, and any disagreements or inconsistencies been explained

(cross-validity)?

27 (50) 8 (15) 19 (35) 54

Page 249: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 241 -

부록 3. 이해관계자 설문조사지

의약품경제성평가지침 개정에 대한 의견조사- 제약사 대상 -

안녕하십니까? 본 연구는 건강보험심사평가원에서 배포하는 의약품 경제성평가지침의

개정에 대한 연구입니다. 본 조사는 지침 개정에 앞서 지침 개정 범위에 대한 이해관

계자들의 의견을 듣기 위하여 계획되었습니다. 본 조사는 자발적으로 참여 의사를 밝

히신 분에 한하여 수행될 것이며 필요하다면 담당 연구원( )에게

질문하실 수 있습니다. 귀하께서 응답해주시는 모든 내용은 개인정보 없이 보관되며

연구를 위한 기초자료로만 활용될 것입니다. 본 조사의 응답 기한은 8월 16일까지이며

응답을 마치신 후에는 담당 연구원에게 메일로 설문지를 보내주시면 됩니다. 감사합니

다.

2019년 7월

연구책임자 이태진(서울대학교 보건대학원)·배은영(경상대학교 약학대학)

1. 현 소속이 어떻게 되십니까? ( )

① 국내 제약회사 ② 외국계 제약회사

2. 경제성평가 자료를 제출해본 경험이 있으십니까? ( )

① 없음 ② 있음

※ “없음”을 선택하신 경우 4번으로, “있음”을 선택하신 경우 3번으로 이동해주세요.

3. 경제성평가 자료 제출 시 자료는 누가 작성하였습니까? ( )

① 자사 직원 ② (외국계 회사의 경우) 본사 ③ 외부 연구자 ④ 기타

4. 다음은 현 의약품 경제성평가 지침안의 내용을 요약한 것입니다. 개정이 필요하다고 생각

하시는 항목을 모두 체크(V)해주시기 바랍니다.

항목번호

항목 내용개정필요

평가의 일반사항

1 관점 제한적 사회적 관점

2 분석기간 주요 임상결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장

Page 250: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 242 -

항목번호

항목 내용개정필요

3분석대상 인구

집단

Ÿ 비용과 결과가 도출된 인구집단 명시

Ÿ 급여대상 인구집단으로 일반화 가능한지 근거 제시

4 분석기법 CEA 또는 CUA. 최종지표 사용 권장

5 분석결과 제시 ICER. 총비용과 총효과 별도 제시

6 보고 단계별 결과와 분석에 포함된 자료들을 구체적으로 제시

평가 방법

7 비교대상 선정

등재의약품이 있는 경우는 이들 중 가장 많이 사용되는 것. 동일성분의

의약품이 다수 있는 경우는 시장점유율을 이용한 가중평균가격을 비

교약의 단위비용으로 이용

8 자료원

Ÿ 비뚤림의 가능성이 낮은 자료원(예, RCT) 우선선택.

Ÿ 신청약과 비교약을 직접 비교한 자료원 선호

Ÿ 직접비교 자료원이 없는 경우 공통대조군을 이용한 간접비교도 허용

9 자료검색 포괄적 검색. 검색 전략 상세히 제시

10 자료선정자료 선정작업 시작 전 포함·배제기준 정립. 보고서에 상술. 배제문헌 목

록 및 배제 근거 제시

11자료의 추출

및 평가

최종 선정자료에 대해 각 자료의 특징 및 결과를 요약·제시. 질평가 결

과도 제시

12 메타분석 이질성 고려

13 비용 비용항목 열거 → 자원소모량 측정 → 단위비용 적용 → 최종 비용 산출

14 비용항목

Ÿ 제한적 사회적 관점을 취함에 따라 직접 보건의료비용, 환자 및 가족

(또는 간병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 포함

Ÿ 생산성 손실 비용 및 해당 질병의 치료와 관련되지 않은 미래 의료

비용은 기본분석에 포함하지 않음

Ÿ 보험자 관점에서 분석할 경우 비급여 항목은 기본분석에서 제외

15 비용산출각 항목의 사용량 측정과 단위비용 산출 과정을 자세히 기술. 단위비용

과 자원사용량의 자료원은 국내 자료 이용

결과

16 결과지표 최종결과(final outcome) 사용 권장

17효용, 건강관련

삶의질

Ÿ QALY 사용. 질가중치는 선호도 반영한 것. 외국에서 개발된 도구를

사용할 때는 국내에서 타당도 검증이 된 것 사용. 선택도구를 지침의

별첨 3, 표4에 근거하여 정당화하고 민감도 분석을 통해 질가중치의

불확실성이 결과에 미치는 영향 검토.

Ÿ 기본분석에서는 선호도에 근거한 일반도구의 사용이 권장됨. 건강상

태의 선호도 측정 대상은 국내의 대표성 있는 일반대중을 선호. 기존

문헌에서 질가중치 값을 인용하는 경우 자료원의 포함·배제 기준을

상세히 설명하고 근거를 제시하는 등 선정과정을 투명하게 보고. 또

한 해당 건강상태에 적용가능한 지 여부를 논의하고 불확실성 평가

18 할인율 5% 기본, 0%, 3%, 7.5% 민감도 분석

Page 251: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 243 -

5. 위에서 체크한 항목들의 개정이 필요한 이유, 생각하시는 개정 방향, 근거(문헌 근거)는

무엇입니까? (별도 페이지에 작성 가능)

항목번호

항목 내용개정필요

19 모형구축

Ÿ 모형에 대한 상술

Ÿ 모형 분석 단계마다 해당 질병 상태에 있는 사람(코호트 시뮬레이션

인 경우)들의 수, 비용 등을 기술

Ÿ 다른 나라에서 개발된 모형의 경우 국내 상황에도 이를 적용할 수

있는지 검토

20 불확실성

Ÿ 경제성평가과정에서 사용한 모든 가정과 기타 불확실성을 초래하는

원천에 대하여 임상적, 통계적으로 타당한 범위에 걸쳐 일원민감도분

석 실시. 모수에 관련된 불확실성은 PSA 권장.

Ÿ 급여를 제한하여 신청하는 경우, 식약처 허가사항까지 대상이 확대되

는 경우에 대한 민감도 분석 추가 제시

21 일반화

Ÿ 단위비용 및 자원사용량 자료는 국내 자료 이용

Ÿ 국내 유병률이나 진료패턴이 외국과 크게 차이가 나서 결과의 국내

적용이 문제될 수 있는 경우는 국내 자료를 토대로 분석 실시, 이를

임상시험 자료에 기초한 분석결과와 함께 제시

Ÿ 다국가 임상시험의 경우 내국인 피험자수가 통계적으로 의미있는 결

론을 내릴 수 있을 정도로 충분하다면 내국인 피험자의 시험결과를

기본분석, 전체피험자의 시험결과로 민감도 분석 실시. 그렇지 않은

경우는 전체 피험자의 임상시험결과를 기본분석으로 실시

22 형평성 형평성 관련하여 어떤 가정을 하였는지 기술. 급여결정의 수혜집단 기술

23 재정영향 도입 후 3-5년간 보험재정에 미치는 영향 분석

항목번호

개정이 필요한 이유 개정 방향 근거

Page 252: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 244 -

6. 기타 의약품 경제성평가지침 개정 시 고려할 사항이 있다면 말씀해주시기 바랍니다.

( )

완료된 설문지는 아래 메일주소로 보내주시면 됩니다.

감사합니다.

항목번호

개정이 필요한 이유 개정 방향 근거

Page 253: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 245 -

의약품경제성평가지침 개정에 대한 의견조사- 환자·시민단체 대상 -

안녕하십니까? 본 연구는 건강보험심사평가원에서 배포하는 의약품 경제성평가지침의

개정에 대한 연구입니다. 본 조사는 지침 개정에 앞서 지침 개정 범위에 대한 이해관

계자들의 의견을 듣기 위하여 계획되었습니다. 본 조사는 자발적으로 참여 의사를 밝

히신 분에 한하여 수행될 것이며 필요하다면 담당 연구원( )에게

질문하실 수 있습니다. 귀하께서 응답해주시는 모든 내용은 개인정보 없이 보관되며

연구를 위한 기초자료로만 활용될 것입니다. 본 조사의 응답 기한은 8월 23일까지이며

응답을 마치신 후에는 담당 연구원에게 메일로 설문지를 보내주시면 됩니다. 감사합니

다.

2019년 8월

연구책임자 이태진(서울대학교 보건대학원)·배은영(경상대학교 약학대학)

1. 현 소속이 어떻게 되십니까? ( )

① 환자 단체 ② 가입자(소비자) 단체 ③ 기타

2. 약제 급여 결정 관련 의사결정에 위원으로 참여한 경험이 있으십니까? ( )

① 없음 ② 있음

3. 다음은 현 의약품 경제성평가 지침안의 내용을 요약한 것입니다. 개정이 필요하다고 생각

하시는 항목을 모두 체크(V)해주시기 바랍니다.

항목번호

항목 내용개정필요

평가의 일반사항

1 관점 제한적 사회적 관점

2 분석기간 주요 임상결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장

3분석대상 인구

집단

Ÿ 비용과 결과가 도출된 인구집단 명시

Ÿ 급여대상 인구집단으로 일반화 가능한지 근거 제시

4 분석기법 CEA 또는 CUA. 최종지표 사용 권장

5 분석결과 제시 ICER. 총비용과 총효과 별도 제시

6 보고 단계별 결과와 분석에 포함된 자료들을 구체적으로 제시

평가 방법

Page 254: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 246 -

항목번호

항목 내용개정필요

7 비교대상 선정

등재의약품이 있는 경우는 이들 중 가장 많이 사용되는 것. 동일성분의

의약품이 다수 있는 경우는 시장점유율을 이용한 가중평균가격을 비

교약의 단위비용으로 이용

8 자료원

Ÿ 비뚤림의 가능성이 낮은 자료원(예, RCT) 우선선택.

Ÿ 신청약과 비교약을 직접 비교한 자료원 선호

Ÿ 직접비교 자료원이 없는 경우 공통대조군을 이용한 간접비교도 허용

9 자료검색 포괄적 검색. 검색 전략 상세히 제시

10 자료선정자료 선정작업 시작 전 포함·배제기준 정립. 보고서에 상술. 배제문헌 목

록 및 배제 근거 제시

11자료의 추출

및 평가

최종 선정자료에 대해 각 자료의 특징 및 결과를 요약·제시. 질평가 결

과도 제시

12 메타분석 이질성 고려

13 비용 비용항목 열거 → 자원소모량 측정 → 단위비용 적용 → 최종 비용 산출

14 비용항목

Ÿ 제한적 사회적 관점을 취함에 따라 직접 보건의료비용, 환자 및 가족

(또는 간병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 포함

Ÿ 생산성 손실 비용 및 해당 질병의 치료와 관련되지 않은 미래 의료

비용은 기본분석에 포함하지 않음

Ÿ 보험자 관점에서 분석할 경우 비급여 항목은 기본분석에서 제외

15 비용산출각 항목의 사용량 측정과 단위비용 산출 과정을 자세히 기술. 단위비용

과 자원사용량의 자료원은 국내 자료 이용

결과

16 결과지표 최종결과(final outcome) 사용 권장

17효용, 건강관련

삶의질

Ÿ QALY 사용. 질가중치는 선호도 반영한 것. 외국에서 개발된 도구를

사용할 때는 국내에서 타당도 검증이 된 것 사용. 선택도구를 지침의

별첨 3, 표4에 근거하여 정당화하고 민감도 분석을 통해 질가중치의

불확실성이 결과에 미치는 영향 검토.

Ÿ 기본분석에서는 선호도에 근거한 일반도구의 사용이 권장됨. 건강상

태의 선호도 측정 대상은 국내의 대표성 있는 일반대중을 선호. 기존

문헌에서 질가중치 값을 인용하는 경우 자료원의 포함·배제 기준을

상세히 설명하고 근거를 제시하는 등 선정과정을 투명하게 보고. 또

한 해당 건강상태에 적용가능한 지 여부를 논의하고 불확실성 평가

18 할인율 5% 기본, 0%, 3%, 7.5% 민감도 분석

19 모형구축

Ÿ 모형에 대한 상술

Ÿ 모형 분석 단계마다 해당 질병 상태에 있는 사람(코호트 시뮬레이션

인 경우)들의 수, 비용 등을 기술

Ÿ 다른 나라에서 개발된 모형의 경우 국내 상황에도 이를 적용할 수

있는지 검토

Page 255: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 247 -

4. 위에서 체크한 항목들의 개정이 필요한 이유, 생각하시는 개정 방향, 근거(문헌 근거)는

무엇입니까? (별도 페이지에 작성 가능)

항목번호

항목 내용개정필요

20 불확실성

Ÿ 경제성평가과정에서 사용한 모든 가정과 기타 불확실성을 초래하는

원천에 대하여 임상적, 통계적으로 타당한 범위에 걸쳐 일원민감도분

석 실시. 모수에 관련된 불확실성은 PSA 권장.

Ÿ 급여를 제한하여 신청하는 경우, 식약처 허가사항까지 대상이 확대되

는 경우에 대한 민감도 분석 추가 제시

21 일반화

Ÿ 단위비용 및 자원사용량 자료는 국내 자료 이용

Ÿ 국내 유병률이나 진료패턴이 외국과 크게 차이가 나서 결과의 국내

적용이 문제될 수 있는 경우는 국내 자료를 토대로 분석 실시, 이를

임상시험 자료에 기초한 분석결과와 함께 제시

Ÿ 다국가 임상시험의 경우 내국인 피험자수가 통계적으로 의미있는 결

론을 내릴 수 있을 정도로 충분하다면 내국인 피험자의 시험결과를

기본분석, 전체피험자의 시험결과로 민감도 분석 실시. 그렇지 않은

경우는 전체 피험자의 임상시험결과를 기본분석으로 실시

22 형평성 형평성 관련하여 어떤 가정을 하였는지 기술. 급여결정의 수혜집단 기술

23 재정영향 도입 후 3-5년간 보험재정에 미치는 영향 분석

항목번호

개정이 필요한 이유 개정 방향 근거

Page 256: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 248 -

5. 기타 의약품 경제성평가지침 개정 시 고려할 사항이 있다면 말씀해주시기 바랍니다.

( )

완료된 설문지는 아래 메일주소로 보내주시면 됩니다.

감사합니다.

항목번호

개정이 필요한 이유 개정 방향 근거

Page 257: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 249 -

의약품경제성평가지침 개정에 대한 의견조사- 연구자 대상 -

안녕하십니까? 본 연구는 건강보험심사평가원에서 배포하는 의약품 경제성평가지침의

개정에 대한 연구입니다. 본 조사는 지침 개정에 앞서 지침 개정 범위에 대한 이해관

계자들의 의견을 듣기 위하여 계획되었습니다. 본 조사는 자발적으로 참여 의사를 밝

히신 분에 한하여 수행될 것이며 필요하다면 담당 연구원( )에게

질문하실 수 있습니다. 귀하께서 응답해주시는 모든 내용은 개인정보 없이 보관되며

연구를 위한 기초자료로만 활용될 것입니다. 본 조사의 응답 기한은 8월 23일까지이며

응답을 마치신 후에는 담당 연구원에게 메일로 설문지를 보내주시면 됩니다. 감사합니

다.

2019년 8월

연구책임자 이태진·배은영

1. 현 소속이 어떻게 되십니까? ( )

① 대학 ② 연구소 ③ 기업 ④ 기타

2. 의약품 경제성평가지침에 기반한 경제성평가 경험이 있으십니까? ( )

① 없음 ② 있음

3. 약제 급여 결정 과정에 위원으로 참여한 경험이 있으십니까? ( )

① 없음 ② 있음

4. 다음은 현 의약품 경제성평가 지침안의 내용을 요약한 것입니다. 개정이 필요하다고 생각

하시는 항목을 모두 체크(V)해주시기 바랍니다.

항목번호

항목 내용개정필요

평가의 일반사항

1 관점 제한적 사회적 관점

2 분석기간 주요 임상결과를 확인할 수 있을 정도로 충분히 길게 할 것을 권장

3분석대상 인구

집단

Ÿ 비용과 결과가 도출된 인구집단 명시

Ÿ 급여대상 인구집단으로 일반화 가능한지 근거 제시

4 분석기법 CEA 또는 CUA. 최종지표 사용 권장

5 분석결과 제시 ICER. 총비용과 총효과 별도 제시

Page 258: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 250 -

항목번호

항목 내용개정필요

6 보고 단계별 결과와 분석에 포함된 자료들을 구체적으로 제시

평가 방법

7 비교대상 선정

등재의약품이 있는 경우는 이들 중 가장 많이 사용되는 것. 동일성분의

의약품이 다수 있는 경우는 시장점유율을 이용한 가중평균가격을 비

교약의 단위비용으로 이용

8 자료원

Ÿ 비뚤림의 가능성이 낮은 자료원(예, RCT) 우선선택.

Ÿ 신청약과 비교약을 직접 비교한 자료원 선호

Ÿ 직접비교 자료원이 없는 경우 공통대조군을 이용한 간접비교도 허용

9 자료검색 포괄적 검색. 검색 전략 상세히 제시

10 자료선정자료 선정작업 시작 전 포함·배제기준 정립. 보고서에 상술. 배제문헌 목

록 및 배제 근거 제시

11자료의 추출

및 평가

최종 선정자료에 대해 각 자료의 특징 및 결과를 요약·제시. 질평가 결

과도 제시

12 메타분석 이질성 고려

13 비용 비용항목 열거 → 자원소모량 측정 → 단위비용 적용 → 최종 비용 산출

14 비용항목

Ÿ 제한적 사회적 관점을 취함에 따라 직접 보건의료비용, 환자 및 가족

(또는 간병인) 비용, 그 외 사회 다른 부문에 발생하는 비용 포함

Ÿ 생산성 손실 비용 및 해당 질병의 치료와 관련되지 않은 미래 의료

비용은 기본분석에 포함하지 않음

Ÿ 보험자 관점에서 분석할 경우 비급여 항목은 기본분석에서 제외

15 비용산출각 항목의 사용량 측정과 단위비용 산출 과정을 자세히 기술. 단위비용

과 자원사용량의 자료원은 국내 자료 이용

결과

16 결과지표 최종결과(final outcome) 사용 권장

17효용, 건강관련

삶의질

Ÿ QALY 사용. 질가중치는 선호도 반영한 것. 외국에서 개발된 도구를

사용할 때는 국내에서 타당도 검증이 된 것 사용. 선택도구를 지침의

별첨 3, 표4에 근거하여 정당화하고 민감도 분석을 통해 질가중치의

불확실성이 결과에 미치는 영향 검토.

Ÿ 기본분석에서는 선호도에 근거한 일반도구의 사용이 권장됨. 건강상

태의 선호도 측정 대상은 국내의 대표성 있는 일반대중을 선호. 기존

문헌에서 질가중치 값을 인용하는 경우 자료원의 포함·배제 기준을

상세히 설명하고 근거를 제시하는 등 선정과정을 투명하게 보고. 또

한 해당 건강상태에 적용가능한 지 여부를 논의하고 불확실성 평가

18 할인율 5% 기본, 0%, 3%, 7.5% 민감도 분석

19 모형구축

Ÿ 모형에 대한 상술

Ÿ 모형 분석 단계마다 해당 질병 상태에 있는 사람(코호트 시뮬레이션

인 경우)들의 수, 비용 등을 기술

Ÿ 다른 나라에서 개발된 모형의 경우 국내 상황에도 이를 적용할 수

있는지 검토

Page 259: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 251 -

5. 위에서 체크한 항목들의 개정이 필요한 이유, 생각하시는 개정 방향, 근거(문헌 근거)는

무엇입니까? (별도 페이지에 작성 가능)

항목번호

항목 내용개정필요

20 불확실성

Ÿ 경제성평가과정에서 사용한 모든 가정과 기타 불확실성을 초래하는

원천에 대하여 임상적, 통계적으로 타당한 범위에 걸쳐 일원민감도분

석 실시. 모수에 관련된 불확실성은 PSA 권장.

Ÿ 급여를 제한하여 신청하는 경우, 식약처 허가사항까지 대상이 확대되

는 경우에 대한 민감도 분석 추가 제시

21 일반화

Ÿ 단위비용 및 자원사용량 자료는 국내 자료 이용

Ÿ 국내 유병률이나 진료패턴이 외국과 크게 차이가 나서 결과의 국내

적용이 문제될 수 있는 경우는 국내 자료를 토대로 분석 실시, 이를

임상시험 자료에 기초한 분석결과와 함께 제시

Ÿ 다국가 임상시험의 경우 내국인 피험자수가 통계적으로 의미있는 결

론을 내릴 수 있을 정도로 충분하다면 내국인 피험자의 시험결과를

기본분석, 전체피험자의 시험결과로 민감도 분석 실시. 그렇지 않은

경우는 전체 피험자의 임상시험결과를 기본분석으로 실시

22 형평성 형평성 관련하여 어떤 가정을 하였는지 기술. 급여결정의 수혜집단 기술

23 재정영향 도입 후 3-5년간 보험재정에 미치는 영향 분석

항목번호

개정이 필요한 이유 개정 방향 근거

Page 260: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 252 -

6. 기타 의약품 경제성평가지침 개정 시 고려할 사항이 있다면 말씀해주시기 바랍니다.

( )

완료된 설문지는 아래 메일주소로 보내주시면 됩니다.

감사합니다.

항목번호

개정이 필요한 이유 개정 방향 근거

Page 261: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 253 -

5. 참고문헌

강은정, 신호성, 박혜자, 조민우, 김나연. (2006). EQ-5D를 이용한 건강수준의 가치 평가. 보건경제와

정책연구(구 보건경제연구), 12(2), pp.19-43.

강은정, 한겨레, 김효진. (2014). 경제성평가를 위한 아동의 일반적 건강기술체계의 개발. 보건경제와

정책연구(구 보건경제연구), 20(4), pp.145-63.

강은정, 한겨레. (2018). 일반적 선호기반 건강관련 삶의 질 도구인Child Health-6 Dimension (CH-6D)의

타당성 연구. 한국모자보건학회지, 22(1), pp.53-61.

건강보험심사평가원. (2018). 2018년도 경제성평가 제도개선 TFT보고서. 원주: 건강보험심사평가원.

건강보험심사평가원. 경제성평가소위원회 워크샵 보고서(1~5차). 건강보험심사평가원 내부자료.

건강보험심사평가원. (2011). 의약품경제성평가지침. 서울:건강보험심사평가원. Retrieved from:

https://www.hira.or.kr/bbsDummy.do?pgmid=HIRAA030016000000&brdScnBltNo=4&brdBltNo=2058&

pageIndex=2

건강보험심사평가원. (2014). 임상적유용성평가를 위한 간접비교 수행단계별 자료제출지침. 서울: 건강

보험심사평가원. Retrieved from:

https://www.hira.or.kr/bbsDummy.do?pgmid=HIRAA030016000000&brdScnBltNo=4&brdBltNo=2069&

pageIndex=1#none

김윤희, 신상진, 박주연, 정예지, 김지민, 이태진, 배은영, 송현진. (2013). 보건의료분야에서 비용산출방

법. 서울:한국보건의료연구원.

배승진, 이수옥, 장선미, 최상은. (2011). 보험 의약품 경제성평가 가이드라인 개정방안 연구. 건강보험

심사평가원.

배종면. 2015. 환자보고성과의 반응 및 해석 지표. Korean J Fam Pract, 5(3), pp.161-6.

서혜선, 박미혜. (2014). 개인맞춤의약품의 경제성평가 방법론 연구. 서울:건강보험심사평가원.

이규방 등. (2001). 민간투자사업의 수익률에 관한 연구. 국토연구원.

이정은, 안정훈. (2019). HINT-8 도구에서 EQ-5D 도구들로의 Mapping을 이용한 전환식 도출 연구. 보

건경제와 정책연구(구 보건경제연구), 25(1), 77-103.

이현정, 조민우, 최선혜, 김윤정, 오경원. (2016). 한국형 건강관련 삶의 질 측정도구의 개발과 타당도

및 신뢰도 평가. 주간 건강과 질병, 9(24), pp.447-54.

조민우, 윤성철, 김선하, 손우승. (2011). EQ-5D-5L 건강상태의 효용 추정. 울산대학교 & 한국건강증진

개발원.

조민우. (2014). 국민건강영양조사 건강관련 삶의 질 측정도구 개발. 울산대학교 & 질병관리본부.

조민우. (2017). 한국형 건강관련 삶의 질 측정도구(HINT-8)의 가치평가 연구. 울산대학교 & 질병관리

본부.

최지은 & 박동규. (2015). 공공투자 사업의 경제성분석을 위한 사회적 할인율 추정. 사회과학연구,

41(3), pp.145-167.

Page 262: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 254 -

한겨레, 강은정. (2015). Time Trade-Off를 이용한 아동의 일반적 건강상태기술체계인 CH-6D의 가치

평가. 보건경제와 정책연구(구 보건경제연구), 21(4), pp.97-116.

KDI 공공투자관리센터. (2018). 공기업·준정부기관 사업 예비타당성조사 수행을 위한 일반지침 수

정·보완 연구(제2판)

Ades, A. E., Claxton, K., & Sculpher, M. (2006). Evidence synthesis, parameter correlation and

probabilistic sensitivity analysis. Health economics, 15(4), pp.373-381.

Afzali, H. H. A., & Karnon, J. (2011). Addressing the challenge for well informed and consistent

reimbursement decisions.

Andronis, L., Barton, P., & Bryan, S. (2009). Sensitivity analysis in economic evaluation: an audit of

NICE current practice and a review of its use and value in decision-making. Perth: Prepress

Projects Limited.

Annemans, L., Redekop, K., Payne, K. (2013). Current methodological issues in the economic

assessment of personalized medicine. Value in Health, 16(6), pp.S20-S26.

Ara R, Rowen D, Mukuria C. (2017). The Use of Mapping to Estimate Health State Utility Values.

Pharmacoeconomics, 35(Suppl 1), pp.57-66.

Arnold D, Girling A, Stevens A, Lilford R. (2009). Comparison of direct and indirect methods of

estimating health state utilities for resource allocation: review and empirical analysis. The

BMJ. 339, b2688.

Bagust, A., & Beale, S. (2014). Survival analysis and extrapolation modeling of time-to-event clinical

trial data for economic evaluation: an alternative approach. Medical Decision Making, 34(3),

pp.343-351.

Baio, G., & Dawid, A. P. (2015). Probabilistic sensitivity analysis in health economics. Statistical

methods in medical research, 24(6), pp.615-634.

Blumenschein K, Johannesson M. (1998). An experimental test of question framing in health state

utility assessment. Health Policy, 45(3), pp.187-93.

Bojke, L., Claxton, K., Bravo-Vergel, Y., Sculpher, M., Palmer, S., & Abrams, K. (2010). Eliciting

distributions to populate decision analytic models. Value in Health, 13(5), pp.557-564.

Bojke L, Soares M. Decision analysis: eliciting experts’ beliefs to characterize uncertainties. In:

Culyer AJ, editor. Encyclopedia of health economics. Amsterdam: Elsevier; 2014.

Bojke, L., Soares, M., Claxton, K., Colson, A., Fox, A., Jackson, C., Jankovic, D., Morton, A., Sharples,

L., Taylor, A. (2019). Developing a reference protocol for expert elicitation in healthcare

decision making. Retrieved from: eprints.whiterose.ac.uk/151174

Boonen A, van der Heijde D, Landewe R, van Tubergen A, Mielants H, Dougados M, et al. (2007).

How do the EQ-5D, SF-6D and the well-being rating scale compare in patients with

ankylosing spondylitis? Ann Rheum Dis, 66(6), pp.771-7.

Branson, M., & Whitehead, J. (2002). Estimating a treatment effect in survival studies in which

Page 263: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 255 -

patients switch treatment. Statistics in medicine, 21(17), pp.2449-2463.

Brazier J, Ratcliffe J, Salomon JA, Tsuchiya A. (2007). Measuring and Valuing Health Benefits for

Economic Evaluation. Oxford: Oxford University Press.

Brazier, J., Ratcliffe, J., Salomon, J.A., Tsuchiya, A. (2017). Measuring and valuing health benefits for

economic evaluation. Oxford: Oxford University Press.

Brazier J, Rowen D. (2011). NICE Decision Support Unit(DSU) Technical Support Documents 11:

Alternatives to EQ-5D for Generating Health State Utility Values. London: National Institute

for Health and Care Excellence (NICE).

Brazier JE, Yang Y, Tsuchiya A, Rowen DL. (2010). A review of studies mapping (or cross walking)

non-preference based measures of health to generic preference-based measures. Eur J Health

Econ, 11(2), 215-25.

Briggs, A. H., & Gray, A. M. (1999). Handling uncertainty when performing economic evaluation of

healthcare interventions. Health Technol Assess, 3(2), pp.1-134.

Briggs, A.H., & O’Brien, B.J. (2001). The death of cost-minimization analysis? Health Economics,

10(2), pp.179-184.

Briggs A, Wild D, Lees M, Reaney M, Dursun S, Parry D, et al. (2008). Impact of schizophrenia and

schizophrenia treatment-related adverse events on quality of life: direct utility elicitation.

Health Qual Life Outcomes, 6, pp.105.

Briggs, A.H., Weinstein, M.C., Fenwick, E.A.L., Karnon, J., Sculpher, M.J., and Paltiel, A.D. (2012)

Model parameter estimation and uncertainty analysis: a report of the ISPOR-SMDM modeling

good research practices task force working group - 6. Medical Decision Making, 32(5). pp.

722-732.

Briggs AH, Belozeroff V, Feeny D. (2019). Comparison of health state utility estimates from

instrument-based and vignette-based methods: a case study in kidney disease. BMC Res Notes,

12(1), pp.385.

Brooks R. (1996). EuroQol: the current state of play. Health Policy, 37(1), pp.53-72.

Brouwer, W.B.F. (2019). The Inclusion of spillover effects in economic evaluations: Not an optional

extra. PharmacoEconomics, 37(4), pp.451-456. DOI:10.1007/s40273-018-0730-6

Caro JJ1, Ishak KJ. (2010). No head-to-head trial? simulate the missing arms. Pharmacoeconomics,

28(10). pp. 957-67

Caro, J. J., Eddy, D. M., Kan, H., Kaltz, C., Patel, B., Eldessouki, R., & Briggs, A. H. (2014).

Questionnaire to assess relevance and credibility of modeling studies for informing health care

decision making: an ISPOR-AMCP-NPC Good Practice Task Force report. Value in health,

17(2), pp.174-182.

Chancellor JV, Coyle D, Drummond MF. (1997). Constructing health state preference values from

descriptive quality of life outcomes: mission impossible? Qual Life Res, 6(2), pp.159-68.

Page 264: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 256 -

Claxton, K., Sculpher, M., McCabe, C., Briggs, A., Akehurst, R., Buxton, M., & O'Hagan, T. (2005).

Probabilistic sensitivity analysis for NICE technology assessment: not an optional extra. Health

economics, 14(4), pp.339-347.

Cohen J. (1988). Statistical Power Analysis for the Behavioral Sciences. Hillsdale, NJ: Lawrence

Erlbaum Associates.

Cooper NJ, Sutton AJ, Achana F, Welton NJ. (2015) Use of network meta-analysis to inform clinical

parameters in economic evaluations. Ottawa: CADTH. Available from:

https://www.cadth.ca/sites/default/files/pdf/RFP%20Topic-%20Use%20of%20Network%20Meta-analy

sis%20to%20Inform%20 Clinical%20Parameters%20in%20Economic%20Evaluations.pdf

Coretti S, Ruggeri M, McNamee P. (2014). The minimum clinically important difference for EQ-5D

index: a critical review. Expert Rev Pharmacoecon Outcomes Res, 14(2), pp.221-33.

Critchfield, G. C., Willard, K. E., & Connelly, D. P. (1986). Probabilistic sensitivity analysis methods

for general decision models. Computers and biomedical research, 19(3), pp.254-265.

Dias, S., Welton, N. J., Sutton, A. J., & Ades, A. E. (2013). Evidence synthesis for decision making 5:

the baseline natural history model. Medical Decision Making, 33(5), pp.657-670.

de Vries, L.M., van Baal., P.H., Brouwer, W.B.F. (2019). Future costs in cost-effectiveness analyses:

Past, present, future. PharmacoEconomics, 37(2), pp.119-130. DOI:10.1007/s40273-018-0749-8

Devlin NJ, Shah KK, Feng Y, Mulhern B, van Hout B. (2018). Valuing health-related quality of life:

An EQ-5D-5L value set for England. Health Econ, 27(1), pp.7-22.

Dolan P, Gudex C, Kind P, Williams A. (1996). Valuing health states: a comparison of methods. J

Health Econ, 15(2), pp.209-31.

Dolan P. (1997). Modeling valuations for EuroQol health states. Med Care, 35(11), pp.1095-108.

Drummond M, Brixner D, Gold M, Kind P, McGuire A, Nord E, et al. (2009). Toward a consensus on

the QALY. Value Health, 12(Suppl 1), pp.S31-5.

Drummond, M.F., Sculpher, M.J., Claxton, K., Stoddart, G.L., Torrance, G.W. (2015). Methods for the

economic evaluation of health care programmes. Oxford: Oxford University Press. pp.5-6.

Eddy, D. M., Hollingworth, W., Caro, J. J., Tsevat, J., McDonald, K. M., & Wong, J. B. (2012). Model

transparency and validation: a report of the ISPOR-SMDM Modeling Good Research Practices

Task Force–7. Medical Decision Making, 32(5), pp.733-743.Eldabe S, Lloyd A, Verdian L, Meguro M, Maclaine G, Dewilde S. (2010). Eliciting health state utilities

from the general public for severe chronic pain. Eur J Health Econ, 11(3), pp.323-30.

European network for Health Technology Assessment (EUnetHTA) (2015). Methods for health

economic evaluation - a guideline based on current practices in Europe. EUnetHTA.27)

European network for Health Technology Assessment (EUnetHTA) (2015). Endpoints used for Relative

Effectiveness Assessment: Heath-related quality of life and utility measures (adapted version

27) 효용 파트의 EUnetHTA 2015a

Page 265: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 257 -

).28)

European network for Health Technology Assessment (EUnetHTA) (2019). Methodological guidelies:

Practical considerations when critically assessing economic evaluations. ver 0.3. EUnetHTA.

Faulkner, D., Annemans, L., Garrison, L., Helfand, M., Holtorf, A-P., Hornberger, J., Hughes, D., Li,

T., Malone, D., Payne, K., Siebert, U., Towse, A., Veenstra, D., Watkins, J. (2012). Challenges

in the development and reimbursement of personalized medicine-payer and manufacturer

perspectives and implications for health economics and outcomes research: a report of the

ISPOR personalized medicne special interest group. Value in Health, 15, pp.1162-1171.

(U.S.) Food and Drug Administration (FDA). (2009). Guidance for industry on patient-reported outcome

measures: Use in medical product development to support labeling claims. Food and Drug

Administration.

Feeny D, Furlong W, Torrance GW, Goldsmith CH, Zhu Z, DePauw S, et al. (2002). Multiattribute and

single-attribute utility functions for the health utilities index mark 3 system. Med Care, 40(2),

pp.113-28.

Gold ME, Siegel JE, Russell LB, Weinstein MC. (1996). Cost-effectiveness in Health and Medicine.

New York: Oxford University Press.

Grieve R, Hawkins N, Pennington M. (2013). Extrapolation of survival data in cost-effectiveness

analyses: improving the current state of play. Medical Decision Making, 33(6), pp.740–742Griffin, S., Claxton, K., Hawkins, N., & Sculpher, M. (2006). Probabilistic analysis and computationally

expensive models: necessary and required?. Value in Health, 9(4), pp.244-252.

Hawthorne G, Richardson J, Osborne R. (1999). The Assessment of Quality of Life (AQoL) instrument:

a psychometric measure of Health-Related Quality of Life. Quality of Life Research, 8(3),

pp.209-24.

Hernandez AM, Pudney S, Wailoo A. (2018), Quality review of a proposed EQ-5D-5L value set for

England. EEPRU report.

Hutton B, Salanti G, Caldwell DM et al. (2015) The PRISMA Extension Statement for Reporting of

Systematic Reviews Incorporating Network Meta-analyses of Health Care Interventions:

Checklist and Explanations. Annals of Internal Medicine, 162. pp. 777–84.Iglesias, C.P., Thompson, A., Rogowski, W.H. (2016). Reporting guidelines for the use of expert

judgement in model-based evalautions. PharmacoEconomics, 34, pp.1161-1172. DOI

10.1007/s40273-016-0425-9

Impellizzeri FM, Mannion AF, Naal FD, Hersche O, Leunig M. (2012). The early outcome of surgical

treatment for femoroacetabular impingement: success depends on how you measure it.

Osteoarthritis and cartilage, 20(7), pp.638-45.

Iqbal I, Dasgupta B, Taylor P, Heron L, Pilling C. (2012). Elicitation of health state utilities associated

28) 효용 파트의 EUnetHTA 2015b

Page 266: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 258 -

with differing durations of morning stiffness in rheumatoid arthritis. J Med Econ, 15(6),

pp.1192-200.

ISPOR Task Force. (2016). Response to Editorial: Estimating Health-State Utility for Economic Models

in Clinical Studies: An ISPOR Good Research Practices Task Force Report. Value Health, 19(6),

pp.702-3.

Jaeschke R, Singer J, Guyatt GH. (1989). Measurement of health status. Ascertaining the minimal

clinically important difference. Control Clin Trials, 10(4), pp.407-15.

Jo MW, Yun SC, Lee SI. (2008). Estimating quality weights for EQ-5D health states with the time

trade-off method in South Korea. Value Health, 11(7), pp.1186-9.

Juniper EF, Guyatt GH, Willan A, Griffith LE. (1994). Determining a minimal important change in a

disease-specific Quality of Life Questionnaire. J Clin Epidemiol, 47(1), pp.81-7.

Kaplan RM, Anderson JP. (1988). A general health policy model: update and applications. Health Serv

Res, 23(2), pp.203-35.

Karnon J, Vanni T. (2011). Calibrating models in economic evaluation: a comparison of alternative

measures of goodness of fit, parameter search strategies and convergence criteria.

Pharmacoeconomics, 29(1), pp.51-62.

Kim SH, Jo MW, Kim HJ, Ahn JH. (2012a). Mapping EORTC QLQ-C30 onto EQ-5D for the assessment

of cancer patients. Health Qual Life Outcomes, 10, pp.151.

Kim EJ, Ko SK, Kang HY. (2012b). Mapping the cancer-specific EORTC QLQ-C30 and EORTC

QLQ-BR23 to the generic EQ-5D in metastatic breast cancer patients. Quality of life research

: an international journal of quality of life aspects of treatment, care and rehabilitation, 21(7),

pp.1193-203.

Kim SH, Kim SO, Lee SI, Jo MW. (2014). Deriving a mapping algorithm for converting SF-36 scores

to EQ-5D utility score in a Korean population. Health Qual Life Outcomes, 12, pp.145.

Kim SK, Kim SH, Jo MW, Lee SI. (2015). Estimation of minimally important differences in the EQ-5D

and SF-6D indices and their utility in stroke. Health Qual Life Outcomes, 13, pp.32.

Kim SH, Ahn J, Ock M, Shin S, Park J, Luo N, et al. (2016a). The EQ-5D-5L valuation study in

Korea. Quality of life research : an international journal of quality of life aspects of

treatment, care and rehabilitation, 25(7), pp.1845-52.

Kim HL, Kim D, Jang EJ, Lee MY, Song HJ, Park SY, et al. (2016b). Mapping health assessment

questionnaire disability index (HAQ-DI) score, pain visual analog scale (VAS), and disease

activity score in 28 joints (DAS28) onto the EuroQol-5D (EQ-5D) utility score with the

KORean Observational study Network for Arthritis (KORONA) registry data. Rheumatol Int,

36(4), 505-13.

Kim, D.D., Wilkinson, C.L., Pope, E.F., Chambers, J.D., Cohen, J.T., Neumann, P.J. (2017). The

influence of time horizon on results of cost-effectiveness analyses. Expert Review of

Page 267: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 259 -

Pharmacoeconomics & Outcomes Research, 17(6), pp.615-623. DOI:

10.1080/14737167.2017.1331432

Kim J, Jo MW, Lee HJ. (2019). PCN153 VALIDITY AND RELIABILITY OF HINT-8 IN PATIENTS WITH

BREAST CANCER. Value in Health, 22, pp.S85.

King MT. (2011). A point of minimal important difference (MID): a critique of terminology and

methods. Expert Rev Pharmacoecon Outcomes Res, 11(2), 171-84.

Kip, M.M.A., IJerman, M.J., Henriksson, M., Merlin, T., Weinstein, M.C., Phelps, C.E., Kusters, R.,

Koffijberg, H. (2018). Toward alignment in the reporting of economic evaluation of diagnostic

tests and biomarkers: the AGREEDT checklist. Medical Decision Making, 38(7), pp.778-788.

Kvam AK, Fayers PM, Wisloff F. (2011). Responsiveness and minimal important score differences in

quality-of-life questionnaires: a comparison of the EORTC QLQ-C30 cancer-specific

questionnaire to the generic utility questionnaires EQ-5D and 15D in patients with multiple

myeloma. European journal of haematology, 87(4), pp.330-7.

Larsen K, Hansen TB, Soballe K. (2008). Hip arthroplasty patients benefit from accelerated

perioperative care and rehabilitation: a quasi-experimental study of 98 patients. Acta

orthopaedica, 79(5), 624-30.

Latimer NR. NICE DSU Technical Support Document 14: Survival analysis for economic evaluations

alongside clinical trials - extrapolation with patient-level data. 2011; available from

http:/ /www.nicedsu.org.uk/NICE%20DSU%20TSD%20Survival%20analysis.updated

%20March%202013.pdf

Latimer, N. R. (2013). Survival analysis for economic evaluations alongside clinical trials—extrapolation

with patient-level data: inconsistencies, limitations, and a practical guide. Medical Decision

Making, 33(6), pp.743-754.

Latimer, N.R., Keith R. A. NICE DSU Technical Support Document 14: Adjusting sruvival time

estimates in the presence of treatment switching. 2014

Le QA, Doctor JN, Zoellner LA, Feeny NC. (2013). Minimal clinically important differences for the

EQ-5D and QWB-SA in Post-traumatic Stress Disorder (PTSD): results from a Doubly

Randomized Preference Trial (DRPT). Health Qual Life Outcomes, 11, 59.

Lee YK, Nam HS, Chuang LH, Kim KY, Yang HK, Kwon IS, et al. (2009). South Korean time

trade-off values for EQ-5D health states: modeling with observed values for 101 health

states. Value Health. 12(8), pp.1187-93.

Lim J, Choi SE, Bae E, Kang D, Lim EA, Shin GS. (2019). Mapping analysis to estimate EQ-5D utility

values using the COPD assessment test in Korea. Health Qual Life Outcomes, 17(1), pp.97.

Lloyd A, Doyle S, Dewilde S, Turk F. (2008). Preferences and utilities for the symptoms of moderate

to severe allergic asthma. Eur J Health Econ, 9(3), pp.275-84.

Lloyd A, Hodgkins P, Sasane R, Akehurst R, Sonuga-Barke EJ, Fitzgerald P, et al. (2011). Estimation

Page 268: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 260 -

of utilities in attention-deficit hyperactivity disorder for economic evaluations. The patient,

4(4), pp.247-57.

Longworth L, Rowen D. (2013). Mapping to obtain EQ-5D utility values for use in NICE health

technology assessments. Value Health, 16(1), pp.202-10.

Luo N, Johnson J, Coons SJ. (2010). Using instrument-defined health state transitions to estimate

minimally important differences for four preference-based health-related quality of life

instruments. Med Care, 48(4), pp.365-71.

Meltzer, D. (2001). Addressing uncertainty in medical cost–effectiveness analysis: implications of

expected utility maximization for methods to perform sensitivity analysis and the use of cost–effectiveness analysis to set priorities for medical research. Journal of health economics, 20(1),

pp.109-129.

Mark, S. D., & Robins, J. M. (1993). A method for the analysis of randomized trials with compliance

information: an application to the Multiple Risk Factor Intervention Trial. Controlled clinical

trials, 14(2), pp.79-97.

Marra CA, Woolcott JC, Kopec JA, Shojania K, Offer R, Brazier JE, et al. (2005). A comparison of

generic, indirect utility measures (the HUI2, HUI3, SF-6D, and the EQ-5D) and disease-specific

instruments (the RAQoL and the HAQ) in rheumatoid arthritis. Soc Sci Med, 60(7), pp.1571-82.

Matza LS, Secnik K, Rentz AM, Mannix S, Sallee FR, Gilbert D, et al. (2005). Assessment of health

state utilities for attention-deficit/hyperactivity disorder in children using parent proxy report.

Qual Life Res, 14(3), pp.735-47.

Matza LS, Boye KS, Yurgin N, Brewster-Jordan J, Mannix S, Shorr JM, et al. (2007). Utilities and

disutilities for type 2 diabetes treatment-related attributes. Qual Life Res. 16(7), pp.1251-65.

Matza LS, Devine MK, Haynes VS, Davies EW, Kostelec JM, Televantou F, et al. (2014a). Health state

utilities associated with adult attention-deficit/hyperactivity disorder. Patient preference and

adherence, 8, pp.997-1006.

Matza LS, Chung K, Van Brunt K, Brazier JE, Braun A, Currie B, et al. (2014b). Health state utilities

for skeletal-related events secondary to bone metastases. Eur J Health Econ, 15(1), pp.7-18.

McCabe, C. (2019). Expanding the scope of costs and benefits for economic evaluations in health:

Some words of caution. PharmacoEconomics, 37(4), pp.457-460. DOI:10.1007/s40273-018-0729-z

McClure NS, Sayah FA, Xie F, Luo N, Johnson JA. (2017). Instrument-Defined Estimates of the

Minimally Important Difference for EQ-5D-5L Index Scores. Value Health, 20(4), pp.644-50.

McDonough CM, Tosteson TD, Tosteson AN, Jette AM, Grove MR, Weinstein JN. (2011). A

longitudinal comparison of 5 preference-weighted health state classification systems in persons

with intervertebral disk herniation. Medical decision making : an international journal of the

Society for Medical Decision Making, 31(2), pp.270-80.

Michelle, T., Philip, C., Karin, T., Kim, D. (2019). Incorporating future medical costs: Impact on

Page 269: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 261 -

cost-effectiveness analysis in cancer patients. PharmacoEconomics, 37(7), pp.931-941.

DOI:10.1007/s40273-019-00790-9

Mukuria C, Rowen D, Harnan S, Rawdin A, Wong R, Ara R, et al. (2019). An Updated Systematic

Review of Studies Mapping (or Cross-Walking) Measures of Health-Related Quality of Life to

Generic Preference-Based Measures to Generate Utility Values. Appl Health Econ Health

Policy, 17(3), pp.295-313.

Neumann, P.J. (2009). Costing and perspective in published cost-effectiveness analysis. Medical Care,

47(7 suppl 1), pp.S28-S32.

Neumann, P.J., Sanders, G.D., Russel, L.B., Siegel, J.E., Ganiats, T.G. (2017). Cost-effectiveness in

health and medicine. New York: Oxford University Press.

Neyt, M., Brabandt, H.V. (2011). The importance of the comparator in economic evaluations: Working

on the efficiency frontier. Pharmacoeconomics, 29(11), pp.913-916.

Norman GR, Sloan JA, Wyrwich KW. (2003). Interpretation of changes in health-related quality of

life: the remarkable universality of half a standard deviation. Med Care, 41(5), pp.582-92.

Norman GR, Wyrwich KW, Patrick DL. (2007). The mathematical relationship among different forms

of responsiveness coefficients. Qual Life Res, 16(5), pp.815-22.

Nunnally JC, Bernstein IH. (1994). Psychometric Theory. New York: McGraw-Hill.

O’Mahony, J.F., Newall, A.T., van Rosmalen, J. (2015). Dealing with time in health economic

evaluation: methodological issues and recommendations for practice. PharmacoEconomics, 33,

pp.1255-1268.

Park SY, Park EJ, Suh HS, Ha D, Lee EK. (2017). Development of a transformation model to derive

general population-based utility: Mapping the pruritus-visual analog scale (VAS) to the EQ-5D

utility. J Eval Clin Pract, 23(4), pp.755-61.

Parker SL, Adogwa O, Paul AR, Anderson WN, Aaronson O, Cheng JS, et al. (2011). Utility of

minimum clinically important difference in assessing pain, disability, and health state after

transforaminal lumbar interbody fusion for degenerative lumbar spondylolisthesis. Journal of

neurosurgery Spine, 14(5), pp.598-604.

Parker SL, Adogwa O, Mendenhall SK, Shau DN, Anderson WN, Cheng JS, et al. (2012a).

Determination of minimum clinically important difference (MCID) in pain, disability, and quality

of life after revision fusion for symptomatic pseudoarthrosis. The spine journal : official

journal of the North American Spine Society, 12(12), pp.1122-8.

Parker SL, Mendenhall SK, Shau DN, Adogwa O, Anderson WN, Devin CJ, et al. (2012b). Minimum

clinically important difference in pain, disability, and quality of life after neural decompression

and fusion for same-level recurrent lumbar stenosis: understanding clinical versus statistical

significance. Journal of neurosurgery Spine, 16(5), pp.471-8.

Parker SL, Godil SS, Shau DN, Mendenhall SK, McGirt MJ. (2013). Assessment of the minimum

Page 270: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 262 -

clinically important difference in pain, disability, and quality of life after anterior cervical

discectomy and fusion: clinical article. Journal of neurosurgery Spine, 18(2), pp.154-60.

Paulden, M. et al. (2017). Discounting and the evaluation of health care programs. Canadian Agency

for Drugs and Technologies in Health.

Petrou S, Rivero-Arias O, Dakin H, Longworth L, Oppe M, Froud R, et al. (2015). Preferred

Reporting Items for Studies Mapping onto Preference-Based Outcome Measures: The MAPS

Statement. PharmacoEconomics, 33(10), pp.985-91.

Phillippo DM, Ades AE, Dias S, Palmer S, Abrams KR, Welton NJ. (2016). NICE DSU TECHNICAL

SUPPORT DOCUMENT 18: METHODS FOR POPULATION-ADJUSTED INDIRECT COMPARISONS

IN SUBMISSIONS TO NICE. Available from http://www.nicedsu.org.uk

Phillippo DM, Ades AE, Dias S, Palmer S, Abrams KR, Welton NJ. (2018). Methods for

Population-Adjusted Indirect Comparisons in Health Technology Appraisal. Med Decis Making,

38(2). pp. 200-211.

Philips, Z., Bojke, L., Sculpher, M., Claxton, K., & Golder, S. (2006). Good practice guidelines for

decision-analytic modelling in health technology assessment. Pharmacoeconomics, 24(4),

pp.355-371.

Pickard AS, Neary MP, Cella D. (2007). Estimation of minimally important differences in EQ-5D utility

and VAS scores in cancer. Health Qual Life Outcomes, 5, pp.70.

Pitman, R., Fisman, D., Zaric, G. S., Postma, M., Kretzschmar, M., Edmunds, J., ... & ISPOR-SMDM

Modeling Good Research Practices Task Force. (2012). Dynamic transmission modeling: a

report of the ISPOR-SMDM modeling good research practices task force-5. Value in health,

15(6), pp.828-834.

Prosser, L.A., Wittenberg, E. (2019). Advances in methods and novel applications for measuring family

spillover effects of illness. PharmacoEconomics, 37(4), pp.447-450.

DOI:10.1007/s40273-019-00794-5

Ramos, M. C. P., Barton, P., Jowett, S., & Sutton, A. J. (2015). A systematic review of research

guidelines in decision-analytic modeling. Value in Health, 18(4), pp.512-529.

Revicki DA, Wood M. (1998). Patient-assigned health state utilities for depression-related outcomes:

differences by depression severity and antidepressant medications. J Affect Disord, 48(1),

pp.25-36.

Richardson J, Iezzi A, Khan MA, Maxwell A. (2014). Validity and reliability of the Assessment of

Quality of Life (AQoL)-8D multi-attribute utility instrument. The patient, 7(1), pp.85-96.

Richardson J, Khan MA, Iezzi A, Maxwell A. (2015a). Comparing and Explaining Differences in the

Magnitude, Content, and Sensitivity of Utilities Predicted by the EQ-5D, SF-6D, HUI 3, 15D,

QWB, and AQoL-8D Multiattribute Utility Instruments. Medical Decision Making, 35(3),

pp.276-91.

Page 271: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 263 -

Richardson J, Iezzi A, Khan MA. (2015b). Why do multi-attribute utility instruments produce different

utilities: the relative importance of the descriptive systems, scale and 'micro-utility' effects.

Quality of life research : an international journal of quality of life aspects of treatment, care

and rehabilitation, 24(8), pp.2045-53.

Roberts, M., Russell, L. B., Paltiel, A. D., Chambers, M., McEwan, P., & Krahn, M. (2012).

Conceptualizing a model: a report of the ISPOR-SMDM modeling good research practices task

force–2. Medical Decision Making, 32(5), pp.678-689.Rowen D, Brazier J, Tsuchiya A, Alava MH. (2012). Valuing states from multiple measures on the

same visual analogue scale: a feasibility study. Health Econ, 21(6), pp.715-29.

Schünemann HJ, Guyatt GH. (2005a). Commentary--goodbye M(C)ID! Hello MID, where do you come

from? Health Serv Res, 40(2), pp.593-7.

Schünemann HJ, Puhan M, Goldstein R, Jaeschke R, Guyatt GH. (2005b). Measurement properties and

interpretability of the Chronic respiratory disease questionnaire (CRQ). COPD. 2(1), pp.81-9.

Sculpher, M. Fenwick, E., & Claxton, K. (2000). Assessing quality in decision analytic

cost-effectiveness models. Pharmacoeconomics, 17(5), pp.461-477.

Seiber WJ, Groessl EJ, David KM, Ganiats TG, Kaplan RM. (2008). Quality of Well Being

Self-Administered (QWB-SA) Scale. User's Manual Health Services Research Center, San Diego:

University of California.

Shikiar R, Willian MK, Okun MM, Thompson CS, Revicki DA. (2006). The validity and responsiveness

of three quality of life measures in the assessment of psoriasis patients: results of a phase II

study. Health Qual Life Outcomes, 4, pp.71.

Shiroiwa T, Fukuda T, Ikeda S, Takura T, Moriwaki K. (2017). Development of an Official Guideline

for the Economic Evaluation of Drugs/Medical Devices in Japan. Value Health, 20(3), pp.372-8.

Siebert, U., Alagoz, O., Bayoumi, A. M., Jahn, B., Owens, D. K., Cohen, D. J., & Kuntz, K. M. (2012).

State-transition modeling: a report of the ISPOR-SMDM modeling good research practices task

force–3. Medical Decision Making, 32(5), pp.690-700.Signorovitch JE, Wu EQ, Yu AP, Gerrits CM, Kantor E, Bao Y, Gupta SR, Mulani PM. (2010).

Comparative effectiveness without head-to-head trials: a method for matching-adjusted

indirect comparisons applied to psoriasis treatment with adalimumab or etanercept.

Pharmacoeconomics, 28(10). pp. 935-45.

Sintonen H, Pekurinen M. (1993). A fifteen-dimensional measure of health-related quality of life (15D)

and its applications. In: Walker SR, Rosser RM, editors. Quality of Life Assessment: Key Issues

in the 1990s. Dordrecht: Springer Netherlands. pp. 185-95.

Soer R, Reneman MF, Speijer BL, Coppes MH, Vroomen PC. (2012). Clinimetric properties of the

EuroQol-5D in patients with chronic low back pain. The spine journal : official journal of the

North American Spine Society, 12(11), pp.1035-9.

Page 272: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 264 -

Solberg T, Johnsen LG, Nygaard OP, Grotle M. (2013). Can we define success criteria for lumbar disc

surgery? : estimates for a substantial amount of improvement in core outcome measures. Acta

orthopaedica, 84(2), pp.196-201.

Spencer M, Diels J. (2011). MA2 Mapping Fact-P to Country Specific Patient Health Status Measured

by EQ-5D in Metastatic Castrate Resistant Prostate Cancer Patients. Value in Health, 14(7),

A242.

Staerkle RF, Villiger P. (2011). Simple questionnaire for assessing core outcomes in inguinal hernia

repair. The British journal of surgery, 98(1), pp.148-55.

Stark RG, Reitmeir P, Leidl R, Konig HH. (2010). Validity, reliability, and responsiveness of the

EQ-5D in inflammatory bowel disease in Germany. Inflamm Bowel Dis, 16(1), pp.42-51.

Starkie HJ, Briggs AH, Chambers MG, Jones P. (2011). Predicting EQ-5D values using the SGRQ.

Value Health, 14(2), pp.354-60.

Stevens K. (2009). Developing a descriptive system for a new preference-based measure of

health-related quality of life for children. Quality of life research : an international journal of

quality of life aspects of treatment, care and rehabilitation, 18(8), pp.1105-13.

Stout, N. K., Knudsen, A. B., Kong, C. Y., McMahon, P. M., & Gazelle, G. S. (2009). Calibration

methods used in cancer simulation models and suggested reporting guidelines.

Pharmacoeconomics, 27(7), pp.533-545.

Tolley K, Goad C, Yi Y, Maroudas P, Haiderali A, Thompson G. (2013). Utility elicitation study in the

UK general public for late-stage chronic lymphocytic leukaemia. Eur J Health Econ, 14(5),

pp.749-59.

Tosh JC, Longworth LJ, George E. (2011). Utility values in National Institute for Health and Clinical

Excellence (NICE) Technology Appraisals. Value Health, 14(1), pp.102-9.

Tsuchiya A, Brazier J, McColl E, Parkin D. (2002). Deriving preference-based single indices from

non-preference based condition-specific instruments: converting AQLQ into EQ5D indices.

Discussion Paper Series. School of Health and Related Research (ScHARR), University of

Scheffield.

van Hout B, Janssen MF, Feng YS, Kohlmann T, Busschbach J, Golicki D, et al. (2012). Interim

scoring for the EQ-5D-5L: mapping the EQ-5D-5L to EQ-5D-3L value sets. Value Health,

15(5), pp.708-15.

Vemer, P., Ramos, I. C., Van Voorn, G. A. K., Al, M. J., & Feenstra, T. L. (2016). AdViSHE: a

validation-assessment tool of health-economic models for decision makers and model users.

Pharmacoeconomics, 34(4), pp.349-361.

Wailoo A, Hernandez Alava M, Grimm S, Pudney S, Gomes M, Sadique Z, et al. (2017a). Comparing

the EQ-5D-3L and 5L versions. What are the implications for cost effectiveness estimates?.

Sheffield: Decision Support Unit.

Page 273: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 265 -

Wailoo A, Hernandez Alava M, Manca A, Mejia A, Ray J, Crawford B, et al. (2017b). Mapping to

Estimate Health-State Utility from Non-Preference-Based Outcome Measures: An ISPOR Good

Practices for Outcomes Research Task Force Report. Value Health, 20(1), pp.18-27.

Walker, D., & Fox-Rushby, J. A. (2001). Allowing for uncertainty in economic evaluations: qualitative

sensitivity analysis. Health Policy and Planning, 16(4), pp.435-443.

Walters SJ, Brazier JE. (2005). Comparison of the minimally important difference for two health state

utility measures: EQ-5D and SF-6D. Quality of life research : an international journal of

quality of life aspects of treatment, care and rehabilitation, 14(6), pp.1523-32.

Wolowacz SE, Briggs A, Belozeroff V, Clarke P, Doward L, Goeree R, et al. (2016). Estimating

Health-State Utility for Economic Models in Clinical Studies: An ISPOR Good Research

Practices Task Force Report. Value Health, 19(6), pp.704-19.

Wyrwich KW, Tierney WM, Wolinsky FD. (2002). Using the standard error of measurement to identify

important changes on the Asthma Quality of Life Questionnaire. Quality of life research : an

international journal of quality of life aspects of treatment, care and rehabilitation, 11(1),

pp.1-7.

Wyrwich KW. (2004). Minimal important difference thresholds and the standard error of measurement:

is there a connection? J Biopharm Stat, 14(1), pp.97-110.

Wyrwich KW, Norquist JM, Lenderking WR, Acaster S, Industry Advisory Committee of International

Society for Quality of Life Research(ISOQOL). (2013). Methods for interpreting change over

time in patient-reported outcome measures. Qual Life Res, 22(3), pp.475-83.

Yang, Y., Abel, L., Buchanan, J., Fanshawe, T., Shinkins, B. (2019). Use of decision modelling in

economic evaluations of diagnostic tests: an appraisal and review of health technology

assessments in the UK. PharmacoEconomics, 3(3), pp.281-291.

Zhao, Y., Feng, H-M., Luo, J.Q.X., Ma, W-J., Tain, J-H. (2018). A systematic review of

pharmacoeconomic guidelines. Journal of Medical Economics, 21(1). pp.85-96.

Ziouani, S., Granados, D., Borget, I. (2016). How to select the best comparator? an international

economic evaluation guidelines comparison. Value in Health, 19(7), pp.A471–A472. DOI:

https://doi.org/10.1016/j.jval.2016.09.726

웹사이트

Australian government: Department of health (PBAC). (2008). Guidelines for preparing a submissions

to the Pharmaceutical Benefits Advisory Committee (Ver 4.3). Retrieved from:

https://pbac.pbs.gov.au/content/information/archived-versions/pbac-guidelines-v4-3-2008.pdf

Australian government: Department of health (PBAC). (2008). Report of the Indirect Comparisons

Working Group to the Pharmaceutical Benefits Advisory Committee: assessing indirect

comparisons. Retrieved from:

Page 274: 의약품 경제성평가지침 개정방안 마련 위탁 연구용역µœ종... · 과제의 최종 보고서로 제출합니다. 2019년 12월 주관 연구 기관명 서울대학교

- 266 -

http://www.pbs.gov.au/industry/useful-resources/pbac-technical-working-groups-archive/indirect-c

omparisons-working-group-report-2008.pdf

Australian government: Department of health (PBAC). (2015). Guidelines for preparing a submissions

to the Pharmaceutical Benefits Advisory Committee (Ver 4.5). Retrieved from:

https://pbac.pbs.gov.au/content/information/archived-versions/pbac-guidelines-v4-5.pdf

Australian government: Department of health (PBAC). (2016). Guidelines for preparing a submission to

the Pharmaceutical Benefits Advisory Committee (Ver 5.0). Commonwealth of Australia.

Retrieved from: https://pbac.pbs.gov.au/content/information/files/pbac-guidelines-version-5.pdf

Australian government: Department of health (PBAC). (2019). Procedure guidance for listing medicines

on the Pharmaceutical Benefits Scheme. Retrieved from:

http://www.pbs.gov.au/industry/listing/procedure-guidance/files/Procedure-Guidance-Listing-Medici

nes-on-the-PBS-v1-6.pdf

The Canadian Agency for Drugs and Technologies in Health (CADTH). (2016). Guidance Document for

the Costing of Health Care Resources in the Canadian Setting: Second Edition. Retrieved

f r o m :

https://www.cadth.ca/dv/guidance-document-costing-health-care-resources-canadian-setting

The Canadian Agency for Drugs and Technologies in Health (CADTH). (2017). Guidelines for the

economic evaluation of health technologies: Canada. 4th ed. Ottawa: CADTH. Retrieved from:

https://www.cadth.ca/dv/guidelines-economic-evaluation-health-technologies-canada-4th-edition

The Canadian Agency for Drugs and Technologies in Health (CADTH). (2019). Procedure and

Submission Guidelines for the CADTH Common Drug Review. Retrieved from:

https://cadth.ca/sites/default/files/cdr/process/Procedure_and_Guidelines_for_CADTH_CDR.pdf

The National Institute for Health and Care Excellence (NICE). (2013). Guide to the methods of

technology appraisal 2013. NICE. Retrieved from:

https://www.nice.org.uk/process/pmg9/resources/guide-to-the-methods-of-technology-appraisal-20

13-pdf-2007975843781

The National Institute for Health and Care Excellence (NICE). (2014). Developing NICE guidelines: the

manual - appendices. Retrieved from: https://www.nice.org.uk/process/pmg20/resources

The National Institute for Health and Care Excellence (NICE). (2019). Position statement on use of

the EQ-5D-5L value set for England (updated October 2019). Retrieved from:

https://www.nice.org.uk/about/what-we-do/our-programmes/nice-guidance/technology-appraisal-g

uidance/eq-5d-5l