libro 1 / 2 curso ok - sefh.es · 1.-introducciÓn si queremos hacer lo mejor para nuestros...

23
LECTURA CRÍTICA: CONCEPTOS BÁSICOS Y ASPECTOS PRÁCTICOS Dr. Patricio Más Dr. Juan Pablo Ordovás Servicio de Farmacia Dr. Juan Cabello Servicio de Cardiología CASPe Hospital General Universitario de Alicante 1.2 PARA FARMACÉUTICOS DE HOSPITAL II FORMACIÓN CONTINUADA FUNDACION PROMOCION MEDICA

Upload: dangtuong

Post on 12-Jul-2019

220 views

Category:

Documents


0 download

TRANSCRIPT

LECTURA CRÍTICA: CONCEPTOS BÁSICOS

Y ASPECTOS PRÁCTICOS

Dr. Patr ic io MásDr. Juan Pablo Ordovás

Servic io de Farmacia

Dr. Juan Cabel loServic io de Cardio log ía

CASPeHospi ta l General Un iversi tar io de A l icante

1.2PARA FARMACÉUTICOS DE HOSPITAL II

FORMACIÓN CONTINUADA

F U N D A C I O N

P R O M O C I O N M E D I C A

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 32

35

SUMARIO

1. Introducción

2. Tipos de estudios

2.1 Estudios en animales2.2 Casos clínicos2.3 Ensayos N=1 2.4 Casos y Controles, Cohortes2.5 Ensayos clínicos2.6 Revisiones sistemáticas – Metaanálisis2.7 Evaluaciones económicas

3. Tipos de evaluaciones

3.1 Evaluación de la calidad formal de las publicaciones 3.2 Lectura crítica

4. Evaluación crítica de la literatura biomédica

4.1 Lectura crítica de ensayos clínicos4.2. Lectura crítica de estudios de evaluación de efectos adversos 4.3. Lectura crítica de revisiones

5. Aspectos prácticos de la lectura crítica

6. Bibliografía

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 34

1.- INTRODUCCIÓN

Si queremos hacer lo mejor paranuestros pacientes, si queremos ofrecercuidados clínicos de alta calidad, nece-sitamos basar nuestras decisiones enpruebas de efectividad (o evidencias).Ese sería el enunciado básico del movi-miento de los cuidados de salud basa-dos en la evidencia que se ha impuestocomo nuevo paradigma clínico con lafacilidad con la que lo hacen las buenasideas, que una vez formuladas parecenobvias.

Esto ha sido posible gracias a diver-sas circunstancias: por una parte se haproducido un incremento exponencialdel conocimiento sobre la efectividad delos tratamientos farmacológicos o deotra índole, producido al amparo delprogreso de la Epidemiología Clínica,que ofrece diseños formales de investi-gación, adecuados para la construcciónde conocimiento generalizable a partirde grupos de pacientes (o de personasen riesgo).

De modo concreto, los progresos enel diseño de ensayos clínicos han per-mitido probar la efectividad y seguridadde diferente fármacos y procedimientos.La mejoría en los diseños de estudiosobservacionales ha permitido aproxima-ciones más adecuadas al estudio de losefectos adversos de los medicamentos.Más recientemente, y por citar los extre-mos del espectro: de una parte la emer-

gencia de la investigación de síntesis(revisiones sistemáticas) nos permitedisponer para nuestras decisiones deuna visión “panorámica” de la investiga-ción sobre una determinada pregunta deefectividad; y de otra los diseños deensayos “ene uno” (EC n=1), cuandoson posibles, ofrecen la investigación endetalle “diseñada a medida” para aplicarconocimiento a un caso concreto.

Como consecuencia de lo anterior yde otros fenómenos, la cantidad depublicaciones biomédicas crece sinparar, tanto en formatos tradicionalescomo en formatos electrónicos, y laaccesibilidad a la información y al cono-cimiento publicado es cada vez másfácil.

Pero esta Arcadia feliz que describi-mos dista bastante de la trinchera clíni-ca en la que habitualmente estamos,donde el tiempo escasea, los problemasson complejos y están llenos de mati-ces, y su formulación es frecuentemen-te difícil. Por otra parte el aumento delas publicaciones no ha supuesto unaumento de la calidad del conocimientoque ofrecen, y la información esta cier-tamente muy accesible pero su cantidadmuchas veces nos satura, de modo queante cualquier búsqueda encontramoscientos de artículos.

Entonces ¿cómo buscar eficiente-mente? y de los artículos que encontra-mos ¿cómo sabemos cual vale y cualno? y finalmente ¿cómo sabemos sitodo ese conocimiento leído es aplicablea nuestro paciente u Hospital?.

37

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 36

electrónicas que proporcionan una visióngeneral sobre un fármaco en concreto ygeneralmente no contienen información tandetallada como las fuentes primarias o lassecundarias.

Las fuentes primarias constituyen el obje-to fundamental de la lectura crítica, dado quees ésta la que va a decidir la validez y aplica-bilidad de la información recogida en un artí-culo original, no el artículo en sí. Así, desdelas fuentes primarias se genera actualmentelo que conocemos como “evidencia” enMedicina.

Para interpretar y utilizar en la práctica clí-nica los resultados obtenidos en un artículo,es necesario disponer de unos conocimien-tos generales sobre las ventajas y desventa-jas de cada diseño. Los diseños básicos quepodemos encontrar son: estudios en anima-les (preclínicos), estudios de casos y contro-les o estudios de cohortes, casos clínicosanecdóticos, estudios N=1, revisiones, ensa-yos clínicos y estudios de evaluación econó-mica. Obviamente, existen también estudioshíbridos, como por ejemplo aquellos queincluyen evaluaciones económicas en unensayo clínico, o metaanálisis que incluyentanto ensayos clínicos controlados comoestudios observacionales, que deberán anali-zarse críticamente empleando los criteriosdescritos para cada uno de estos tipos.

2.1.- Estudios en animalesLos estudios farmacológicos en animales

de experimentación aportan conocimientobásico sobre el perfil farmacocinético y far-macodinámico de un fármaco. Se utilizanpara predecir su capacidad de originar toxici-

dad, así como la incidencia de la misma en lafase preclínica del desarrollo de nuevos fár-macos, y continúan realizándose durante lafase de investigación clínica a fin de ajustarparámetros como la dosis o la toxicidad. Losestudios en animales no pueden ser incorpo-rados de forma directa a la práctica clínica,ya que solo muestran el contexto conceptualdel mecanismo de acción y generan hipótesispara el ser humano. Puede ocurrir que efec-tos observados en humanos no se manifies-ten en animales y viceversa. El uso de mode-los animales para predecir los efectos de unnuevo fármaco en el hombre puede llevar aconclusiones erróneas, por existir diferenciassignificativas tanto en la farmacocinética(absorción, distribución, metabolismo yexcreción del fármaco) como en la farmaco-dinamia (potencia, eficacia y toxicidad).

2.2. Casos clínicosEste tipo de información se obtiene en las

fases IV y posteriores de investigación clínicahabitualmente con el objetivo de identificarRAM no esperadas, infrecuentes o no detec-tadas en las fases anteriores. Los laborato-rios farmacéuticos deben recoger toda lainformación suministrada por este sistema, yproporcionársela en su caso a los organis-mos reguladores correspondientes (AgenciaEuropea del Medicamento o FDA en EEUU).

En España el personal sanitario disponedel sistema de notificación voluntaria de RAM(tarjeta amarilla), con la que se debe informara los centros de farmacovigilancia sobre cual-quier RAM que se detecte o sospeche. Estainformación es importante para evaluar laseguridad de los medicamentos, pudiendo

39

De manera clásica las habilidadesnecesarias para dar una solucion “basa-da en la evidencia” a un dilema clínico ode organización son bien conocidas: 1)formular adecuadamente la cuestión; 2)buscar eficientemente la evidencia; 3)leer críticamente la evidencia; 4) aplicaro adaptar esa evidencia al problema aresolver y 5) evaluar la resolución y elproceso.

Otra alternativa es la de tomar atajosaparentemente sencillos (como lasguías de práctica clínica u otros resú-menes generados por otras personas).Al final estaremos ante el dilema clínicosobre el que hay que optar: o hacer loque otro dice (el atajo) o generar tu pro-pia visión. En cada circunstancia habráque optar, pero en general por razonesde comodidad parece más seductorusar el atajo, aunque incluso en esecaso necesitarás saber leer críticamen-te una guía; pero a plazo medio (indivi-dual y de grupo) el desarrollo de lashabilidades para la solución de proble-mas basándose en la evidencia esmejor estrategia.

Eso es así porque en el siglo XXI yasabemos que nunca sabremos todo loque podría saberse, ni siquiera de unaespecialidad médica determinada, debi-do a que el conocimiento crece acelera-damente y cambia demasiado deprisa.Por ello debemos renunciar a un progra-ma estático que defina “todo lo que pre-cisamos saber para después hacer”,porque en poco tiempo parte de eseconocimiento estará obsoleto, y hemos

de buscar otra manera de progresarintelectualmente (despacio pero sinpausa) mientras hacemos nuestra tareaclínica. Ese modo será: identificar laslagunas o dilemas clínicos, solucionar-los basándonos en la evidencia, apren-der personalmente con ello, y gestionar(es decir compartir) el conocimiento enel grupo y con otros grupos (en la redetc).

En el presente capitulo abordaremoslos aspectos básicos para aprender lashabilidades de lectura crítica, y sugerire-mos algunas maneras prácticas deempezar a caminar por ese mar (¡no tanproceloso!).

2.- TIPOS DE ESTUDIOS

Las fuentes de información biomédi-ca a las que podemos tener acceso sehan clasificado tradicionalmente enfuentes primarias, secundarias y tercia-rias.

Las fuentes primarias son artículospublicados en revistas científicas sobreinvestigación original o casos clínicos, yproporcionan información sobre, porejemplo, nuevos tratamientos o nuevosefectos adversos. Las fuentes secunda-rias nos permiten, de forma rápida, loca-lizar fuentes primarias; son servicioscomo Medline o Embase, que indexanartículos para su posterior localización.Las fuentes terciarias son instrumentosde trabajo como libros o bases de datos

38

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 38

Los estudios de casos y controles vanhacia atrás en el tiempo para determinar quécaracterísticas están asociadas a un deter-minado efecto del medicamento. Por tanto,se examinan pacientes con determinadaspatologías o conjunto de síntomas (porejemplo, reacciones adversas a medicamen-tos, RAM) con el fin de determinar si estabantomando el fármaco a estudio.

Los estudios de cohortes parten de unapoblación homogénea de sujetos y de formaprospectiva identifican aquellos grupos defi-nidos por una característica específica, parafinalmente analizar (en este grupo y en el noexpuesto) un resultado (outcome) concreto.

Así, al inicio del estudio los pacientesempiezan a tomar una medicación (a dife-rencia de los estudios de casos y controles),y son objeto de seguimiento durante unperiodo de tiempo determinado para evaluar,por ejemplo, su seguridad o la aparición dealguna RAM (se obtiene de este modo unaestimación del riesgo).

Los estudios de casos y controles y losde cohortes son técnicas adecuadas paraevaluar los posibles problemas de un fárma-co en la práctica clínica, y sus resultadostienden a ser generalizables, aunque lasrelaciones de causalidad son más complejasde establecer que cuando dichas conclusio-nes se obtienen de ensayos clínicos. Estadificultad se debe a la imposibilidad tanto dedeterminar con precisión la relación entre laadministración del fármaco y la aparición delefecto clínico como de controlar la posibleinfluencia de otros factores que puedan dis-torsionar dicha relación (sesgo de confu-sión).

2.5. Ensayos clínicosPocock (Pocock, 1983) define los ensa-

yos clínicos como “cualquier forma de expe-rimento planeado que afecta a pacientes yque está diseñado para elucidar el trata-miento más apropiado para futuros pacien-tes con una condición médica dada”. Losensayos clínicos aleatorizados (ECA) sonexperimentos en los que los pacientes sonasignados, mediante un mecanismo similaral de lanzar una moneda (aleatorización),bien al grupo experimental (por ejemplo, tratamiento farmacológico a ensayar) bien al grupo control (por ejemplo, placebo o tratamiento farmacológico estándar).Posteriormente a estos pacientes se lesefectúa un seguimiento durante un tiempodeterminado para evaluar la eficacia o lasconsecuencias de la intervención. Los ensa-yos clínicos son en la actualidad la herra-mienta más adecuada para la ea la evalua-ción de tratamientos farmacológicos y otrostipos de intervenciones.

2.6. Revisiones sistemáticas – metaanálisisSon estudios en los que mediante un

método predefinido se realiza una síntesiscualitativa. y cuantitativa de la informaciónpublicada. En estas revisiones la evidenciasobre un tema ha sido sistemáticamenteidentificada, criticada y resumida de acuer-do a unos criterios predeterminados. Estaestrategia incluye una búsqueda exhaustivade todos los artículos potencialmente rele-vantes y el uso de criterios explícitos yreproducibles en la selección de artículospara la revisión. Estas investigaciones desíntesis se pueden utilizar para diferentes

41

ser utilizada, incluso, para la modificaciónde la información contenida en el pros-pecto del medicamento o a la retirada delmedicamento del mercado.

Posiblemente el mayor inconvenientede los case-reports casos clínicos sea suescasa capacidad de establecer unarelación de causalidad entre el fármaco yel efecto adverso aparecido (cuando seproduce un evento, la recogida de infor-mación se realiza en condiciones nocontroladas). Además, la publicaciónaislada de RAM suele ser objeto de críti-cas ya que pueden no coincidir con laevidencia de causalidad obtenida por elconjunto de notificaciones voluntarias enlos sistemas de farmacovigilancia, espe-cialmente cuando se cruzan bases dedatos internacionales. (ya que la formade recoger la información y la argumen-tación de la causalidad pueden ser dis-tintas diferentes modos de argumentarcausalidad).

2.3. Ensayos N=1El ensayo N = 1 es una estrategia de

“prueba de tratamientos” para determi-nar la efectividad de un tratamiento oidentificar efectos adversos en unpaciente. El objetivo de estos estudioses por tanto estudiar la eficacia del trata-miento en un paciente concreto y elegirel tratamiento “a medida” (atribuir causa-lidad a un efecto adverso dudoso o inclu-so de uso diagnóstico). En estos ensa-yos clínicos aleatorizados se prueba en

un solo paciente dos tratamientos, untratamiento en cada subciclo, y se per-mite la prueba durante varios ciclos. Deeste modo, cada ciclo está dividido ensubciclos durante los cuales el pacientepuede recibir el fármaco a estudio, unapauta posológica distinta del mismo fár-maco, un tratamiento alternativo o place-bo. El orden en que se administran dos omás tratamientos se determina de formaaleatoria, y el procedimiento (siempreque sea posible) debe ser doble ciego.Los estudios N de 1 tienen más ventajasque los casos clínicos debido al diseñodel propio estudio (Cabello y col., 1997).Debe resaltarse que en la planificación ydesarrollo de este tipo de estudios, elServicio de Farmacia del hospital impli-cado representa un factor clave estraté-gico: su infraestructura, conocimiento yparticipación activa es indispensabledada la complejidad de la preparación ycontrol de muestras de ensayo.1

2.4. Casos y controles y CohortesLos estudios de casos y controles y

los estudios de cohortes se utilizan enfases tardías de la investigación clínica,y a veces se les denomina estudios far-macoepidemiológicos, revisión de la uti-lización de medicamentos o estudios defarmacovigilancia post-comercializa-ción. Estos estudios tienden a desarro-llarse en poblaciones grandes y diver-sas, y se centran en el uso global delmedicamento.

40

1 En este sentido, el Servicio de Farmacia del Hospital General Universitario de Alicante ha acumulado unaamplia experiencia que ha permitido en el pasado la satisfactoria consecución de varios ensayos N=1

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 40

dad del estudio, es decir, si su diseño es ono adecuado. Por último, se puede abordarun estudio de investigación desde el puntode vista de su posible aplicación a la prácti-ca clínica ¿me creeré lo que me dicen y voya poder aplicarlo?. Obviamente para poderaplicar en la práctica clínica diaria el resul-tado de un estudio, éste ha de cumplir conun mínimo de calidad en cuanto a su diseño.

3.1.- Evaluación de la calidad formal de laspublicaciones

La convención CONSORT (ConsolidatedStandards of Reporting Trials) (Moher y col.,2001) se ha desarrollado para ayudar a losautores a mejorar la forma de presentar unensayo clínico mediante el uso de una listaguía y de diagramas de flujo. Los ítem de lalista guía están relacionados con los conte-nidos del título, resumen, introducción,métodos, resultados y discusión. En la tabla1, se incluye la propuesta CONSORT, conlos 22 ítem de que consta. Los diagramasde flujo muestran explícitamente el númerode participantes en cada grupo de interven-ción (control o experimental) incluido en elanálisis primario de los datos. La inclusiónde estos números permite al lector juzgar silos autores han realizado un análisis porintención de tratar en el análisis estadístico.En resumen, la metodología CONSORTestá dirigida a mejorar la forma de presentarun ECA, permitiendo a los lectores entendercómo se ha conducido un ensayo y asípoder evaluar e interpretar la validez de susresultados (www.consort-statement.org).

La aceptación de estas reglas del juego

en el ámbito de la publicación de ensayosclínicos, aceptadas por la mayoría de lasrevistas biomédicas de prestigio va más alládel simple purismo formal. Implica unahomogeneidad de la información, un asegu-ramiento de su interpretación adecuada yuna creación de conocimiento más precisa,simple y universal.

Una manera de evaluar la calidad con laque se han escrito las revisiones sistemáti-cas es utilizar la metodología QUOROM(Quality of reporting of meta-analyses)(Moher y col., 1999) con la que se pretendeque los autores de metaanálisis proporcio-nen a los lectores toda la información nece-saria para la interpretación del estudio. Aligual que la metodología CONSORT aplica-da a los ECA, QUOROM utiliza una listaguía y un diagrama de flujo. Esta lista guíaconsiste en 18 ítem (tabla 2) y describe lamanera de presentar el resumen, introduc-ción, métodos, resultados y discusión. Estáorganizado en 21 encabezados relaciona-dos con la búsqueda, selección, evaluaciónde la validez, características de los estudiosy síntesis cuantitativa de los datos. Los ítema incluir están basados en evidencia científi-ca, siempre que ha sido posible (8 de los 18ítem), teniendo en cuenta que éstos puedeninfluir de forma sistemática en la estimacióndel efecto del tratamiento. El diagrama deflujo proporciona información a cerca delprogreso de los EC conforme se va reali-zando el proceso de revisión, e incluye elnúmero de EC potencialmente relevantesidentificados, aquellos que han sido exclui-dos (incluyendo las razones de la exclusión)

43

tipos de estudios: ensayos clínicos,cohortes, diagnóstico, etc. La combina-ción estadística de los resultados deuna revisión sistemática o metaanálisisutiliza los resultados de los estudiosoriginales seleccionados con la finali-dad de evaluarlos de forma conjunta.Así, el metaanálisis genera un estima-dor global del efecto (tendencia centraly variabilidad) del efecto estudiado. Elvalor de los metaanálisis radica en laposibilidad de agrupar grandes mues-tras de pacientes al agrupar datos pro-cedentes de ensayos clínicos u otrosestudios, permitiendo de este modoidentificar efectos no detectados pre-viamente (el resultado final tiene mayorpoder estadístico que el obtenido encada estudio por separado). Sinembargo, la calidad de una revisión sis-temática depende de la calidad de supropio diseño así como de los EC delos que procede.

2.7.- Evaluaciones económicasLos estudios de evaluación econó-

mica se consideran actualmenteimprescindibles a la hora de evaluaralternativas terapéuticas, debido a lademanda social de una gestión eficien-te de los costes médicos y de saludpública. Estos estudios se centran enidentificar, medir y comparar los costesy consecuencias de los tratamientosfarmacológicos y o de otros serviciossanitarios, y se expresan en diferentestipos de cocientes de coste / unidadesde salud. Los estudios de evaluación

económica sólo son pertinentes cuan-do la intervención que se estudia (porejemplo, el tratamiento con un fármacoexperimental) ha demostrado efectivi-dad. Desgraciadamente, el incrementoen la realización de estos estudios haprovocado una gran variabilidad encuanto a su calidad y rigor científico,así como un uso inadecuado de térmi-nos farmacoeconómicos como coste-efectividad o coste-utilidad. Sin embar-go, debido a que los recursos sanita-rios son universalmente limitados, esevidente que estos estudios puedenser útiles al proporcionar informaciónsobre los costes de los procesos y delas potenciales intervenciones para, deeste modo, poder decidir cómo distri-buir estos recursos (coste de oportuni-dad). Pese al evidente interés que estetipo de estudios presentan para los far-macéuticos de hospital, no serán trata-dos en el presente tema.

3.- TIPO DE EVALUACIONES

Existen distintas aproximaciones ala lectura crítica de un ensayo clínico.Por un lado podemos evaluar metodo-lógicamente si un ensayo publicadocumple con una serie de requisitos for-males que han sido recogidos en diver-sas convenciones. Es decir, ¿estáescrito de forma adecuada?, ¿contienetoda la información relevante necesariapara su correcta interpretación?.

Sin embargo, la calidad formal deuna publicación no nos asegura la cali-

42

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 42

44 45

Nº Descripción

Título y Resumen 1 Cómo se asignan los participantes a la intervención (asignación aleatoria)

IntroducciónAntecedentes 2 Antecedentes científicos y bases en los que se

fundamenta el estudio

MétodosParticipantes 3 Criterios de inclusión para los participantes y modo y

lugar donde se recogen los datosIntervenciones 4 Detalles precisos de la intervención planeada para

cada grupo y cómo y cuándo se aplicaronObjetivos 5 Objetivos específicos e hipótesisResultados 6 Definición clara de las variables primarias

y secundarias y, cuando sea posible, cualquier método utilizado para mejorar la calidad de las medidas (ej. observaciones múltiples, entrenamientode asesores)

Tamaño muestra 7 Cómo se determinó el tamaño muestral y, cuando sea posible, explicación de cualquier análisis provisional y excepción de las reglas

AleatorizaciónGeneración 8 Método utilizado para la generación de la secuencia secuencia aleatorizada de asignación, incluyendo

detalles de cualquier restricción (ej. estratificación)Ocultación 9 Método utilizado para llevar a cabo la secuencia aleatorización aleatorizada de asignación (ej. contenedores

numerados o central telefónica), clarificando si la secuencia fue ocultada mientras se asignaron las intervenciones

Realización 10 Quién generó la secuencia de asignación, quién reclutó a los participantes, y quién asignó los participantes a sus grupos

Carácter ciego 11 Si los participantes, los que administraron las intervenciones y los que evaluaron los resultados conocían el grupo asignado

Métodos estadísticos 12 Métodos estadísticos utilizados para comparar grupos para la variable primaria, métodos para los análisis adicionales (ej. análisis de subgrupos)

Nº Descripción

Resultados

Diagrama de 13 Flujo de participantes a través de cada etapa participantes (se recomienda la inclusión de un diagrama).

Específicamente, para cada grupo hay que indicar el número de participantes: asignados aleatoriamente, los que se ha planeado que van a recibir tratamiento, los que han completado el protocolo de estudio y los que se han analizado para la variable primaria. Describir las desviaciones de los protocolos respecto a lo planeado previamente junto con sus razones

Reclutamiento 14 Fechas de los periodos de reclutamiento y de seguimiento

Datos en nivel basal 15 Características basales demográficas y clínicas de cada grupo

Números analizados 16 Número de participantes (denominador) en cada grupo incluido en cada análisis y si el análisis se realizó por intención de tratar. Exponer los resultados en números absolutos siempre y cuando sea posible (ej. 10/20 y no 50%)

Resultados 17 Indicar para cada variable primaria y secundaria, un resumen y estimaciones de los resultados de cada grupo y el tamaño del efecto

estimado con su precisión (por ejemplo, IC 95%)

Análisis auxiliares 18 Indicar cualquier otro análisis llevado a cabo incluyendo análisis de subgrupos, indicando los que estaban especificados y aquellos exploratorios

Efectos adversos 19 Todos los efectos adversos importantes o efectos secundarios en cada grupo de intervención

Discusión

Interpretación 20 Interpretación de los resultados, teniendo en cuenta la hipótesis de estudio, las fuentes potenciales de error o imprecisión y peligros asociados con la multiplicidad de análisis

Generalización 21 Generalización (validez externa) de los hallazgos del ensayo

Evidencia resultante 22 Interpretación general de los resultados en el contexto de la evidencia que exista hasta ese momento

Tabla 1

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 44

4746

Encabezado Descripción

Título Identificar el artículo como un metaanálisis o unarevisión sistemática de ECA

Resumen Usar un formato estructurado

Objetivos Plantear la pregunta clínica de forma explícita

Fuentes Bases de datos y cualquier otro tipo dede datos información

Métodos Los criterios de selección (población, de revisión intervención, variables y diseño del estudio);

métodos para la evaluación de la validez, características del estudio y síntesis cuantitativa de los datos en detalle suficiente como para permitir repetir el análisis

Resultados Características de los ECAs incluidos y excluidos; resultados cualitativos y cuantitativos (punto de estimación e intervalos de confianza) yanálisis de subgrupos

Conclusión Describir los resultados más importantes

Introducción Describir el problema clínico de forma explicita, razonamiento biológico por el que se realiza la intervención y razonamiento por el que se realiza la revisión

MétodosBúsqueda Detallar las fuentes de información (bases de

datos, registros, expedientes personales, contacto con expertos, agencias, búsquedas a mano) y cualquier restricción aplicada (años, estado de la publicación, lenguaje de publicación)

Selección Criterios de inclusión y exclusión (definir las poblaciones, intervenciones, variables principales y diseño del estudio)

Evaluación Los criterios y procesos utilizados (evaluación de de la validez la calidad)

Encabezado Descripción

Extracción Los criterios y procesos utilizados (completadode los datos de forma independiente y por duplicado)

Características Los tipos de los diseños de los estudios, características de de los estudios los pacientes, detalle de las intervenciones, definiciones de

las variables y cómo se ha evaluado la heterogeneicidad

Síntesis Las principales medidas del efecto (por ej., riesgo relativo), cuantitativa método de combinación de los resultados (pruebas de los datos estadísticas e intervalos de confianza), manejo de los

datos perdidos; cómo se evaluó estadísticamente la heterogeneicidad, razonamiento para cualquier análisis de subgrupos o de sensibilidad realizado a priori

ResultadosDiagrama Proporcionar un diagrama de ensayos que resuma de ensayos el perfil del metaanálisis

Características Presentar los datos descriptivos para cada ensayo (edad, de los estudios tamaño muestral, intervención, dosis, duración y periodo

de seguimiento)

Síntesis Notificar el acuerdo en la selección y en la evaluación de la cuantitativa validez; presentar un resumen simple de los resultados de los datos (para cada grupo de tratamiento en cada ensayo y para

cada variable primaria); presentar los datos necesarios para calcular el tamaño del efecto y los intervalos de confianza en un análisis por intención de tratar

Discusión Resumir los hallazgos importantes; discutir las conclusiones clínicas basadas en su validez interna y externa; interpretar los resultados a la luz de la evidencia disponible hasta ese momento; describir los posibles sesgos potenciales introducidos durante el proceso de revisión (por ejemplo, sesgo de publicación) y sugerir un futuro plan de investigación

Tabla 2

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 46

Sin embargo, podría interesarnos unabordaje alternativo, que puede denominarsede heterodoxia práctica, que utiliza comobase estratégica la importancia de los resul-tados, en el que se modificaría el orden delas preguntas:

1.- ¿Son los resultados muy relevantes?(pregunta B, tabla 3)

2.- ¿Son válidos? (pregunta A, tabla 3)3.- Si son relevantes y válidos à ¿son

aplicables? (pregunta C, tabla 3)

49

y los que se revisaron y finalmente seincluyeron en el estudio.

3.2. Evaluación / lectura crítica –CASPe

CASP (Critical Appraisal SkillsProgramme; programa de habilidadesen lectura crítica) es un programa dedocencia práctica creado en el Instituteof Health Sciences de Oxford(Universidad de Oxford y NHS R&D)para ayudar a los decisores del Serviciode Salud Británico a adquirir habilidadesen la búsqueda de información y en lec-tura crítica de la literatura científica ensalud, de modo que pudieran obtenerasí la “evidencia científica” necesariapara tomar sus decisiones. En nuestropaís, la coordinación CASPe adoptauna estructura de red internodal, y tiene su sede en Alicante (www.redcaspe.org).

¿Cuál es la finalidad de esta extendi-da red? Enseñar y diseñar habilidadespara la búsqueda y la lectura crítica.

Normalmente, en nuestro trabajodiario nos enfrentamos a situacionesdiversas (escenarios) que nos obligan aacceder a un artículo original y revisarlopara poder dar una respuesta a una pre-gunta clínica concreta. En definitiva,precisamos de estrategias de resoluciónde problemas (problem solving) que nospermitan una rápida búsqueda de cono-cimiento aplicable en cada caso. Porejemplo, te llaman desde una unidad dehospitalización para solucionar una

duda terapéutica (¿cuál es el tratamien-to más recomendable para tratar unapatología en concreto en un varón de 60años con una determinada enfermedadde base?), o bien deseas realizar unarevisión para la Comisión de Farmacia yTerapéutica, a fin de evaluar la conve-niencia de incluir en la GuíaFarmacoterapéutica (GFT) del hospitalun nuevo principio activo. Nos podemosencontrar estos u otros escenarios, eindefectiblemente para cada uno deellos nos plantearemos una preguntadistinta.

La búsqueda de respuestas deberáser razonablemente “crítica”, dada laimportancia de la decisión final (impac-to clínico directo), las posibles diferen-cias entre mi escenario y el del artículoen cuestión, el grado de evidencia queéste sea capaz de aportar y la posiblevariabilidad entre diferentes estudiossimilares.

La metodología CASP emplea unpanel de preguntas de lectura críticaespecífico para cada tipo de artículo(ensayo clínico, metaanálisis...), organi-zados todos ellos de la misma forma, ydiseñados para responder a una pre-gunta clínica en un escenario concreto(tabla 3). Esta metodología es conside-rada como altamente eficiente cuandose sigue en forma de talleres prácticosen grupos reducidos.

Desde un punto de vista purista,ortodoxo, el proceso de aprendizaje delectura crítica puede esquematizarsecomo sigue (tabla 3).

48

Esquema general a utilizar en la lectura crítica (CASPe)

A. ¿SON VÁLIDOS LOS RESULTADOS DEL ESTUDIO?

• Esta pregunta valora la validez del efecto estudiado en el artículo. Otra forma de hacer lapregunta: ¿Estos resultados representan la estimación del efecto sin ningún tipo de errorsistemático, o por el contrario se han podido ver influidos de alguna forma que nos llevena una falsa conclusión? De otro modo ¿me voy a creer los resultados?

B. ¿CUÁLES SON LOS RESULTADOS?

• ¿Cuál es la magnitud de los resultados y su precisión? En suma ¿son relevantes estosresultados?

C. ¿PUEDEN AYUDARME LOS RESULTADOS EN EL TRATAMIENTO DE MIS PACIENTES?

• Deberemos analizar si los resultados son aplicables a nuestro paciente, ya que podríaser que éste sea muy distinto a los pacientes incluidos en el estudio, o bien que la variable principal estudiada no sea importante en nuestro escenario

• Posteriormente, si los resultados son aplicables, ¿cuál es el impacto neto del tratamiento?El impacto depende por una parte de los beneficios y riesgos del tratamiento (efectossecundarios y efectos tóxicos) y, por otra, de las consecuencias de no iniciar tratamiento.Por tanto, incluso un tratamiento efectivo debería obviarse cuando el pronóstico de unpaciente sea bueno sin tratamiento, especialmente cuando el tratamiento pueda provocarimportantes efectos secundarios y tóxicos

Tabla 3

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 48

4.- EVALUACIÓN CRÍTICA DE LALITERATURA BIOMÉTICAPREGUNTAS CASP

4.1.- Lectura crítica de EnsayosClínicos

50

A.- ¿Son válidos los resultados del estudio? (tabla 4)

Preguntas de eliminación1.- ¿Se orienta el ensayo a una pregunta

claramente definida?Esta primera pregunta es común a todas

las plantillas de lectura crítica, ya sea deensayos clínicos, revisiones, de evaluaciónde efectos adversos u otras. Para que estéclaramente definida, una pregunta de investi-gación debe redactarse aludiendo a la pobla-ción de estudio, la intervención que se harealizado (tratamiento experimental) y losresultados que se han considerado.

2.- ¿Fueron los pacientes incluidos en elestudio de forma aleatorizada?

El efecto clínico puede verse influido pordistintos factores y el tratamiento es uno deellos. Patologías graves de base, presenciade condiciones de comorbilidad y un grannúmero de factores pronósticos (tanto cono-cidos como desconocidos) a menudo enmas-caran efectos significativos del tratamiento.Ya que todos estos factores también influyenen la decisión del clínico, los ensayos clínicosno aleatorizados de eficacia son incapacesde distinguir entre tratamientos beneficiosos,no tan útiles o incluso perjudiciales. La venta-ja de la aleatorización es que permite asegu-rar, si el tamaño muestral es lo suficiente-mente grande, que tanto los factores deter-minantes conocidos como los desconocidoscapaces de influir en el resultado se encuen-tran distribuidos de la misma manera, tantoen el grupo control como en el grupo experi-mental. Como consecuencia, la aleatoriza-

ción de un ensayo clínico incrementa signifi-cativamente la evidencia que de él podemosobtener.

Es importante conocer si la secuencia dealeatorización se mantuvo oculta al investiga-dor responsable de la inclusión de los pacien-tes en el ensayo. Si esto se cumple, el inves-tigador desconoce qué tratamiento recibirá elpróximo paciente y, por lo tanto, no podrá dis-torsionar el equilibrio que se establece entrelos grupos a comparar. De otra manera sepodría distorsionar el efecto del tratamientoen cualquier dirección (sesgo), haciendo queel efecto fuera mayor o menor de lo que real-mente es.

3.- ¿Fueron adecuadamente considera-dos hasta el final del estudio todos lospacientes que entraron en él?

Esta pregunta tiene dos componentes,por una parte hay que ver si el seguimientode los pacientes fue completo y por otra si lospacientes se analizaron en el grupo al quefue inicialmente seleccionado.

¿Fue el seguimiento completo? – Todoslos pacientes que entraron en el ensayodeben ser considerados hasta el final delmismo; si esto no se cumple y se pierde unelevado número de pacientes (“seguimientoperdido”), la validez real del estudio puedeverse cuestionado. Cuanto mayor sea la pér-dida de pacientes, mayor será la probabilidadde sesgo del ensayo, dado que los pronósti-cos de los pacientes perdidos pueden serdistintos de los que se analizan finalmente.Las pérdidas de seguimiento pueden gene-rarse por efectos negativos (efectos adver-sos, muerte) o positivos (mejora de los

51

A/ ¿Son válidos los resultados del ensayo?

Preguntas de eliminación

1. ¿Se orienta el ensayo a una pregunta claramente definida?

Una pregunta debe definirse en términos de - La población de estudio- La intervención realizada- Los resultados considerados

2. ¿Fue aleatoria la asignación de los pacientes a los tratamientos?

- ¿Se mantuvo oculta la secuencia de aleatorización?

3. ¿Fueron adecuadamente considerados hasta el final del estudio todoslos pacientes que entraron en él?

- ¿El seguimiento fue completo?- ¿Se analizaron los pacientes en el grupo al que fueron aleatoriamente

asignados?

Preguntas de detalle

4. ¿ Se mantuvieron ciegos al tratamiento los pacientes, los clínicos y el personal del estudio?

- los pacientes- los clínicos - el personal del estudio

5. ¿Fueron similares los grupos al comienzo del ensayo?

En términos de otros factores que pudieran tener efecto sobre el resultado: edad, sexo, etc.

6 ¿Al margen de la intervención en estudio, los grupos fueron tratados deigual modo?

Tabla 4

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 50

síntomas del paciente). Para decidir sila pérdida de seguimiento es excesi-va, puede efectuarse un análisis desensibilidad. Para ello, se recalculanlos resultados del ECA suponiendo lapeor de las situaciones (todos lospacientes perdidos en el grupo experi-mental se consideran por efectosnegativos, y todas las pérdidas en elgrupo control por efectos positivos). Silas conclusiones del EC no cambian,entonces las pérdidas no modifican elresultado del estudio y pueden serasumidas.

¿Fueron los pacientes analizadosen el grupo al que fueron aleatoriza-dos? – Como ocurre en la práctica clí-nica diaria, los pacientes en los ensa-yos clínicos olvidan a veces tomar sumedicación, e incluso pueden abando-nar su tratamiento. Las razones porlas que a menudo los pacientes notoman su medicación pueden estarrelacionadas con su pronóstico.Excluir a los pacientes no cumplidoresdel análisis de los resultados puedellevar a que pacientes en los que eltratamiento podría haber sido eficaz, apesar de ser pacientes no cumplido-res, no se incluyan en el análisis.Debido a ello, la comparación entrelos grupos control y experimental pro-porcionada por la aleatorizaciónpuede quedar sin valor. Este principiode incluir en los resultados a todos lospacientes en el grupo al que fueronaleatorizados inicialmente se denomi-na análisis por intención de tratar.

Esta estrategia mantiene el valor realde la aleatorización: los factores pro-nósticos tanto conocidos como aque-llos que desconocemos van a serigualmente distribuidos entre ambosgrupos, con lo que el efecto observa-do será debido únicamente al trata-miento al que los pacientes han sidoasignados.

Es lo que ocurre, por ejemplo,en los estudios en los que se eva-lúan terapias quirúrgicas. Si algu-nos de los pacientes aleatorizadosal grupo experimental no llegan aoperarse (ya sea porque estándemasiado enfermos o porque elevento a estudio les ocurre antesde entrar en quirófano), y los inves-tigadores los incluyeran por ello enel brazo control, el resultado seríaque incluso una cirugía inútil pare-cería efectiva, no porque ésta losea, sino como consecuencia de laexclusión sistemática de pacientescon mal pronóstico del grupo expe-rimental.

Preguntas de detalle4.- ¿Se mantuvieron ciegos al tra-

tamiento los pacientes, los clínicos yel personal del estudio? - Los pacien-tes que conocen que se les va a admi-nistrar un tratamiento experimentalnuevo son más propensos a tener unaopinión favorable sobre la eficacia dedicho tratamiento. Lo mismo ocurre

52

con los clínicos o cualquier personal sani-tario que participe en un EC. Además, silos investigadores no mantienen la oculta-ción de la secuencia de asignación (OSA)de tratamientos, podrían dar interpretacio-nes positivas cuando los hallazgos sonmínimos, o bien influir en las respuestassubjetivas de los pacientes, llevando a ladistorsión de los resultados del EC y de loscuidados paralelos derivados. La mejormanera de evitar la introducción de estoserrores es mediante el doble ciego simple,o con doble enmascaramiento (utilizandoplacebo).

En un estudio de 250 ensayos clíni-cos controlados provenientes de 33metaanálisis, se demostró que los ECAcon una OSA inadecuada o no especifi-cada arrojaban estimaciones mayoresde los efectos del tratamiento (incre-mentos del odds ratio de 41% y 33% res-pectivamente) que los ECA en los quelos autores informaban adecuadamentede la OSA. Además, los ECA que noeran doble ciego sobrestimaban el efec-to del tratamiento comparados con losECA doble ciego (incrementos de oddsratio de 17%) (Schulz y col, 1995).

5.- ¿Fueron similares los grupos alcomienzo del ensayo? – Para poder eva-luar la validez de un EC, es importante quelos pacientes del grupo control y experi-mental sean similares en todos aquellosfactores que puedan afectar al resultado,excepto en el tratamiento recibido. La alea-torización no siempre hace que los factores

pronósticos conocidos se distribuyan deforma similar.

Cuando los grupos son pequeños, lacasualidad puede hacer que los pacientescon un mejor pronóstico se agrupen enuno de los grupos. Cuanto más grande esel tamaño muestral, más difícil es que estoocurra. Esto es similar a lo que ocurrecuando lanzamos una moneda: puede serque de diez lanzamientos salgan 7 caras,pero lo que realmente sería sorprendentees que de 100 lanzamientos salieran 70caras.

Lo relevante no es si existen diferenciasen los factores pronósticos conocidos entreambos grupos, sino la magnitud de estasdiferencias. Si éstas son muy grandes, lavalidez del estudio puede verse comprometi-da. De todas formas, las técnicas estadísti-cas permiten ajustar los resultados del estu-dio a las diferencias basales entre los grupos.Cuando se realiza lectura crítica, debe anali-zarse la información del artículo referente a lasimilitud de características basales relevan-tes de los pacientes, y –en su caso- a losanálisis que ajusten los resultados a esasdiferencias. Si la conclusión que se obtienees la misma tanto cuando se realiza un aná-lisis ajustado como cuando no se realizadicho ajuste, entonces la aleatorización fuecorrecta y los resultados del estudio son valo-rables.

6.- ¿Al margen de la intervención enestudio, los grupos fueron tratados de igualmodo? – La atención recibida por los pacien-

53

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 52

que han recibido el tratamiento experimentalfrente al riesgo de los pacientes del grupocontrol.

El riesgo relativo es la razón matemáti-ca del riesgo de muerte entre ambos gru-pos; en este caso RR = 0,75 (RR = 0,15 /0,20). Esto es: si el RR = 1, entonces elriesgo de morir en ambos grupos es idén-tico. Si RR>1, entonces la probabilidad demuerte en el grupo experimental es mayorque en el grupo control. En nuestro ejem-plo, como quiera que RR<1, la probabili-dad de muerte en el grupo experimental esmenor.

La medida más común de medir el efectode tratamientos dicotómicos es la reduccióndel riesgo relativo (RRR). Se calcula comoRRR = 1 - RR, expresado en porcentaje.

Una RRR de 25%, como en el ejemplo,significa que el tratamiento experimentalreduce el riesgo relativo de muerte en un25% con relación a lo que ocurre entre lospacientes del grupo control; cuanto mayorsea la RRR, más eficaz será la terapia.

Una de las maneras de expresar losresultados de forma más intuitiva es utilizar el“número necesario a tratar” (NNT). El NNT esel número de pacientes que deberíamos tra-tar para prevenir un evento.

En nuestro ejemplo si la reducción delriesgo absoluto (RRA) es de un 5%; estosignifica que de cada 100 pacientes trata-dos 5 no tendrán el evento gracias al tra-

tamiento a estudio, con lo que utilizandouna simple regla de tres, podemos calcularque para evitar un solo evento será nece-sario tratar a 20 pacientes [20 = (1 x 100) /5]. El NNT no es más que la inversa de lareducción de riesgo absoluto.

Sin embargo, antes de decidir iniciarun tratamiento, también es necesario con-siderar cuál es el riesgo de nuestropaciente de que tenga un evento si no lotratamos. Independientemente del valorde la RRR, cuanto mayor sea la probabili-dad de que un paciente sin tratar sufra undeterminado evento, más se beneficiará elpaciente del tratamiento y menor será elnúmero de pacientes a tratar para preve-nir un evento.

8.- ¿Cuál es la precisión de la estima-ción del efecto del tratamiento? – Puedeque la verdadera reducción del riesgo ladesconozcamos y todo lo que tengamossea la estimación que nos proporciona unEC riguroso. Esta estimación se denominaestimación puntual (point estimate), y espreciso recordar que aunque el valor ver-dadero esté a su “alrededor”, es bastanteimprobable que se haya obtenido precisa-mente el valor verdadero. Los investiga-dores nos indican en los estudios cómo degrande son esos “alrededores” en los quese encuentra el valor real mediante losintervalos de confianza (IC). El IC del 95%puede interpretarse como sigue: “si repi-tiéramos el estudio 100 veces es seguroque en 95 veces estaría entre los dos pun-tos citados”.

55

tes en el grupo control y experimentalpuede diferir. Estas diferencias en laatención sanitaria global –ajena al dise-ño experimental- pueden llevar a distor-sionar los resultados del estudio. Si ungrupo recibe mayores cuidados, puedeser que se documente más detallada-mente los datos de los pacientes inclui-dos en ese grupo, de forma que éstospueden ser tratados más intensamentecon medidas que no estén incluidas enel estudio. Se denominan co-interven-ciones aquellas intervenciones distintasa la del tratamiento en estudio. Estaspueden llegar a ser un problema impor-tante si el estudio no es doble ciego ocuando bajo el epígrafe “según el crite-rio del médico” se permite la utilizaciónde tratamientos distintos al tratamientoexperimental, que han demostrado sereficaces en esa determinada interven-ción. En el caso de que las co-interven-ciones se permitan, se debe especificarcuáles han sido y cómo se registraron.

B/ ¿Cuáles son los resultados?

7. ¿Cuál fue el tamaño del efectodel tratamiento?

¿Qué resultados se midieron?¿Qué estimadores se usaron?

8. ¿Cuál es la precisión de la estimación del efecto del tratamiento?

¿ Cuáles son sus intervalos de confianza?

Tabla 5

B.- ¿Cuáles son los resultados? (tabla 5)

7.- ¿Cuál fue el tamaño del efectodel tratamiento? – Los EC suelen eva-luar con qué frecuencia los pacienteshan experimentado una respuesta clíni-ca o algún efecto adverso. Algunosejemplos de estas respuestas dicotómi-cas son: recurrencia de cáncer, infartode miocardio o muerte. Los pacientespueden o no sufrir un evento, y al finaldel estudio se informa sobre qué propor-ción de pacientes lo han desarrollado.

¿Cómo se pueden expresar estosresultados? Una manera sería comodiferencias absolutas (reducción delriesgo absoluto, RRA) entre la propor-ción de pacientes que murieron en elgrupo control y la proporción de pacien-tes que lo hicieron en el grupo experi-mental.

Consideremos, por ejemplo, unestudio en el que el 20% de lospacientes del grupo control murieron,y sólo lo hicieron el 15% de los querecibieron el tratamiento experimen-tal. Restando la mortalidad experi-mental de la control, obtenemos unRRA de 0,05 (RRA = 0,20 - 0,15 =0,05). Esto es, un 5% de diferenciade mortalidad entre ambos grupos.

Otra manera de expresar el impactodel tratamiento sería en forma de riesgorelativo (RR), que es el riesgo de queaparezca un evento en los pacientes

54

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 54

C.- ¿Pueden ayudarnos estos resultados?(tabla 6)

9.- ¿Pueden aplicarse estos resultadosen tu medio o población local? – Lo primeroque debemos preguntarnos es cómo deseguros estamos de que los resultados pue-den aplicarse a nuestro paciente en concretoo a la práctica clínica o a un grupo de pacien-tes bien definido. Una aproximación es pre-guntarnos si el paciente al que queremosaplicar los hallazgos de un estudio hubierasido incluido en dicho estudio por los autores,es decir, si nuestro paciente incluye todos loscriterios de inclusión y no incumple ningúncriterio de exclusión del citado estudio. Enese caso, no hay duda de que se le podríanaplicar las conclusiones del EC. Si no es así,hay que aplicar el sentido común. Por ejem-plo, ¿los resultados del estudio se puedenaplicar si el paciente es dos años mayor quelo que se establece como límite en los crite-rios de inclusión? o, por ejemplo, tiene másenfermedades graves concomitantes, o hasido tratado previamente con una terapia

alternativa, o tiene alguna condición decomorbilidad. Un método alternativo es pre-guntarnos si existe alguna razón por la queno deberíamos aplicar estos resultados a unpaciente en concreto.

Un estudio puede analizar varios subgru-pos de pacientes con diferentes estadios deenfermedad, diferentes condiciones decomorbilidad, distintas edades al empezar elestudio, etc., y nuestro paciente puede enca-jar en uno de éstos subgrupos específicos.Pero para poder aplicarle los resultados deun análisis de subgrupos, éstos deben estardefinidos en el diseño inicial.

10.- ¿Se tuvieron en cuenta todos losresultados de importancia clínica? – Los tra-tamientos están indicados cuando proporcio-nan beneficios importantes, de lo contrario noexiste justificación para administrar estos fár-macos. Lo que se requiere es evidencia deque el tratamiento mejora los resultados, y deque esta mejora es importante para lospacientes.

57

En el ejemplo numérico propuesto(ensayo aleatorizado de 100 pacien-tes en cada brazo de tratamiento -control y experimental- con 20 muer-tes en el grupo control y 15 en elgrupo experimental), la RRR seríadel 25%. Sin embargo, se puede unopreguntar si el valor verdadero de laRRR es más grande o más pequeñoque ese 25%, basado en una diferen-cia de solo 5 muertes. De hecho,podría no aportar ningún beneficio(un RRR de 0%) o incluso perjuicio(un RRR negativo). Si calculamos elIC 95% de la RRR, éste varía entre -38% (es decir, un paciente que harecibido el tratamiento experimentaltiene un riesgo un 38% mayor demorir que el grupo control) y +59%(aquellos pacientes que hayan recibi-do el tratamiento experimental pue-den tener un riesgo de morir un 59%menor que el riesgo que tienen lospacientes en el grupo control).

Si en vez de incluir 100 pacientesincluimos 1000 pacientes en cadagrupo y observamos las mismastasas de eventos que antes, es decir,200 muertes en el grupo control y150 en el grupo experimental, la RRRes también del 25%. Se podría pen-sar ahora que el valor real está máscerca del 25%: de hecho si calcula-mos los valores del IC del 95% loslímites son ambos positivos, de un9% a un 41%. Lo que se demuestracon este ejemplo es que cuanto más

grande sea el tamaño muestral delensayo, el intervalo de confianza serámás pequeño y el valor de la RRR (ocualquier otra forma de expresar losresultados) se aproximará más alvalor verdadero.

No todos los ensayos utilizan varia-bles dicotómicas. Pero igualmente elintervalo de confianza permite una inter-pretación objetiva de los resultados.

Por ejemplo, un tratamiento parapacientes con enfermedad pulmonarobstructiva crónica puede utilizar elincremento en la capacidad de reali-zar un ejercicio como variable (porejemplo, cuántos metros puedeandar el paciente en una cinta sin findurante 6 minutos). En un estudio(Guyatt y col., 1992), en el grupoexperimental los pacientes incremen-taron en 10 metros (de 406 a 416 m)la distancia recorrida en 6 minutos yen el grupo control en 20 metros (de409 a 429 m). El punto de estimaciónde mejora fue negativo, de -10metros (o una diferencia de 10metros para el grupo control). Si nosfijamos en su IC 95%, vemos que ellímite inferior es de -26 m y el límitesuperior de +5 m. Por lo tanto, en lamejor de las situaciones, incrementaren 5 metros la capacidad de andarrespecto a los 400 metros al inicio delensayo no representa un beneficioclínico de interés para el paciente, taly como está planteado el estudio.

56

C/ ¿Pueden ayudarnos estos resultados?

9. ¿Pueden aplicarse estos resultados en tu medio o población local?¿Crees que los pacientes incluidos en el ensayo son suficientemente parecidos al paciente concreto sobre el que has de decidir?

10. ¿Se tuvieron en cuenta todos los resultados de importancia clínica?¿En caso negativo, en que afecta eso a la decisión a tomar?

11. ¿Los beneficios a obtener justifican los riesgos y los costes?Es improbable que pueda deducirse del ensayo, pero ¿qué piensas tú al respecto?

Tabla 6

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 56

4.2.- Lectura crítica de estudios deevaluación de efectos adversos

La lectura crítica de artículos relacionadoscon efectos adversos a medicamentos puedeorientarse, básicamente, a dos tipos de publi-caciones:

1) Comunicaciones de efectos adversos enpacientes individuales, habitualmentecasos clínicos aislados o series reducidasde casos clínicos que, por lo general, infor-man de un posible efecto adverso raro,nuevo, o de significativa relevancia clínica.La gran mayoría de las revistas biomédi-cas de prestigio exigen de los autores laaplicación de un algoritmo de imputabili-dad. Estos algoritmos, como el de Naranjo(Naranjo y col. 1985), el de Karch yLasagna (Karch y col. 1975), etc., permi-ten asociar a cada potencial relación cau-sal una probabilidad basada en un análisissecuencial y estructurado de la informa-ción disponible. En cualquier caso, obvia-mente, la aplicabilidad de la informaciónde este tipo de comunicaciones a escena-rios y pacientes concretos es escasa.

2) Estudios diseñados ex profeso para eva-luar;

(a) la incidencia en una poblacióndefinida de un efecto adverso ya cono-cido en relación al empleo de uno ovarios fármacos similares, o bien; (b) la relación causal en una pobla-ción definida entre un medicamento ogrupo homogéneo de medicamentos yun efecto adverso determinado.

En el caso (2a) la relación causal entremedicamento (exposición) y efecto adversosuele ser conocida, habiendo sido estableci-da previamente, pero el estudio intenta esta-blecer con mayor precisión la incidencia delefecto adverso en la población estudiada, asícomo la influencia que sobre esta incidenciapudieran tener diversos factores y covaria-bles.

En las publicaciones a las que se refiereel apartado (2b), en ocasiones no hay unarelación causa-efecto conocida a priori, por loque se diseñan estudios orientados a diluci-dar la existencia de una relación causal quepreviamente no ha sido establecida de formaadecuada.

Todos los tipos de estudios comentadoscomparten un elemento común: la búsqueday el análisis de imputabilidad relacionada conefectos adversos.

Puede esquematizarse un proceso lógicode lectura crítica de estos estudios delsiguiente modo:

59

11.- ¿Los beneficios a obtener justi-fican los riesgos y los costes? – Si losresultados del artículo son extrapolablesa un paciente concreto, y si éstos sonimportantes, entonces la siguiente cues-tión es si los beneficios de tratar a esepaciente merecen la pena.

Esta idea se ilustra con el conceptodenominado “número necesario a tra-tar” (NNT) (ya mencionado anteriormen-te). El impacto de un tratamiento no estárelacionado solo con la RRR, tambiéndepende del riesgo de base de esepaciente.

Una reducción en el riesgo demorir del 25% puede sonar impresio-nante, pero su impacto en el pacien-te y en la práctica puede que seamínimo. Por ejemplo, consideremosun varón de 40 años que ha sufridoun infarto de miocardio (IAM) leve,presenta capacidad de ejercicio nor-mal y sin signos de arritmia ventricu-lar. Está en tratamiento con 125 mgdiarios de aspirina. El hombre estáintentando dejar de fumar, empieza ahacer ejercicio y a perder peso. Suriesgo de muerte en el primer añotras el IAM es de un 1%. Los beta-antagonistas reducen 1/4 este riesgo(a un 0,75%), esto es: una reduccióndel riesgo absoluto de 0,25% (1 -0,75 = 0,25) ó 0,0025. El número depacientes que se necesita tratar paraevitar un evento (una muerte) es de400 (NNT = 1 / 0,0025 = 400). Si en

lugar de ser un varón de 40 años esun anciano, con una capacidad derealizar ejercicio limitada y extrasísto-les ventriculares frecuentes, que con-tinúa fumando tras el infarto, el riesgode morir el primer año tras el IAMpuede ser de un 10%. En este caso,una reducción del riesgo de muertede 1/4 (hasta un 7,5%) genera unareducción del riesgo absoluto de2,5% ó 0,025 y tendríamos que tratara 40 pacientes para evitar una muer-te (NNT = 1 / 0,025 = 40).

Así pues, antes de iniciar un trata-miento hay que considerar el riesgoinherente del paciente ante un eventodeterminado si no se administra el trata-miento. Cuanto mayor sea la probabili-dad de que un paciente experimente unevento adverso si no se trata, más sebeneficiará del tratamiento, y menornúmero de pacientes tendremos quetratar para evitar un evento.

Por otro lado, si el estudio aportavalores de las reacciones adversas rela-cionadas con la administración de undeterminado fármaco, podemos adaptarel NNT para calcular cuántos pacienteshay que tratar para que aparezca unevento adverso, obtendremos de estemodo el denominado “número necesa-rio para perjudicar” (NNP o en inglésNNH, number needed to harm). De estamanera se pueden evaluar no sólo losbeneficios sino también los riesgos deiniciar un tratamiento determinado.

58

Artículo sobre reacciones adversas

Escenario concreto

➛ VALIDEZ EXTERNA

DISEÑO

VALIDEZINTERNA

FUERZA ASOCIACION

APLICABILIDAD

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 58

Por ejemplo, existe evidencia quesugiere un incremento del riesgo de homi-cidio de 2,7 veces más en individuos queguardan un arma en casa. Sin embargo,para valorar realmente este resultado esimportante conocer si el grupo experimen-tal tenía una oportunidad similar al grupocontrol de poseer un arma, de otra mane-ra el riesgo real variaría del obtenido en elestudio (podría aumentar si los controlestenían mayor oportunidad de poseer unarma y disminuir si ésta era menor)(Kellermann y col., 1993).

Los principales diseños de estudios rela-cionados con la imputabilidad de efectosadversos son los ensayos clínicos aleatoriza-dos, los estudios de cohortes y los estudiosde casos y controles (tabla 7).

Ensayos clínicos aleatorizados. Pese ano ser frecuente el empleo de un ECA paraevaluar posibles efectos adversos, las carac-terísticas de su diseño pueden resultar ade-cuadas para determinar relaciones de cau-salidad entre un tratamiento y un efectoadverso.

En un interesante ejemplo de este tipode estudios, Silverstein y col. publicaron elestudio CLASS (Silverstein y col., 2000),en el que el laboratorio fabricante de cele-coxib fundamentó el lanzamiento de esteantiinflamatorio (AINE) selectivo de lacicloxigenasa-2 (COX-2) en EEUU yEuropa. Se trataba de un estudio aleatori-zado y doble-ciego, diseñado para compa-rar los efectos adversos gastroduodenales

de celecoxib con otros AINE en el que seincluyeron 8.059 pacientes con osteoartri-tis o artritis reumatoide.

Lo que en cualquier caso debemos tenerpresente es que, a la hora de valorar unarelación causal entre un tratamiento farmaco-lógico y una RAM, seguramente nos vamos aencontrar con una buena cantidad de infor-mación útil derivada de ECA de eficacia. Elloquiere decir que serán ECA que tendráncomo variable principal una variable de efica-cia, que condicionará obviamente el diseño,el tamaño de la muestra y las característicasdel ensayo. Pero adicionalmente se analiza-rán en dichos ECA variables secundarias,entre ellas, casi siempre, efectos adversos alos tratamientos estudiados. Esto implica unanecesaria precaución a la hora de extrapolaresta información sobre toxicidad, dado quelas variables secundarias no disfrutan delpoder estadístico de las primarias, y su apli-cabilidad directa es siempre dudosa.

Metaanálisis. Si los ensayos clínicosespecíficos sobre RAM no son frecuentes,menos lo son los metaanálisis sobre los mis-mos. Además, casi la mitad de los estudiosde investigación incluidos en metaanálisissuelen ser estudios observacionales (Egger ycol. 1998). En éstos últimos, el estableci-miento de relaciones causales sufre unmayor riesgo de sesgos por factores de con-fusión.

Podemos encontrar metaanálisis cuyavariable principal es directamente una ovarias RAM; es el caso del publicado por

61

La lectura crítica de toda publicaciónsobre efectos adversos, debe iniciarse,lógicamente, por la valoración de: a) larelación causal que aborda (en términosde exposición y resultados); b) el ade-cuado diseño del estudio y c) la pobla-ción estudiada. Así pues, lo que pode-mos denominar “descripción de la evi-dencia” debe incluir en esta primeraetapa:

• Descripción/definición de la exposición (tratamiento)

• Descripción/definición del efectoadverso (outcome, resultado)

• Diseño del estudio • Población a estudio

En los estudios de casos y contro-les el establecimiento de la exposi-ción es clave. En estos estudios sedeben utilizar estrategias como elcegamiento de los entrevistadores y losindividuos a incluir como método detrabajo para minimizar los posibleserrores que se puedan cometer (porejemplo, en el grupo experimental lospacientes pueden estar más motivadosa la hora de entrevistarlos) y ambosgrupos deben tener una oportunidadsimilar de ser expuestos al fármaco ointervención a estudio. Sin embargo,en los ECA y en los estudios de cohor-tes el establecimiento de la variableva a ser la clave.

60

Diseño

Ensayo clínicoaleatorizado

Cohortes

Casos y controles

Punto de partida

Exposición

Exposición

Evento adverso

Evaluación

Evento adverso

Evento adverso

Exposición

Fortalezas

Validez interna

Viabilidad cuando la aleatorización a la exposición no es posible

Evita retrasos temporales, puederequerir tamaños muestrales pequeños

Debilidades

Viabilidad, difícilmente generalizable

Susceptible a amenazas sobre la validez interna

Susceptible a amenazas sobre la validez interna

Tabla 7

Principales diseños de estudio para la evaluación de reacciones adversas a medicamentos

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 60

siones menos potentes que los ECA biendiseñados.

Estudios de casos y controles. Cuando lareacción adversa a estudio es muy rara onecesita mucho tiempo para que se desarro-lle, los estudios de cohortes tampoco son fac-tibles. Un diseño alternativo para identificarcasos es usar pacientes que ya hayan desa-rrollado la reacción adversa (RA) que nosinteresa (por ejemplo, enfermedad, hospitali-zación, muerte, efecto adverso). Para ello,hay que seleccionar controles, que son per-sonas que no han desarrollado esa RA enconcreto, pero que son similares a los casosen cuanto a factores como la edad, el sexo olas condiciones médicas asociadas. De estamanera se puede evaluar de forma retros-pectiva la frecuencia relativa de exposición aagentes potencialmente causantes de RAMentre los casos y controles. A estos diseñosobservacionales se les denomina estudios decasos y controles. Al igual que en los estu-dios de cohortes, se debe asegurar que laspoblaciones incluidas en los grupos seansimilares en cuanto a factores de riesgo (encaso contrario, habría que realizar un análisisajustado).

Así, por ejemplo, la primera evidenciarelevante sobre una relación causal entrelos ISRS y la HDA proviene precisamentede un estudio de casos y controles (deAbajo y col., 1999). Los autores identifica-ron 1.651 casos de incidencia de hemo-rragia gastrointestinal alta o perforación deúlcera a partir de una base de datos clíni-ca de alta calidad, y seleccionaron aleato-

riamente 10.000 controles. Tras ajustaradecuadamente los potenciales factoresde confusión, el riesgo de HDA para losusuarios de antidepresivos ISRS fue tresveces superior al de los controles. Por elcontrario, los pacientes que recibían anti-depresivos tricíclicos (no selectivos) noincrementaban su riesgo de HDA.

La descripción de la evidencia planteadanos obliga a revisar un aspecto fundamentalen este tipo de estudios, la comparabilidadde los grupos estudiados, siempre en funcióndel diseño de que se trate:

a) comparabilidad en relación al efectoadverso entre los dos grupos

b) comparabilidad de exposiciones (trata-mientos) y de las variables de medida.

La validez interna del estudio se debeanalizar desde dos puntos de vista; en pri-mer lugar la ausencia de sesgos significati-vos, especialmente los sesgos de observa-ción y la presencia de factores de confusión.En segundo lugar, y en este caso de formaespecífica, debe analizarse la validez internarelacionada con aspectos positivos de lacausalidad:

• relación temporal [tratamiento (exposición) – efectosadversos (resultado)]

• gradiente dosis-dependiente• consistencia de la relación• especificidadLa relación temporal en la relación causa-

efecto ya fue planteada por Bradford Hill ensus conocidos criterios de causalidad enmedicina, y mantiene obviamente un rol fun-damental.

63

Tramer y col. que revisaron la hipóte-sis de que propofol incrementa signi-ficativamente el riesgo de bradicar-dia, asístole y muerte relacionadacon episodios de bradicardia (Tramery col. 1997). Por el contrario, una clá-sica revisión sistemática del grupoCochrane sobre los efectos de dife-rentes insulinas (humana vs. animal)utiliza dos variables: eficacia (controlglucémico) y perfil de efectos adver-sos (hipoglucemias) (Richter y col.2002); en esta revisión sólo se incluí-an ECA.

Estudios de cohortes. Cuando no esfactible o ético asignar aleatoriamenteun paciente a una exposición que puedeser causa de una RAM, se debenencontrar alternativas a los ECA. Unaes la representada por los estudios decohortes. Estos se pueden llevar a cabocuando los resultados adversos que sebuscan son infrecuentes. En tal caso, unECA precisaría de un número depacientes enorme, difícilmente alcanza-ble. Sin embargo, es mucho más fácildiseñar una cohorte en la que la infor-mación provenga, por ejemplo, de gran-des bases de datos.

Este es, por ejemplo, el caso delestudio poblacional de cohortes lle-vado a cabo por van Walraven y col.(van Walraven y col., 2001), que pre-tendía evaluar si los inhibidoresselectivos de la recaptación de sero-tonina (ISRS) constituían un signifi-

cativo factor de riesgo de hemorragiadigestiva alta (HDA) en pacientesancianos. En este estudio se incluye-ron 317.824 sujetos ancianos en tratamiento con antidepresivos quefueron observados durante mas de130.000 personas-año. Los autoresencontraron una asociación significa-tiva entre la inhibición de la recapta-ción de serotonina y la HDA una vezcontrolados los potenciales factoresde confusión.

Los individuos en un estudio decohortes no son seleccionados al azarpara ser expuestos a un agente sospe-choso de ser causante de una RAM.Ello, en principio, asegura la ausenciade factores pronósticos diferenciadoresentre ambos. Sin embargo, cuando exis-ten variables que pueden confundir larelación de causalidad entre una exposi-ción y un efecto, a veces es necesariodemostrar que ambos grupos, losexpuestos y los no expuestos, son simi-lares. Cuando las poblaciones se dife-rencian en estos factores pronósticos,se deben usar técnicas estadísticas quecorrijan las posibles diferencias. Puedeser que aun así, exista un desequilibrioentre los factores pronósticos de ambosgrupos (bien porque el investigador losdesconozca o bien porque no se hayanmedido) que sea el verdadero respon-sable de las diferencias en los resulta-dos. En cualquier caso, los estudios decohortes proporcionan siempre conclu-

62

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 62

mismas conclusiones con estudios de cohor-tes o de casos y controles necesitaremos quelos incrementos de los riesgos sean mayores.

Como ya se explicó anteriormente, esmuy importante la estimación no sólo de latendencia central del efecto observado (eneste caso, el grado de asociación causal tra-tamiento/efecto adverso) sino la precisiónde la estimación de dicha asociación,usando el intervalo de confianza. Cuando enun estudio se ha establecido la relaciónentre una exposición y un efecto adverso, ellímite inferior de la estimación del RR pro-porciona la mínima estimación que nos pro-porciona suficiente poder para relacionarefecto y exposición. Por otro lado, en unestudio donde no se demuestra dicha rela-ción (un estudio negativo), el límite superiordel IC 95% del RR indica la probabilidad deque un efecto adverso pueda todavía apare-cer, a pesar de que no se haya podidodemostrar una relación estadísticamentesignificativa.

Una vez analizada la validez interna delestudio (¿son válidos los resultados?), proce-de explorar la validez externa, esto es, lapotencial generalización de los resultados.Para ello, habrá que determinar si los resul-tados son realmente aplicables a la poblaciónelegible (esto es, que cumple los criterios deinclusión del estudio), la población origen, uotras poblaciones de pacientes. ¿Tus pacien-tes son similares a los descritos en el estudiocon respecto a la morbilidad, edad, raza uotros factores potencialmente importantes?¿Existen importantes diferencias clínicas enlos tratamientos o exposiciones entre ambosgrupos? Por ejemplo, el riesgo de trombofle-bitis asociado a anticonceptivos orales des-crito en los años 70 puede que no se puedaaplicar a los 90 como consecuencia de la uti-lización en la actualidad de dosis más bajasde estrógeno.

¿Cuál es la magnitud del riesgo? – Ni elRR ni el OR nos dicen cuál es la frecuenciade aparición del problema, tan solo nos infor-

65

Por ejemplo, en los estudios enlos que el uso de fluoxetina provoca-ba un incremento de ideación de sui-cidio (Teicher y col., 1990) se podríaplantear si este efecto se producíatras la administración de fluoxetina osi a los pacientes se les administrabaeste fármaco como consecuencia deque ya mostraban signos de deterio-ro clínico. Un metaanálisis de ECAen el tratamiento de la depresión noconfirmó esta asociación inicialmenteaparente (Beasley y col., 1991).

Un aspecto muy interesante de laimputabilidad de efectos adversos, es elrelacionado con el adecuado seguimien-to del efecto adverso a estudio (méto-dos de detección y, en especial, dura-ción del seguimiento).

Así, el ya citado estudio CLASS(Silverstein y col., 2000) es un buenejemplo de falta de rigor a la hora deefectuar un adecuado seguimientode la aparición de efectos adversos.En este particular ensayo, que teníauna duración prevista de al menos 12meses, pese a que se disponía de losresultados de 12 meses (que no mos-traban diferencias entre celocoxib ylos otros AINE), se publicaron losresultados a 6 meses (que sí mostra-ban diferencias favorables a celeco-xib).

Por el contrario, debe tenerse enconsideración que cuanto más largo sea

el periodo de seguimiento, mayor es laposibilidad de pérdida de pacientes ypor tanto, de que los resultados no ten-gan suficiente validez.

En farmacovigilancia, la fuerza deesta asociación es el determinante dela imputabilidad. El riesgo relativo es elriesgo (o incidencia) del efecto adversoen el grupo exposición dividido por elriesgo de efectos adversos en el grupono expuesto. Los valores mayores de 1significan un incremento en el riesgoasociado con la exposición, mientrasvalores menores que 1 representan unareducción del riesgo. No se puede cal-cular el RR si es el investigador quienselecciona el número de casos y contro-les (ya que de esta forma se puedemodificar, en función del número de indi-viduos, la proporción de individuos quepor ejemplo, sufran un efecto adverso).En los estudios de casos y controles uti-lizaremos la tasa o razón de probabili-dades (odds ratio, OR), que es la proba-bilidad de que un paciente caso hayasido expuesto divido por la probabilidadde que lo haya sido un paciente control.Usando una tabla 2x2 se pueden calcu-lar los OR (tabla 8).

Los OR se aproximan al valor del RRcuando se trata de una RA poco fre-cuente en la población de la que seextrajo la muestra de casos (que es larazón por la que se usa un diseño deestudio de casos y controles). En losECA, pequeños incrementos en el ries-go representan un verdadero efecto per-judicial. Sin embargo, para sacar las

64

Estimación del riesgo relativo y del odds ratio en pacientes expuestos y no expuestos

Paciente Evento adverso (caso) No evento adverso (control)

Expuesto A BNo expuesto C D

Tabla 8

Riesgo relativo =A/(A+B)

C/(C+D)Odds ratio=

A/C

B/D

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 64

67

man de que el efecto observado ocurremás o menos a menudo en el grupoexpuesto comparado con el no expues-to. De la misma manera que utilizamosel NNT para los estudios de eficacia, sepueden utilizar los datos de un ECA oestudio de cohortes para determinar quénúmero de sujetos debe ser expuesto aun potencial agente causal para que seproduzca un efecto adverso (numberneeded to harm, NNH).

Así, por ejemplo, el metaanálisisde Tramer y col (Tramer y col. 1997),utilizando sólo ECA, concluyó quepropofol incrementa significativamen-te el riesgo de bradicardia en compa-ración con otros anestésicos, con unNNH de 11,3 (IC 95%: 7,7 – 21,0).Esto es; de cada 12 pacientes trata-dos con propofol, uno sufrirá una bra-dicardia clínicamente significativa, encomparación con el empleo de estosanestésicos. El riesgo de muerte rela-cionada con bradicardia durante laanestesia con propofol se estimó en1,4 por 10.000.

Finalmente, tras evaluar la eviden-cia de que una exposición es capaz deproducir un daño, obviamente no esnada fácil determinar qué accionestomar en cada paciente concreto.Existen al menos tres aspectos a teneren cuenta:

• ¿cómo de potente es el estudio olos estudios que demuestran per-juicio?;

• ¿cuál es la magnitud del riesgo delpaciente si la exposición al agentecontinua?;

• ¿cuáles son las consecuencias dereducir o eliminar la exposición aagentes que potencialmente pue-den causar una reacción adversa?

La decisión es simple si tanto la pro-babilidad como la magnitud de producirdaño son grandes (por ejemplo si decada 20 pacientes que se trata semuere uno, se debe interrumpir el trata-miento). Pero si la evidencia es débil, laexistencia de una alternativa puede ayu-dar a tomar la decisión.

4.3.- Lectura crítica de revisionesLa investigación de síntesis constitu-

ye una interesante innovación, conside-rada en la actualidad una de las máspotentes herramientas creadoras de evi-dencia pero que, paralelamente, es difí-cil de interpretar de forma adecuada porsu complejidad.

A.- ¿Los resultados de la revisión sonválidos? (tabla 9)

Preguntas de eliminación

1.- ¿Se hizo la revisión sobre un temaclaramente definido? – La mayoría delas preguntas clínicas pueden ser for-muladas en términos de relación simpleentre el paciente, alguna exposición (aun tratamiento, a una prueba diagnósti-ca o a un fármaco susceptible de produ-

66

A/ ¿Los resultados de la revisión son válidos?

Preguntas de eliminación

1. ¿Se hizo la revisión sobre un tema claramente definido?

PISTA: Un tema debe ser definido en términos de:- la población de estudio- la intervención realizada- los resultados (“outcomes”) considerados

2. ¿Buscaron los autores el tipo de artículos adecuado?

PISTA: El mejor “tipo de estudio” es el que:- se dirige a la pregunta objeto de la revisión- tiene un diseño apropiado para la pregunta

Preguntas detalladas

3. ¿Crees que estaban incluidos los estudios importantes y relevantes?

PISTA: Busca- ¿qué bases de datos bibliográficas se han usado? - ¿seguimiento de las referencias?- ¿contacto personal con expertos?- ¿búsqueda de estudios no publicados?- ¿búsqueda de estudios en idiomas distintos del inglés?

4. ¿Crees que los autores de la revisión han hecho suficiente esfuerzo para valorar la calidad de los estudios incluidos?

PISTA: Los autores necesitan considerar el rigor de los estudios que han identificado.La falta de rigor puede afectar al resultado de los estudios (“No es oro todo loque reluce” El Mercader de Venecia. Acto II)

5. Si los resultados de los diferentes estudios han sido mezclados para obtenerun resultado “combinado”, ¿era razonable hacer eso?

PISTA: Considera si- los resultados de los estudios eran similares entre sí - los resultados de todos los estudios incluidos están claramente presentados - están discutidos los motivos de cualquier variación de los resultados

Tabla 9

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 66

estudios pequeños con ligeros resultadospositivos son más susceptibles que lo ten-gan). Por lo tanto, es importante conocer elestado en el que se encuentran las publica-ciones que se van a incluir en el estudio(publicados, no publicados, etc.).

Se sabe que sólo un tercio de los metaa-nálisis contienen datos no publicados (Cook ycol., 1993).

En un estudió se concluyó que no exis-tían diferencias sustanciales en la calidadentre estudios publicados y no publicados(Easterbrook y col., 1991), otro concluyóque el efecto de la intervención fue un33% mayor en los estudios publicadoscuando se comparaba con los resultadosobtenidos en tesis doctorales (Smith,1980).

El papel de la “literatura gris” (aquella quees difícil localizar o conseguir ya que estáconstituida por estudios que no son publica-dos ni distribuidos por los canales habitualesde la transmisión científica, como actas, infor-mes técnicos, tesis, etc.) en los metaanálisistambién parece afectar a los resultados.

En un estudio en el que se revisaron39 metaanálisis que contenían 467ECAs, 102 pertenecían a la denominada“literatura gris” (McAuley y col., 1999).Los metaanálisis que estaban limitadossolo a estudios publicados sobreestima-ban el efecto del tratamiento en un 12%,comparado con aquellos que conteníantanto estudios no publicados como litera-tura gris.

Por otra parte, aproximadamente un ter-cio de los metaanálisis publicados aplicanalgún criterio de exclusión relacionado con ellenguaje en el que están publicados estosestudios (Moher y col., 1998). La razón por laque se aplica dicha restricción no está claraya que no existe evidencia científica que jus-tifique, sobre la base de diferencias en la cali-dad de los estudios, esta exclusión.

En un estudio en el que se analizaron211 ECAs incluidos en 18 metaanálisis, seconcluyó que los metaanálisis restringidosa estudios publicados en un solo idiomasobreestimaron el efecto del tratamientoen solo un 2% comparado con los que noaplicaron tal limitación. Sin embargo, losresultados de los metaanálisis restrictivoseran más precisos (Moher y col., 1998).

4.- ¿Crees que los autores de la revisiónhan hecho suficiente esfuerzo para valorar lacalidad de los estudios incluidos? – Incluso siuna revisión incluye sólo ECA, es importanteconocer cuál es la calidad de éstos.Desgraciadamente, la revisión por expertos(“peer review”) no garantiza la validez de lasinvestigaciones publicadas. Para ello se dis-pone de escalas numéricas como la deJadad (Jadad y col., 1996), ampliamenteempleadas en el desarrollo de revisiones sis-temáticas, y que no serán tratadas aquí.

Por la misma razón que las guías paraevaluar ECA empiezan preguntando si losresultados son válidos, es esencial conside-rar la validez de los estudios incluidos en unarevisión. Las diferencias en los métodos de

69

cir una reacción adversa) y una o másvariables de interés. Si ni la preguntaprincipal de la revisión, ni el título, ni enel resumen están claros, puede ser unabuena idea no continuar con la revisión.Muchas revisiones (por ejemplo capítu-los de libros) contienen informaciónsobre la etiología, diagnóstico, pronósti-co, tratamiento y prevención. Sin embar-go, la información que ofrecen relativa alas conclusiones es muy limitada.Cuando esto ocurre, es preciso acudir alas referencias bibliográficas originales yevaluar de forma directa la validez desus conclusiones.

2.- ¿Buscaron los autores el tipo deartículo adecuado? – Para determinar sise ha realizado una búsqueda adecua-da, deben conocerse los criterios preci-sos que los autores han utilizado pararealizar la búsqueda. Estos criteriosdeben especificar el tipo de paciente, laintervención realizada sobre los mismosy las variables de eficacia a medir.También se debe especificar la metodo-logía utilizada para seleccionar los estu-dios y si ésta coincide con las preguntasde eliminación utilizadas para la evalua-ción de los ensayos clínicos. La existen-cia de diferencias en los pacientes,intervenciones o variables de eficaciapueden conducir a distintos resultadosentre revisiones que en principio res-ponden a la misma pregunta. Si losautores incluyen en la revisión los crite-rios de inclusión, es menos probableque existan “sesgos de selección”.

Preguntas de detalle 3.- ¿Crees que estaban incluidos los

estudios importantes y pertinentes? –Es importante que los autores realicenuna búsqueda minuciosa de estudiosque cumplan sus criterios de inclusión.Se deben utilizar bases de datos biblio-gráficas, como MEDLINE o EMBASE, ycontactar con expertos en el área deestudio. A menos que los autores nosinformen cómo se localizaron los estu-dios relevantes, es difícil saber si faltaalguno. Existen dos razones importan-tes por las que se debe contactar conexpertos en ciertas áreas. La primera esque de esta manera se pueden identifi-car estudios que no se hayan incluido(por ejemplo, estudios que se encuen-tran en imprenta, o que todavía no hansido indexados en las bases de datos).La segunda es que de esta forma sepueden localizar estudios que no se hanpublicado ni van a serlo por distintosmotivos (la probabilidad de publicarestudios con resultados positivos essiempre mayor que si los resultados sonnegativos).

Aunque existe cierta polémica sobrela inclusión de estudios no publicados,su omisión incrementa la posibilidad deintroducir un “sesgo de publicación” conel consiguiente riesgo de sobreestimarya sea la eficacia o la aparición de efec-tos adversos (dependiendo de qué seesté estudiando). Existen técnicas esta-dísticas que permiten explorar la posibi-lidad de que exista “sesgo de publica-ción” (si las revisiones están basadas en

68

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 68

B.- ¿Cuáles son los resultados? (tabla 10)

6.- ¿Cuál es el resultado global de larevisión? – En las revisiones, se reúnendatos de estudios individuales. Estos datosdeben ser resumidos, utilizando métodoscuantitativos. Si comparamos únicamente elnúmero de estudios positivos con el númerode estudios negativos la conclusión queobtendríamos sería errónea, ya que de estamanera se les asigna el mismo peso tanto alos estudios grandes (elevado tamaño mues-tral) como a los pequeños. Por ejemplo, unefecto clínicamente importante que no esestadísticamente significativo puede serinterpretado como positivo a la luz de suimportancia clínica y negativo como conse-cuencia de su nivel de significación. Losmetaanálisis ponderan los estudios deacuerdo a su tamaño muestral: cuanto másgrande es el estudio más peso tiene. Por loque el resultado global representa unamedia ponderada de los resultados de estu-

dios individuales. Ocasionalmente, a losestudios se les puede ponderar dependiendode su calidad; de esta forma a los estudiosde peor calidad se les asigna un peso cero(estos estudios son excluidos). Hay que rea-lizar de nuevo el análisis primario y el análi-sis de sensibilidad para ver si al excluir losestudios de peor calidad, el resultado globalde la revisión se modifica.

En las revisiones de tratamiento, paramedir un resultado, se puede utilizar la razónde probabilidades (odds ratio) de que ocurraun efecto adverso en el grupo expuesto (porejemplo a un tratamiento o a un factor deriesgo) con relación a la probabilidad de queocurra en los no expuestos (tabla 11). Estaodds ratio, tiene propiedades estadísticasinteresantes cuando se combinan los resul-tados de distintos estudios. Sea cual sea elmétodo de análisis utilizado, se debe buscaruna forma de resumir los resultados demodo que se pueda transmitir la importanciaclínica del efecto clínico (como por ejemploel NNT).

71

los estudios pueden explicar importan-tes diferencias en los resultados.Existen estudios que demuestran que lainclusión de ECAs de baja calidad enrevisiones altera los resultados relacio-nados con la efectividad de las interven-ciones terapéuticas o profilácticas estu-diadas. Es preciso comprobar si losensayos se aleatorizaron; si dicha alea-torización se mantuvo oculta a lospacientes e investigadores; si lospacientes, cuidadores, investigadores ylas personar que evalúan los resultadoseran ciegos a la asignación de la inter-vención; y si la duración del seguimien-to fue adecuada.

Así, por ejemplo, en un estudio secomprobó que los ensayos en losque la ocultación de la secuencia dealeatorización (los investigadores nodeben conocer el grupo de tratamien-to al que los pacientes serán asigna-dos de forma aleatoria antes deentrar en el ensayo) no se especifica-ba adecuadamente, sobreestimabanel efecto de la intervención en un30% comparado con los ensayos enel que esta información estaba deta-llada de forma precisa (Schulz y col.,1995).

5.- Si los resultados de los diferentesestudios han sido mezclados para obte-ner un resultado “combinado”, ¿erarazonable hacer eso? – A pesar de quelos criterios de inclusión utilizados en las

revisiones son restrictivos, la mayoríade las revisiones sistemáticas incluyenestudios con importantes diferencias encuanto a los pacientes, intervención,variables de medida y métodos investi-gación. Se debe decidir si estos factoresson tan diferentes que no tiene sentidocombinar los resultados de los estudios.Un criterio para decidir si se puedencombinar cuantitativamente los resulta-dos es valorar si los estudios parecenmedir la misma magnitud subyacente deefecto. En caso afirmativo, se podríarealizar dicha combinación. En un meta-análisis, se puede comprobar hasta quépunto las diferencias entre los resulta-dos de estudios individuales son mayo-res que las esperadas si las diferenciasobservadas fueran debidas solo al azar.El análisis estadístico que se utiliza paraello se denomina “prueba de homoge-neidad”. Cuanta mayor significación seobtenga en esta prueba, menor probabi-lidad de que las diferencias observadasse deban solo al azar. Cuando se detec-ta heterogeneidad entre los estudios,tanto la media del efecto global como suIC hay que interpretarlos con precau-ción. Desgraciadamente, una prueba nosignificativa para la homogeneidad nodescarta que exista una importanteheterogeneicidad. Sin embargo, inclusocuando existen grandes diferencias enlos resultados de diferentes estudios, lamejor estimación del impacto de la inter-vención la proporciona un resumen delos resultados de los mejores estudiosdisponibles.

70

B/ ¿Cuáles son los resultados?

6. ¿Cuál es el resultado global de la revisión?

PISTA: Considera- si tienes claro los resultados últimos de la revisión - ¿cuáles son? (numéricamente, si es apropiado) - ¿cómo están expresados los resultados? (NNT, odds ratio, etc.)

7. ¿Cómo de precisos son los resultados?

PISTA: Busca los intervalos de confianza de los estimadores

Tabla 10

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 70

C.- ¿Son los resultados aplicables en tumedio? (tabla 12)

8.- ¿Se pueden aplicar los resultados entu medio? – Una de las ventajas de las revi-siones es que, como contienen muchos estu-dios, los resultados provienen de una grandiversidad de poblaciones distintas. Si losresultados son constantes a lo largo de losestudios, éstos se pueden aplicar a una granvariedad de pacientes. A pesar de ello, hayque tener siempre algunas consideraciones ala hora de aplicar los resultados. Puede ocu-rrir que la edad de tu paciente sea mayor quela de cualquiera de los pacientes incluidos enlos estudios individuales de que consta larevisión. También puede ocurrir que la revi-sión se base en estudios en los que los fár-macos utilizados en el grupo experimentalpertenezcan al mismo grupo terapéutico (porejemplo, AINE) pero que no sean exacta-mente los mismos (por ejemplo, cada estudiopuede utilizar un AINE distinto: ibuprofeno,naproxeno, diclofenaco, etc.), de esta forma

cuando los resultados se combinan no esposible conocer si alguno de los fármacosposee un efecto mayor comparado con elresto de fármacos de un mismo grupo. Otroaspecto a tener en cuenta es la aplicación delos resultados cuando éstos se basan en elanálisis de subgrupos. De manera que lasconclusiones que se sacan de dicho análisisson adecuadas cuando: a) existen importan-tes diferencias en el efecto del tratamiento, b)la hipótesis que conlleva el análisis de lossubgrupos se ha realizado antes del inicio delestudio, c) existe uniformidad a lo largo de losdistintos estudios de que consta la revisión yd) existe evidencia indirecta que soportadicha conclusión. Si no se cumplen los crite-rios anteriores se debe considerar lo resulta-dos globales más que los efectos observadosen los subgrupos.

9.- ¿Se han considerado todos los resul-tados importantes para tomar la decisión? –Aunque es una buena idea buscar revisionesque se centren en un tema concreto, ya que

73

A veces la medida del resultado quese utiliza en distintos estudios es similar,pero no exactamente la misma. Porejemplo, algunos ensayos clínicos pue-den medir el estado funcional de unpaciente con distintas escalas, pero silos pacientes y la intervención realizadason razonablemente parecidos puedemerecer la pena realizar la estimaciónde la media de dicho efecto. Una mane-ra de solucionarlo es resumir los resul-tados de cada estudio en la variabledenominada “tamaño del efecto” (effectsize). El tamaño del efecto es la diferen-cia en los resultados entre la interven-ción y el grupo control dividido por ladesviación estándar. El tamaño del efec-

to resume los resultados de cada estu-dio en términos de desviación estándarde la diferencia entre la intervención y elgrupo control. A continuación, se calcu-la la media ponderada del tamaño delefecto de estudios que miden las varia-bles de distintas maneras.

7.- ¿Cómo de precisos son los resul-tados? – De la misma manera que esposible estimar una media del efectoglobal de distintos estudios, es posibleestimar un intervalo de confianza (IC, unintervalo de valores con una probabili-dad especificada de incluir el verdaderoefecto, típicamente 95%).

72

Riesgo relativo, reducción del riesgo relativo, reducción del riesgo absoluto, odds ratio y NNT

Evento

Tratamiento o exposición Positivo Negativo

Positivo a bNegativo c d

Tabla 11

Riesgo relativo =a/(a+b)

c/(c+d)

RRA= -a

a+b

c

c+dNNT=

1

RRARRR=1-RR

Odds ratio=a/c

b/d

Cuando el efecto es “no deseable”: un riesgo relativo (RR) u odds ratio (OR)<1 representa un tratamiento (o exposición) beneficioso; una reducción delriesgo absoluto (RRA) <0 representa un beneficio y un 100% de efectividadsería equivalente al riesgo observado en el grupo control.

C/ ¿Son los resultados aplicables en tu medio?

8. ¿Se pueden aplicar los resultados en tu medio?

PISTA: Considera si - los pacientes cubiertos por la revisión pueden ser suficientemente diferentes de

los de tú Áreatu medio parece ser muy diferente al del estudio

9. ¿Se han considerado todos los resultados importantes para tomar la decisión?

10. ¿Los beneficios merecen la pena frente a los perjuicios y costes?

Tabla 12

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 72

Ascione F.J. Principles of scientific literature evaluation: critiquingclinical drug trials.American Pharmaceutical Association, Washington, D.C.,2001.

Beasley CM, Dornseif BE, Bosomworth JC, Sayler ME,Rampey AH Jr, Heiligenstein JH, Thompson VL, Murphy DJ,Masica DN. Fluoxetine and suicide: a meta-analysis of controlledtrials of treatment for depression.BMJ 1991; 303: 685-692.

Cook DJ, Guyatt GH, Ryan G, Clifton J, Buckingham L,Willan A, McIlroy W, Oxman AD. Should unpublished data be included in meta-analyses?Current convictions and controversies.JAMA 1993; 269: 2749-2753

de Abajo FJ, García LA, Montero D. Association between selective serotonin reuptakeinhibitors and upper gastrointestinal bleeding:population based case-control study.BMJ 1999; 319: 1106-1109

Easterbrook PJ, Berlin JA, Gopalan R, Matthews DR.Publication bias in clinical research.Lancet 1991; 337: 867-872

Echt DS, Liebson PR, Mitchell LB, Peters RW, Obias-MannoD, Barker AH, Arensberg D, Baker A, Friedman L, GreeneHL et al. Mortality and morbidity in patients receivingencainide, flecainide, or placebo: the CardiacArrhythmia Suppression Trial.N Engl J Med 1991; 324: 781-788.

Egger M, Scheneider M, Davey G. Meta-analysis spurious precision? Meta-analysis ofobservational studies.BMJ 1998; 316: 140-144

Guyatt GH, Keller J, Singer J, Halcrow S, Newhouse M. A controlled trial of respiratory muscle training inpatients with chronic airflow limitation.Thorax. 1992; 47: 598-602

Guyatt GH, Sackett DL, Cook DJ. Users’ guides to the medical literature. II. How to use anarticle about therapy or prevention. A. Are the results ofthe study valid? Evidence-Based Medicine WorkingGroup. JAMA 1993; 270: 2598-2601.

Guyatt GH, Sackett DL, Cook DJ. Users’ guides to the medical literature. II. How to use anarticle about therapy or prevention. B. What were theresults and will they help me in caring for my patients?Evidence-Based Medicine Working Group.JAMA 1994; 271: 59-63.

Herbst AL, Ulfelder H, Poskanzer DC. Adenocarcinoma of the vagina: association of maternalstilbestrol therapy with tumor appearance in youngwomen.N Engl J Med. 1971; 284: 878-881

Holmes LB. Teratogen update: Bendectin.Teratology. 1983; 27: 277-281.

Cabello JB, Abraira V, Gómez J. El ensayo clínico para un solo paciente. Justificación,metodología y aportaciones bioéticas. Med Clín (Barc) 1997; 109: 592

Jadad AR, Moore RA, Carroll D, Jenkinson C, Reynolds DJ,Gavaghan DJ, McQuay HJ. Assessing the quality of reports of randomized clinicaltrial: is blinding necessary?Control Clin Trials 1996; 17: 1-12

Karch F, Lasagna L. Adverse drug reactions: a critical review. JAMA 1975; 234: 1236-41.

Kellermann AL, Rivara FP, Rushforth NB, Banton JG, ReayDT, Francisco JT, Locci AB, Prodzinski J, Hackman BB,Somes G. Gun ownership as a risk factor for homicide in thehome.N Engl J Med. 1993; 329: 1084-1091

Levine M, Walter S, Lee H, Haines T, Holbrook A, Moyer V.Users’ guides to the medical literature. IV. How to use anarticle about harm. Evidence-Based Medicine WorkingGroup.JAMA 1994; 271: 1615-1619.

McAuley L, Moher D, Tugwell P. The influence of grey literature on meta-analysis. MSc Thesis: University of Ottawa, 1999

Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, StroupDF. Improving the quality of reports of meta-analyses ofrandomized controlled trials: the QUOROM statement.Quality of reporting meta-analysis. Lancet 1999; 354: 1896-1900

Moher D, Pham B, Klassen TP y col. Does the language of publication of reports ofrandomized trials influence the estimates of interventioneffectiveness reported in meta-analyses? 6th Cochrane Colloquium; 1998

Moher D, Schulz KF, Altman DG. The CONSORT statement: revised recommendations forimproving the quality of reports of parallel-grouprandomised trials. Lancet 2001; 357: 1191-1194.

75

proporcionan resultados válidos, no sig-nifica que se deban ignorar variablesque no estén incluidas en la revisión.

10.- ¿Los beneficios merecen lapena frente a los perjuicios y costes? –Cuando se toma una decisión clínica, sehan de sopesar los beneficios con eldaño potencial y los costes asociados.

5.- ASPECTOS PRÁCTICOS DE LALECTURA CRÍTICA

Probablemente habremos fracasadoen nuestro intento de transmitir de formasencilla y clara cómo aplicar el procesode lectura crítica a ese enorme volumende información que a diario vemos publi-cada en las revistas biomédicas. Si hasconseguido llegar hasta aquí, magnífico.

Bastante es que hayas podido leerlo.Pero afortunadamente puedes utilizaratajos para estos menesteres. Esto escomo montar en bicicleta: se aprendemontando. Una buena manera puedeser contactando con CASPe (www.red-caspe.org) que, de forma periódica, rea-liza talleres de lectura crítica, utilizandotécnicas de trabajo en grupos reducidos.En estos talleres se realiza un ejerciciopráctico de lectura sobre un tipo deter-minado de estudio: ensayos clínicos,revisiones, estudios económicos, estu-dios de efectos adversos y estudios dediagnóstico. La mayoría de los panelesde preguntas para la evaluación críticade estudios recogida en el presentecapítulo se han extraído de la páginaweb oficial de CASPe, de donde se pue-den descargar para su utilización.

74

BIBLIOGRAFIA6

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 74

Mulrow C., Cook D. Systematic review: synthesis of best evidence forhealth care decision. American College of Physicians, Philadelphia,Pennsylvania, 1998.

Naranjo CA et al. A method for estimating the probability of adversedrug reactions.Clin Pharmacol Ther 1985; 38: 183-7.

Oxman AD, Cook DJ, Guyatt GH. Users’ guides to the medical literature. VI. How touse an overview. Evidence-Based MedicineWorking Group. JAMA 1994; 272: 1367-1371.

Pocock SJ. Clinical trials: A practical approach. New York: Wiley 1983: 1-7

Richter B, Neises G. Human’ insulin versus animal insulin in peoplewith diabetes mellitus (Cochrane Review). In: The Cochrane Library, Issue 4, 2002.

Schulz KF, Chalmers I, Hayes RJ, Altman DG.Empirical evidence of bias: dimensions ofmethodological quality associated with estimatesof treatment effects in controlled trials. JAMA 1995; 273: 408-412

Silverstein FE, Faich G, Goldstein JL, Simon LS,Pincus T y col. Gastrointestinal toxicity with celecoxib vsnonsteroidal anti-inflammatory drugs forosteoarthritis and reumathoid artritis – the CLASSstudy: a randomized controlled trial.JAMA 2000; 284: 1247-1255

Smiht ML. Publication bias and meta-analysis. Eval Educ 1980; 4: 22-24

Soverchia G, Perr PF. Two cases of malformation of a limb in infants ofmothers treated with an antiemetic in a very earlyphase of pregnancy. Pediatr Med Chir 1981; 3: 97-99

Teicher MH, Glod C, Cole JO. Emergence of intense suicidal preoccupationduring fluoxetine treatment. Am J Psychiatry 1990; 147: 207-210.

The Cardiac Arrhythmia Suppression Trial IIInvestigators. Effect of the antiarrhythmic agent moricizine onsurvival after myocardial infarction.N Engl J Med. 1992; 327: 227-233.

Tramer MR, Moore RA, McQuay HJ. Propofol and bradycardia: causation, frecuencyand severity. Br J Anaesthesia 1997; 78: 642-651

van Walraven C, Mamdani MM, Wells S, Williams JI.Inhibition of serotonin reuptake byantidepressants and upper gastrointestinalbleeding in elderly patients: retrospective cohortstudy. BMJ 2001; 323: 655

76

LIBRO 1 / 2 curso ok 21/11/05 11:56 Página 76