lunes, 16 de febrero de 2015

HIP, HIP, HURRA !!!

Érase una vez un ensayo clínico que quería estudiar si el fármaco Risedronato disminuía la incidencia de fractura de cadera.

Se diseñaron dos grupos de tratamiento. El grupo 1 incluía a mujeres de 70 a 79 años con algunos factores de riesgo (se pueden consultar al final) y el grupo 2 incluía a mujeres mayores de 80 años que tenían unos factores de riesgo similares.

En cada uno de los grupos darían a un tercio de las mujeres Risedronato 2,5 mg, a otro tercio 5 mg y a otro tercio placebo. Analizarían durante tres años cuántas facturas de cadera se producirían en cada uno de los grupos.  

Si el fármaco funcionara era de esperar que las pacientes que tomaran Risedronato se fracturaran menos la cadera en los tres años que duraba el estudio que las que tomaban placebín.

Había una cosa que parecía curiosa, y era que Risedronato (Actonel) no existía en formulación de 2,5 mg, sino sólo en 5 mg. No parecía tener mucho sentido gastarse una pasta para hacer un estudio multicéntrico (183 centros) a lo largo y ancho del mundo para poner a prueba una dosis de un fármaco que no era la propuesta comercializada y que además era inferior en dosis. Pero bueno.

Resulta que cuando hacen esa comparación a tres no les salen los resultados que esperaban, y entonces dicen en el ensayo que la “incidencia de fracturas fue menor a la esperada” y que casi que mejor van a poner a comparar a todas las pacientes que toman Risedronato 2,5 y 5 mg juntas contra las que toman placebo.



Por tanto, ahora realizan una comparación de dos tercios contra un tercio, sin explicar si se va a aplicar alguna medida estadística correctora para evitar esta asimetría en los grupos.

Resulta que cuando se mira a ver qué pasa en el grupo 1, podemos observar que las mujeres que toman Risedronato (2,5 mg+ 5 mg: qué remedio!) se fracturan la cadera el 1,9 %, y las que toman placebín el 3,2%. La comparación es estadísticamente significativa (P=0.009). En el capítulo de la magnitud del efecto podemos hablar de una Reducción Absoluta del Riesgo del 1,3. El tratamiento disminuye en un 1,3 % la incidencia de fracturas en pacientes de 70 a 79 años. O para simplificar, si tienes de 70 a 79 años y tomas una pastilla al día durante 3 años tienes un 1,3% de riesgo menos de tener una fractura de cadera que una mujer que no la toma.  O que de cada 100 pacientes que toman el fármaco se evitan 1,3 fracturas de cadera. El número necesario de pacientes a tratar para evitar una fractura de cadera sería 1/0,013=77. Se necesitan tratar 77 pacientes para evitar una fractura de cadera.

En el grupo 2, la incidencia de fracturas en las pacientes de 80 años y más que toman Risedronato fue del 4,2% y de las que toman placebín del 5,1%. Las diferencias no son estadísticamente significativas (P=0.35).

(En la comparación global de los dos grupos Risedronato 2,8 y Placebo 3,9%, P=0.02, RAR 1,1%, NNT 90).

Es decir, que se diseña un ensayo clínico y los resultados no salen favorables al fármaco en ninguno de los casos. Se rediseña para desfacer el entuerto y en uno de los dos grupos sigue sin salir y en el otro sale, pero, digamos, por la mínima.

Este estudio ha sustentado y sustenta la evidencia con la que se indica Risedronato para la prevención de fractura de cadera.

Y además: es aleatorizado pero no se especifica el método de aleatorización, no se habla del cegamiento, se pierden aproximadamente un tercio de los pacientes y no se especifican las causas, de los seguidos un quinto aproximadamente no se adhieren al tratamiento y no se especifican las causas (la adherencia del total de pacientes en el estudio fue del 50%, un dato paupérrimo, en consonancia con el dato de otros estudios. Y eso que se sabían "vigiladas"!, no quiero pensar lo que debe pasar en la "vida real"), y se proporciona una información muy escasa sobre efectos secundarios no mostrándose la mayor parte de los datos en este apartado.

Y a cambio nosotros: no sólo tratamos las pacientes propuestas con esta débil o nula evidencia, sino que además:

-          tratamos a mujeres mucho más jóvenes que las del estudio cuando es sabido que la edad es uno de los factores que más poderosamente influye en la incidencia de fracturas en general y de cadera en particular.
-          tratamos a mujeres españolas cuya incidencia de fractura es mucho menor que la de los países donde se realizó el estudio (Norteamérica, Australia, Nueva Zelanda, Europa).

¿Quién financió este desaguisado? ¿A que no lo adivinan?

Además de eso, los autores reconocen honorarios por investigación, charlas y consultoría de las compañías Procter and Gamble y Aventis Pharma.

El estudio se conoce popularmente como HIP (cadera, en inglés).

HIP HIP HURRA ¡!!!!!, pues.



Nota: El grupo número 1 incluía a

1.       Mujeres de 70 a 79 años (5445) con:
-       Tscore en fémur – 4 o menor ó
-       Tscore en fémur -3 o menor más un factor de riesgo que podía ser:
o   Dificultad para levantarse.
o   Dificultades en la marcha.
o   Caída previa que provocara algún daño relevante.
o   Un puntuación de 5 o menos en un test que evalúa la destreza psicomotora (Clifton Modified Gibson SpiralMaze test).
o   Tabaquismo en el momento actual o en los 5 años previos.
o   Antecedente familiar de fractura de cadera.
o   Antecedente personal de fractura de cadera.
o   Longitud de la cadera al eje axial de 11.1 cm o mayor.

El grupo número 2 incluía a:
2.       Mujeres de 80 años o mayores (3886) con:
o   Uno de los factores de riesgo explicitados anteriormente ó
o   Tscore femoral menor de – 4 ó
o   Tscore femoral menor de – 3 + longitud cadera-eje axial mayor de 11.1 cm.

El número total de mujeres que participaron en el estudio fue de 9331.

El estudio fue publicado en 2001 en el Niú England:

McClung M, Geusens P. Effect of risedronate on the risk of hip fracture in elderly women. New Engl J … [Internet]. 2001 [cited 2015 Feb 11];344(5):333–40. Available from: http://www.nejm.org/doi/full/10.1056/NEJM200102013440503


4 comentarios:

Roberto Sánchez dijo...

Julio Bonis hace unas observaciones (3) en Facebook que creo que son de gran utilidad para profundizar en la lectura del artículo y en el problema que aborda:

1) "ahí va mi lectura crítica de la lectura crítica, debatamos amigablemente que seguro que aprendemos:

Descarto entrar en el debate de los conflictos de interés, que me parece un argumento un tanto ad hominem... habiendo tanta chicha metodológica para criticar parece que criticar los conflictos de interés de los autores es reconocer que se te han acabado los argumentos científico-metodológicos.

En cuanto a argumentos metodológicos, usas el clásico del "curso para dummies de lectura crítica": no hay que usar el riesgo relativo sino la diferencia de riesgos absoluta, y su derivada: el NNT.

Mi primera socrática pregunta es ¿sirve entonces el riesgo relativo para algo? en caso de respuesta afirmativa ¿para qué?

El resto de preguntas metodológicas que se me ocurren son:
¿es correcto que los autores hablen de "riesgo relativo" en este estudio?
Los autores hacen además un análisis de kaplan-meier / longrank para decir que el grupo tratado tiene menos "hazard" que en grupo control ¿es intercambiable el análisis de riesgo relativo del análisis de supervivencia tipo kaplan-meier / logrank? ¿miden cosas distintas? ¿qué diferencia hay entre un riesgo relativo, un ratio de tasas y un hazard ratio? ¿qué asumen los autores al usar el riesgo relativo? ¿qué asumen al usar un kaplan-meier? ¿son aceptables esas asunciones?"

Roberto Sánchez dijo...

2) Rober, pues por eso te vas a la crítica ad hominem

Así muy resumido:

- el riesgo relativo (u otras medidas de ratio donde divides una medida entre un grupo y otro) sirven para analizar el "efecto" de la asociación entre la variable independiente (exposición) y la dependiente (outcome). Es decir, para ver si risendronato "disminuye" el riesgo de fractura de cadera en sí mismo (estudiar el efecto del fármaco en sí) la medida correcta es el RR, no la reducción absoluta de riesgo.
- la diferencia absoluta de riesgos depende de dos elementos: el efecto "intrínseco" del factor de exposición sobre la frecuencia de aparición del evento, y la frecuencia de aparición del evento entre los no expuestos en esa población (riesgo basal). La diferencia absoluta de riesgos te habla sobre el efecto que tendría eliminar/introducir esa exposición en esa población. Es un indicador de tipo poblacional, no te dice casi nada sobre cómo funciona el fármaco en sí. Estamos asumiendo, claro, que el fármaco tiene un efecto exclusivamente individual sobre aquel que lo recibe, y no hay efectos "de contexto". Vamos a ver como el efecto contextual trastoca todo, especialmente el NNT/RRA.

Ejemplo: pongamos una residencia de ancianos frágiles con una incidencia anual de fractura de cadera del 20%. Un fármaco (o una medida del tipo poner luces en el pasillo) que reduzca a la mitad las fracturas de cadera se supone que producirá una reducción absoluta de riesgo del 10%, es decir un NNT de 10. Bien, parecería que el fármaco tiene un efecto exclusivamente individual, pero imagina que al reducir las fracturas de cadera el personal auxiliar de la clínica tiene menos carga de trabajo y por tanto más tiempo para atender a ancianos que deambulan, reduciendo así aún más el riesgo de fractura incluso en aquellos que no tomasen el fármaco (efecto contextual). El efecto contextual hace que se altere toda la relación matemática entre riesgo relativo y diferencia absoluta de riesgo. Piensa que disminuiría el riesgo basal, es decir, incluso en aquellos ancianos que no tomasen el fármaco se reduciría su riesgo basal de fracturas.

Pongamos por ejemplo que tener a los auxiliares menos sobrecargados disminuye a la mitad el riesgo basal por un efecto contextual. Y que haces un ensayo clínico donde das el fármaco a la mitad de los habitantes de la residencia.

Al final lo que obtendrías es:
Riesgo en los que no toman fármaco 10% (20% basal * 0.5 de efecto contextual).
Riesgo en los que toman el fármaco 5% (20% basal * 0.5 de efecto directo del fármaco * 0.5 de efecto contextual)

Es decir te saldría un RR = 0.5 y un RRA = 0.05, NNT = 20

En otras palabras, dado que el efecto contextual afecta a ambos (expuestos y no expuestos) no te va a alterar el RR pero sí la RRA y el NNT. Por eso para analizar el efecto de la exposición/farmaco sobre el outcome lo mejor es usar el RR.

Además para poder analizar un riesgo contextual necesitas un ensayo clínico con diseño por conglomerados, en el que básicamente coges tres residencias de ancianos: residencia A a la que le das fármacos a todos, residencia B a la que no das fármacos a ninguno, y residencia C a la que das fármacos a la mitad.

En ese caso el resultado será:

Residencia A, todos expuestos: Riesgo = 5% (efecto directo y contextual)
Residencia B, ninguna expuesto: Riesgo = 20% (riesgo basal sin efecto contextual)
Residencia C, expuestos Riesgo = 5%, no expuestos 10%

Asumiendo que el tamaño de las residencias es el mismo (pongamos 200 pacientes por residencia) el resultado global sería, si no tienes en cuenta el diseño por conglomerados:

No tratados/expuestos 300 (200 de B + 100 de C) Riesgo en no tratados: 16.6% (40/200+10/100)
Tratados/expuestos 300 (200 de A + 100 de C) Riesgo en tratados: 5% (10/200 + 5/100).

Cagatelorito... ahora el RR = 5% / 16.6% = 0.30, RRA = 11.6% y NNT = 9

Roberto Sánchez dijo...

Es decir, si en tu ensayo clínico hay grupos de pacientes (conglomerados) donde opera el efecto contextual (residencias A y C) y grupos en los que no (residencia B) y no eres capaz de identificar eso, tus estimadores de riesgo, tanto relativos como absolutos fallan más que una escopeta de feria.

La pregunta aquí es ¿el efecto del risendronato tiene efecto contextual respecto al riesgo de sufrir una fractura de cadera?... es una pregunta que no se hace mucha gente.

El punto importante que te quiero hacer ver es que Riesgo Relativo y Reducción del Riesgo Absoluto / NNT son medidas bastante más independientes entre si de lo que los cursos para dummies te hacen entender y que en cualquier caso cuando estás analizando el efecto de una exposición/intervención sobre la frecuencia de aparición de un evento (lo que llamamos riesgo) las medidas de asociación relativas son en general más robustas que las medidas absolutas. Las medidas absolutas (NNT) están más influenciadas por factores externos.

3) Iñaki Sánchez Amezua tu análisis es "incorrecto". El estudio muestra que el risendronato disminuye el riesgo de fractura de cadera, en concreto en un 30% (0.7 [0.6-0.9]). A la hora de valorar el efecto del fármaco lo relevante es el estimador de efecto relativo, no el absoluto.
A la hora de evaluar el impacto de un uso generalizado del fármaco en una población determinado es cuando el estimador absoluto de efecto (riesgo atribuible o protección atribuible) es relevante.
El estudio que comenta Rober no tiene como objetivo evaluar el efecto de uso generalizado del fármaco en una población, para hacer eso bien habría que hacer otro tipo de diseño.

Si yo criticase los resultados del estudio no tiraría por NNT, hay algunas debilidades metodológicas más evidentes, pero para verlas hay que entender la diferencia entre un riesgo relativo, una tasa relativa (rate ratio) y un hazard ratio. La clave para mí en este caso es en que el censoring sea aleatorio (non-informative censoring) y a la asunción de proporicionalidad de los hazard ratios.

Hay cosas que huelen a podrido en el paper, por ejemplo por qué los autores no fueron capaces de estimar bien el tamaño muestral necesario a priori (es como si fuese para ellos una sorpresa que hubiese pocas fracturas), por qué agrupan los grupos de 2.5mg y 5mg a posteriori y no reportan un análisis de dosis-efecto y por qué plantean el análisis de los efectos en grupos de edad por otra parte bastante arbitrarios (70 a 79 y mayores de 80). ¿es porque no se cumple la asunción de proporicionalidad del hazard ratio? ¿por eso no muestran las curvas logarítmicas de supervivencia? algo huele a podrido en Dinamarca pero no es el NNT...

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3275994/

epanoramix dijo...

Creo que os olvidais de una cosa relativa a la validez externa: en el ensayo clínico las dosis eran diarias y en la atención médica habitual son semanales.
¿Cuál es el efecto sobre fracturas de dosis semanales? creo que las dosis diarias validaron su equivalencia respecto a las semanales en la variación de densidad ósea, pero que yo sepa no en cuestión de fracturas