1. Enige tijd geleden heb ik op dit forum het een en ander geschreven over de rol van MTX als basismedicatie. Ik citeer uit eigen werk: “Kort geleden heeft Ablynx de resultaten gepresenteerd van de monotherapie met voba, waarin - tot mijn bevreemding - geen placebogroep mee liep. Dat betekent dat er op dit moment alleen gegevens beschikbaar zijn van de placebogroep uit het nu ‘omstreden’ combinatie-onderzoek die MTX als comedicatie gebruikte. Dat maakt het onmogelijk de hoge placebo-score te spiegelen.
De placebo-score wordt - naast de keuze van de ‘outcome measure’ - door een reeks factoren beïnvloed, zoals de demografische en ziekte-eigenschappen van de deelnemende patiënten (w.o. eerdere ‘non-response/inadequate response’ op een biological), de (gewogen) omvang van de placebogroep en diens spreiding over de onderzoekslocaties, de psychologische setting van de behandeling (het optreden en de communicatie van de arts-onderzoekers, de ontvankelijkheid van de patiënt voor bedoelde en onbedoelde suggesties) alsmede de aard en sterkte van de comedicatie (i.c. MTX).
De samenstelling van de onderzoekspopulatie is, gemeten aan de hand van een standaard reeks parameters, te kwalificeren als homogeen, de doses MTX in mg/week, verdeeld over de verschillende patiëntengroepen, schommelen tussen 15 en 16, een geringe bandbreedte derhalve. Dit kan men geen achtergrond-medicatie noemen, het is eerder een gebruikelijke basis-medicatie in dit soort onderzoeken. Of het om oraal of subcutaan gebruikte MTX gaat, weet ik niet. Bekend is dat een injectie veel meer placebo-kracht heeft dan een tablet of pil. Maar dit kan moeilijk een verklaring zijn van de hoge placebo-score. Het aantal patiënten in de placebogroep wijkt verder niet af van de vier, met voba behandelde groepen. Ook is het uitgesloten te achten dat de placebogroep (n=69) zeer ongelijk verdeeld is over de 94 onderzoeklocaties, waardoor mogelijk een bias zou ontstaan."
2. Voor de goede orde, er is niets op tegen om een placebo-‘arm’ op te nemen in een klinisch onderzoek dat patiënten omvat op een medicatie die hetzelfde indicatiegebied heeft als dat van het experimentele medicijn. Je verhoogt de ‘baseline’, van zowel de placebogroep als van de medicatiegroep, waardoor het als het ware verdisconteerd wordt.
3. Het gebruik van ACR20 als meetinstrument in het Ablynx/voba onderzoek is al eerder bestempeld als weinig relevant. Ablynx zelf heeft daar bijvoorbeeld ook op gewezen. Maar er is nog iets anders.
Daarvoor moeten we even in de theorie duiken. ACR is een set criteria die wordt gebruikt om het effect van een farmacotherapie bij reuma te meten. Met vergelijkt het ziektebeeld bij de start van de behandeling en op later tijdstip, dus na verloop van de behandeling: ‘baseline and post-baseline comparison’. De (eventuele) verbetering wordt uitgedrukt in procenten. Zo betekent ACR20 dat tenminste 20% verbetering is geconstateerd.
4. Gemeten wordt i) een 20% teruggang in het aantal gezwollen of pijnlijke gewrichten en ii) een 20% verbetering van tenminste 3 van de volgende 5 parameters:
1. Het oordeel van de patiënt.
2. Het oordeel van de arts.
3. Bepaling van de intensiteit van de pijn op een scorekaart
4. Meting van de toestand van m.n. het bewegingsapparaat aan de hand van een vragenlijst
5. Bepaling in het bloed van ESR (sedimentatiesnelheid ery’s) en CRP (een proteïne), twee veelgebruikte indicatoren voor pijn en ontsteking in het lichaam.
5. Je hoeft geen expert te zijn te zijn om te zien dat ACR methodologisch nu niet het sterkste meetinstrument is, omdat het veel subjectieve metingen omvat, waardoor de bias groot is. ACR20 is dat opzicht nog zwakker dan de broertjes ACR50 en 70. 20% verbetering is nu eenmaal is een gemakkelijker te nemen horde dan 50% of 70%.
Maar het echte probleem lijkt me te liggen bij de situatie waarin de buitenwereld het oordeel over de kwaliteit van voba beoordeelt uitsluitend aan de hand van de ACR20 score en zich niet realiseert dat er sprake is van dichotomie in de klinische uitkomsten.
6. De ACR score is dichotoom van aard: je scoort als individu positief of negatief. Wanneer 77% van de placebogroep ACR20 positief scoort, evenals 77% van de vobagroep is het dus zeer wel mogelijk dat de feitelijke scores van de vobagroep veel hoger liggen dan die van de placebogroep. Alleen geeft de ACR20 score dat niet aan. Pas wanneer je dieper in de data duikt, kun je het constateren. De goede scores van ACR50 en 70, en daarbij het ontstane verschil met de placebogroep, wijzen - lijkt mij - in de richting van de juistheid van deze veronderstelling.
7. Ik verwacht niet dat er van de kant van Ablynx nog een uiteenzetting komt die de onderzoeksresultaten in een bredere en betere context plaatst. Ablynx wil, denk ik zo, het opt-in proces met AbbVie niet onder druk zetten door publiekelijk kwanti- of kwalitatieve uitspraken te doen over hoe precies de uitkomsten van het klinisch onderzoek moet worden gelezen en gewaardeerd. De klinische onderzoekers in beide bedrijven zijn immers zonder meer staat zijn om tot een juiste waardering van de resultaten te komen. Wat met name de top van AbbVie daar vervolgens mee doet en uiteindelijk beslist, is een heel ander verhaal. Daar spelen tal van strategische overwegingen een rol, waarnaar wij slechts kunnen gissen.
Tot slot, heeft AbbVie er belang bij dat de goede resultaten van fase 2 trials met voba niet al te transparant zijn? Mijn antwoord is ja, een 100% score dus.