Utfallsberäkning
Utfall kan beräknas på olika sätt i kvalitetsregister, och här förklarar vi hur vi gör och varför. Vi tar exemplet ”hur många som gått i remission vid uppföljning”. Vi har valt den metod som är rimligast givet hur data ser ut vad gäller uppföljningsgrad i registret, med tanke på att syftet ofta är att jämföra kliniker/enheter med varandra i de redovisningar som görs.
Vi kan kontrastera vår metod mot det tydligaste alternativet (”intent-to-treat”; ITT), för att visa varför det ena ger mer rättvisande resultat än det andra. ITT är en analysmetod i behandlingsforskning där man analyserar alla patienter som man avsåg att ge behandling oavsett om de fullföljer den eller ej. Detta sätt att analysera är vettigt när man kontrasterar två behandlingsalternativ mot varandra och vill veta effekten av behandlingarna. ITT innebär att man i samma resultat kan inkludera effekten av att patienter faller bort från behandling, eftersom avbruten behandling också är ett viktigt utfall. Det fungerar när man, som i forskningssammanhang, har fast kontroll över datainsamlingen och uppföljningarna och kan spåra alla källor till bortfall av data. När man gör en ITT-analys gör man (oftast, det finns flera metoder) antagandet att de som inte följts upp har samma värde som sitt senaste mätvärde. Om man i en studie mäter vid start och uppföljning och en patient t.ex. hade anorexia nervosa när hon gick med i studien, så antar man att hon fortfarande har anorexia nervosa vid uppföljning om hon inte deltar då. Detta fungerar som sagt när man har så bra kontroll över processen att man kan anta att inget utom själva behandlingsalternativen påverkar om man blir uppföljd eller inte. Det ska alltså inte kunna ha att göra med att man helt enkelt inte försökte följa upp lika många i den ena behandlingen, eller någon annan skillnad som är ovidkommande för att utvärdera behandlingens effekt. ITT-analyser fungerar däremot inte i de flesta kvalitetsregister, av flera skäl:
-
Om en patient följts upp eller ej säger ingenting meningsfullt om ifall de blivit friska eller ej, eller hur behandlingen har gått. Vi vet från forskning att det inte är någon skillnad mellan patienter som följs upp och de som inte följs upp vid behandlingens start (Andersén & Birgegård, 2017; Ekeroth, Clinton, Norring, & Birgegård, 2013). Det är till och med så att de som väljer att avbryta sin behandling (alltså inte uppföljningen i registret, som är en annan sak) ofta klarar sig relativt bra (Björk, Björck, Clinton, Sohlberg, & Norring, 2009).
-
Om en patient följs upp eller ej har troligen ganska lite att göra med egenskaper hos patienten, som t.ex. om hen fortfarande är sjuk eller inte. Det beror betydligt oftare på de behandlande enheternas organisation, tidspress, arbetsbörda, motivation att följa upp osv. Det betyder att man här inte har likvärdig kontroll över datainsamlingen som man skulle ha haft i en forskningsstudie, utan olika enheter/kliniker kan ha väldigt olika förutsättningar för att registrera i ett register. Vilket i sin tur inte säger något om deras förutsättningar eller förmåga att behandla patienter. Det vi därför gör (istället för ITT-analys) är att vi beräknar andel som blivit friska av de som följts upp, inte av samtliga som registrerats vid behandlingsstart. Det är nämligen troligt att på övergripande nivå är det relativt slumpmässigt vilka som följs upp och inte, och det säger väldigt lite om hur det har gått i behandlingen. Vi tar ett exempel: Om Klinik A behandlar 100 patienter, av vilka 50 blir friska, och slumpmässigt följer upp 80 av dem, av vilka 40 är friska, så ger ITT 40% remissionsgrad (40/100). Vår beräkningsmetod däremot ger 40/80=50% remissionsgrad. Om Klinik B också behandlar 100 (och 50 faktiskt blir friska här också), men slumpmässigt följer upp bara 50 varav 25 är friska, så ger ITT 25% remissionsgrad. Eftersom 25 är mindre än 40 kan man då tro att Klinik A är bättre. Genom det mer korrekta sättet att analysera data, som vi använder och som baseras på allt vi vet, är en bättre uppskattning 25/50 = 50%, dvs samma resultat som Klinik A.
Det som är helt centralt att inse är att när uppföljningsgraden är olika vid olika kliniker/enheter är det direkt missvisande att använda ITT. Det är visat i forskning på kvalitetsregisterdata att även om uppföljningsproportioner skiljer sig åt bara lite så blir jämförelser mellan kliniker/enheter bristfälliga (Ranstam, Wagner, Robertsson & Lidgren, 2008). Andra exempel på kvalitetsindikatorer från register som använder vår metod är nedsatt funktionsförmåga efter stroke, patientrapporterad minskning av framfallssymptom ett år efter operation och nedsatt psykiskt välbefinnande (klicka på länkarna för att se data).
Det är viktigt att påpeka två saker: 1) att ha en hög uppföljningsgrad är bra, och vi eftersträvar att så många som möjligt ska följas upp. Men 2) verkligheten är sån att förutsättningarna för det är olika, och enheter som av olika skäl (organisation, uppdrag, upptagningsområde, incitament att följa upp m.m.) kan följa upp färre ser då sämre ut av skäl som vare sig påverkar eller återspeglar hur många patienter som blir friska av deras behandling.
Referenser
Andersen, M. & Birgegård, A. (2017). Diagnosis-specific self-image predicts longitudinal suicidal ideation in adult eating disorders. International Journal of Eating Disorders, 50, 970-978. DOI: 10.1002/eat.22730
Björk, T., Björck, C., Clinton, D., Sohlberg, S., & Norring, C. (2009). What Happened to the Ones Who Dropped Out? Outcome in Eating Disorder Patients Who Complete or Prematurely Terminate Treatment. European Eating Disorders Review, 17, 109–119
Ekeroth, K., Clinton, D., Norring, C. & Birgegård, A. (2013). Clinical characteristics and distinctiveness of DSM-5 eating disorder diagnoses: findings from a large naturalistic clinical database. Journal of Eating Disorders, 1:31.
Ranstam, J., Wagner, P., Robertsson, O., & Lidgren, L. (2008). Health-care quality registers: outcome-orientated ranking of hospitals is unreliable. The Journal of Bone and Joint Surgery. British Volume, 90(12), 1558–1561. https://doi.org/10.1302/0301-620X.90B12.21172
Statistik