Internetmedicin.se använder cookies för att kunna erbjuda en så bra tjänst som möjligt. Läs mer

annons
Medicinsk statistik - diagnostiska tester
Författare Docent, överläkare , Barnkliniken i Örebro, Enheten för klinisk epidemiologi/Universitetssjukhuset Örebro
Professor , Enheten för klinisk epidemiologi/Karolinska Institutet
Granskare Professor Otto Westphal, Barnkliniken/Drottning Silvias Barn- och Ungdomssjukhus Göteborg
Uppdaterad 2015-08-23
Specialitet Övrigt
Skriv ut
annons




 

BAKGRUND


Principerna för diagnostiska tester är desamma i kliniken som på labbet. Diagnostiska tester kan i kliniken användas t ex när man värderar betydelsen av huvudvärk, sveda vid vattenkastning eller dålig tillväxt av ett spädbarn.

Begrepp inom diagnostiska tester som tas upp och förklaras nedan är:
 

  • Gold standard
  • Sensitivitet och specificitet
  • Cut-off
  • Positivt och negativt prediktivt värde


Uppdelning av resultat

Resultaten av diagnostiska tester kan delas upp i två grupper, vilket innebär att man dikotomiserar resultaten, t ex provsvar kan tolkas som "lite - mycket" eller "frånvaro - förekomst" ("negativt - positivt"). Man kan också gradera resultat på annat sätt, t ex blåsljud kan graderas från svaga till distinkt tydliga (grad 1-6).

    Exempel: Det nyfödda barnets tillstånd värderas enligt den så kallade Apgarskalan, där hjärtfrekvensen graderas från "ingen hjärtaktivitet" (0 poäng) till "mindre än 100 slag/minut" (1 poäng) och "100 eller fler slag/minut" (2 poäng).
Ofta vill vi klassificera data som positiva eller negativa. Inte sällan baserar sig riktlinjerna för behandling på dessa uppdelningar, t ex väljer många att behandla blodtryck över 140/90 men inte lägre blodtryck.

Testresultat kan antingen spegla verkligheten ("sanna") eller missa målet ("falska"). Kunskap om ett tests tillförlitlighet är avgörande för att man ska kunna dra slutsatser av det. Testresultat delas vanligen upp i:
  1. sant positiva
  2. falskt positiva
  3. falskt negativa
  4. sant negativa

Tabell 1. Förhållandet mellan testresultat och sjukdom kan åskådliggöras med en tabell.

Har sjukdomen (sjuk)Har inte sjukdomen (frisk)
Positivt testa. Sant positivb. Falskt positiv
Negativt testc. Falskt negativd. Sant negativ




 

GOLD STANDARD


För att kunna värdera hur bra ett test är, måste man ha en måttstock, dvs ett säkert sätt att veta om en patient verkligen har en sjukdom eller inte. En sådan måttstock kallas ofta gold standard (inte golden standard). En annan engelskspråkig benämning är "reference standard".
 

  • Ibland är gold standard ett enkelt test, t ex ett HIV-test. Är det positivt och kan bekräftas med ytterligare ett test har man HIV.
     
  • Ibland är gold standard mer komplicerat, dyrt och till och med farligt, t ex lungbiopsi för att vara helt säker på att någon har lungcancer.
     
  • Den kliniska bilden kan utgöra gold standard, t ex för sjukdomar som obönhörligen progredierar och leder till döden. Ett historiskt exempel är pankreascancer (innan ultraljud och CT kom som diagnostiska test). Det är viktigt att man har en rimlig uppföljningstid om man använder den kliniska bilden som gold standard. I fallet pankreascancer var överlevnaden så kort som 6 månader. Symtom som föregår död i pankreascancer med tiotalet år har inte med cancern att göra och kan då heller inte tjäna som gold standard.


I klinisk praxis använder vi ofta tester som inte är gold standard men som ändå anses acceptabla.

    Exempel: EKG och enzymstegring används som tester vid hjärtinfarkt även om hjärtkateterisering och visualisering etc. kanske behövs för att vi ska vara mer än 99% säkra på diagnosen.
Här uppvägs en liten risk av att felaktigt ställa diagnosen hjärtinfarkt av att riskerna och de praktiska svårigheterna med akut kateterisering/visualisering kanske är stora.


Problem med utvärdering av tester
 

  • Patienter med positiva testresultat inom medicin utreds ofta vidare och så småningom kan en diagnos bekräftas eller förkastas. Mindre ofta drivs utredningen vidare hos den som har negativa testresultat - i alla fall för det vi testat för.

      Exempel: En patient med låg D-dimer tros inte ha lungemboli och därför går vi inte vidare med ytterligare utredning för just lungemboli – att göra det hade av många ansetts oetiskt, och icke försvarbart ur ekonomisk synvinkel.

     
  • Ett problem när man ska utvärdera ett test är att testet ofta har testats hos patienter som redan har sjukdomen. Dessa patienter har kanske tydligare symtom och fler positiva tester än genomsnittspatienten? Känd sjukdom kan även påverka hur vi tolkar en undersökning.

      Exempel: Skriver man som remitterande läkare att "patienten har förhöjd andningsfrekvens, CRP 200, hosta, feber, och krepitationer basalt bilateralt" gör enbart anamnesen att många röntgenläkaren blir mer benägna att skriva "infiltrat" i remissvaret.

     
  • För vissa tillstånd saknas gold standard-tester. Det gäller t ex Crohns sjukdom eller SLE. Här har man försökt att sätta upp kriterier för diagnos. Men dessa kriterier är ofta utarbetade på basen av patienter som har "typiska symtom" och i och med att kriterier ställs upp förstärks kopplingen mellan vissa symtom och en sjukdom. En typ av cirkelargumentation.
     
  • Nya tester har ofta en nackdel gentemot etablerade tester. Om ett nytt test hittar "nya fall" finns risken för att man avfärdar dessa som falskt-positiva, och om det nya testet avfärdar patienter som tidigare befunnits positiva så antar man att det nya testet har dålig känslighet. Men i själva verket kan det ju vara gold standard-testet som brister!


DIAGNOSTISKA BEGREPP


Sensitivitet och specificitet
 

  • Sensitivitet är andelen sjuka som identifieras med ett test (positivt test - a/(a+c) i tabell 1).
     
  • Specificitet är andelen friska som friskförklaras med ett test (negativt test - d/(b+d) i tabell 1).

I vissa sammanhang är sensitiviteten viktigast medan det i andra är av större betydelse att ha en hög specificitet.


Sensitivitet

När man inte får missa en sjukdom bör man välja ett test med hög sensitivitet. Det gäller t ex för sjukdomar som är livshotande men kan botas, exempelvis tuberkulos. Priset man betalar är att ett test som ska identifiera alla sjuka ofta får med en hel del friska samtidigt. Det innebär att man sällan kan avsluta utredningen när man funnit ett positivt testresultat, ofta behövs nu fler tester för att säkerställa att patienten verkligen har sjukdomen.


Specificitet

När vi vill vara helt säkra på ett en person verkligen lider av en sjukdom (t ex innan vi startar en livshotande behandling) är specificiteten det viktigaste. Även om cancermisstanken är stark är det få inom sjukvården som sätter in cytostatika innan man gjort en biopsi. Ett test med hög specificitet friskförklara den som är frisk.


Cut-off

Vilken sensitivitet respektive specificitet ett test har beror på var man sätter "cut-off", alltså gränsen mellan positivt och negativt.

Antag att vi vill identifiera patienter med urinvägsinfektion:
 

  • Med en låg cut-off (t ex "10 000 vita i urinen") kommer vi att hitta alla sjuka och med den cut-offen har testet hög sensitivitet. Men samtidigt kommer vi att få med ett antal patienter som har 10 000 vita i urinen men faktiskt inte har urinvägsinfektion (låg specificitet = friska får falskt positivt testresultat).
     
  • Med en hög cut-off (t ex "10 000 000 vita") hittar vi inte alla sjuka (låg sensitivitet) men däremot kan vi vara säkra på att alla friska verkligen friskförklaras (negativt testresultat). Alltså har testet med den cut-offen hög specificitet.

I klinisk praxis kanske vi anger cut-off någonstans mittemellan (100 000 - 1 000 000 vita) men är öppna för att en del med positivt testresultat inte har urinvägsinfektion medan andra med värden under cut-off (negativt testresultat) faktiskt har sjukdomen.


Exempel bröstcancer

Exempel på beräkning av sensitivitet och specificitet enligt mammografidata från Australien på kvinnor utan symtom på bröstcancer.

Tabell 2. Bröstcancer och mammografi.

Har bröstcancerHar inte bröstcancer
Positiv mammografia. Sant positiv
n = 495
b. Falskt positiv
n = 4906
Negativ mammografic. Falskt negativ
n = 160
d. Sant negativ
n = 90 859


  • Sensitivitet - andelen av de sjuka som identifieras:
    a/(a+c) = 495/(495 + 160) = 75,6%
     
  • Specificitet - andelen av de friska som friskförklaras:
    d/(b+d) = 90 859/(90 859 + 4 906) = 94,6%

Tittar vi på data så ser vi omedelbart att de flesta som är positiva enligt mammografi inte har bröstcancer.


Positivt prediktivt värde

När vi vill uttala oss om hur pass bra ett test är på att förutsäga sjukdom använder vi begreppet PPV = positivt prediktivt värde. Det är andelen av de som testats positivt som verkligen har en sjukdom.

    I exemplet ovan är a/(a+b) = 495/(495+4906) = 9,2%. I denna studie hade alltså var elfte kvinna med positiv (patologisk) mammografi verkligen bröstcancer.

Negativt prediktivt värde

När vi vill uttala oss om hur pass bra ett test är på att förutsäga hälsa/att patienten är frisk använder vi begreppet NPV = negativt prediktivt värde. Det är andelen av dem som testats negativt som verkligen är friska.
    I fallet ovan: d/(d+c) = 90859/(90859+160) = 99,8%. I denna studie var alltså mammografi bra på att utesluta sjukdom, att friskförklara. Men patienter med en avvikande mammografi behövde utredas vidare, mindre än 10% av dem hade verkligen bröstcancer.
Om vi vill kan vi öka mammografins sensitivitet. Då kommer flera av de 160 falskt-negativa (= sjuka) att hittas men det sker till priset av att flera som nu klassificeras som friska (negativt testresultat) istället får beskedet att de har en avvikande mammografi.

För att hitta en optimal cut-off måste man ta hänsyn till både hur farlig sjukdomen är (och om en hög sensitivitet eller specificitet är mest angelägen) men också hur vanlig en sjukdom är ("prevalensen"). Ofta används så kallade ROC-kurvor för att sätta en bra cut-off. ROC står för receiver-operator-characteristics.

 

Exempel celiaki

På samma sätt kan vi beräkna sensitivitet, specificitet, PPV och NPV för olika celiakitester:

Tabell 3. Celiaki och celiakitester.

Celiaki enligt tunntarmsbiopsi* (villusatrofi)Har inte celiaki
Positiva transglutaminas-aka. Sant positiv
n = 70
b. Falskt positiv
n = 175
Negativa transglutaminas-akc. Falskt negativ
n = 7
d. Sant negativ
n = 1 748

*Gold standard
 

  • Sensitivitet - andelen av de sjuka som identifieras med transglutaminas-ak:
    a/(a+c) = 70/(70+7) = 90,9%
     
  • Specificitet - andelen av de friska som friskförklaras:
    d/(b+d) = 1748/(1748+175) = 90,9%
     
  • Positivt prediktivt värde (PPV) - andel av de med positivt test som har celiaki:
    a/(a+b) = 70/(70+175) = 28,6%
     
  • Negativt prediktivt värde (NPV) - andel av de med negativt test som är friska:
    d/(c+d) = 1748/(1748+7) = 99,6%

Slutsatsen är att transglutaminas-antikroppar i den här studien är mycket bra på att utesluta celiaki men att den som har positiva transglutaminasantikroppar bör gå vidare med tunntarmsbiopsi innan han/hon ställs på livslång glutenfri kost.

 

Faktorer som påverkar sensitivitet och specificitet

När ett nytt test utvärderas anges ofta högre sensitivitet och specificitet än vad som senare blir fallet i klinisk praxis. Det beror på flera saker. Man kan förvänta sig att ett nytt test ofta prövas på patienter
 

  1. som har en mer typisk sjukdom än genomsnittspatienten
  2. vars sjukdom har progredierat mer än hos genomsnittspatienten

Båda dessa faktorer ger oftast en högre sensitivitet och specificitet än man skulle ha fått i en grupp av genomsnittliga patienter.

Slutligen kan slumpen spela roll för uppmätt sensitivitet och specificitet. Pga så kallad publication bias får oftare artiklar som redovisar hög sensitivitet och specificitet publiceras ("bra" resultat är lättare att publicera i vetenskapliga tidskrifter).


 

Referenser


Docent Jonas F. Ludvigssons personliga hemsida.

Kavanagh AM, Giles GG, Mitchell H, et al. The sensitivity, specificity, and positive predictive value of screening mammography and symptomatic status. J Med Screen 2000;7:105-10.

Hopper AD, Cross SS, Hurlstone DP, et al. Pre-endoscopy serological testing for coeliac disease: evaluation of a clinical decision tool. Bmj 2007;334:729.

 

Copyright © Internetmedicin 2017
ID: 3282

Kommentera >>
Behandlingsöversikt: Medicinsk statistik - diagnostiska tester

 
 
 
   



Du måste vara inloggad för att skriva ut.
Logga in eller registrera dig gratis här.

Den här sidan kan inte skrivas ut på vanligt sätt.
Använd istället knappen Skriv ut (symbolen med skrivare) uppe till höger på sidan.

Endast registrerade användare har tillgång till utskriftsfunktionen.

Så här registrerar du dig och skriver ut:
1. Registrera dig (kostnadsfritt). Klicka på länken Ny användare uppe
till vänster på sidan och följ instruktionerna.
2. Ditt lösenord skickas till din e-postadress.
3. Logga in.
4. Gå till önskad behandlingsöversikt.
5. Klicka på knappen "Skriv ut" längst upp till höger på sidan.
6. Ett nytt fönster öppnas. Utskriftsdialogen visas, klicka på Skriv ut.








Chefsläkare
Södra Älvsborgs Sjukhus, sjukhusledning


Specialist allmänmedicin och ST-läkare
till hälsocentralerna Söderhamn och Linden


Specialist allmänmedicin och ST-läkare
till hälsocentralerna Arbrå, Baldersnäs och Kilafors


Specialist allmänmedicin och ST-läkare
till hälsocentralerna Hudiksvall och Nordanstig


Leg. läkare med erfarenhet från primärvården
KRY


60 ST- läkare
Västerbotten


Enhetschef
till Operationsavdelningen i Helsingborg


Just nu har vi flera lediga tjänster på hel- eller deltid. Även i Mali.
Försvarsmakten


Just nu söker vi dig som är specialist i allmänmedicin!
Bohuspraktiken, Bohus Centrum


Distriktsläkare
Heby Vårdcentral


Arbeta som läkare hos Min Doktor
Min Doktor


Distriktssköterska på vårdcentral
Primärvårdens vårdcentraler i Uppsala län


Överläkare/ specialistläkare
till VO AnOpIVA i Helsingborg och Ängelholm


Överläkare/Specialistläkare
till Hudmottagningen i Helsingborg


Överläkare/specialistläkare inom Barn- och ungdomspykiatri
Skaraborgs Sjukhus, M6, BUP Läkare

annons
annons