Hvem bør vurdere kunstig intelligens’ medisinske råd?

Kommentert artikkel

Kunstig intelligens og legers svar på helsespørsmål

Se alle kommentarer

Kommentar

Hvem bør vurdere kunstig intelligens’ medisinske råd?

Damoun Nassehi

Damoun Nassehi

Førsteamanuensis ved UiB (IGS) og fastlege (Sokndal legekontor)

damoun.nassehi@uib.no

Interessekonflikt: Nei

Dette er en kommentar til Kunstig intelligens og legers svar på helsespørsmål. Kommentarfeltet modereres, men kommentarer blir ikke redaksjonelt behandlet ut over å sikre at de følger retningslinjer for vårt kommentarfelt.

I en nylig publisert studie i Tidsskrift for Den norske legeforening undersøker medisinstudentene Mork og Mjøs, sammen med sine medforfattere, hvordan kunstig intelligens (KI) svarer på helsespørsmål (1). Studien viser et flott initiativ og en god forståelse for den vitenskapelige metode, særlig ved at de bygger videre på et eksisterende datasett og gjør metodikken sin tilgjengelig via GitHub.

En av de mest interessante aspektene ved studien er tilgangen de har valgt. Ved å bruke et allerede eksisterende datasett, får de mulighet til å analysere store mengder informasjon uten å måtte konstruere et nytt eksperiment fra bunnen av. Dette er en metodisk styrke, men det er også viktig å reflektere over hvem som vurderer svarene KI gir – og hvilken ekspertise disse vurderingene baserer seg på.

Studien baserer seg på vurderinger fra 344 respondenter, men av disse var kun 44 leger eller medisinstudenter. Det innebærer at nesten 90 % av respondentene ikke hadde medisinsk utdanning. Dette reiser et viktig spørsmål: Ville resultatene vært annerledes dersom en større andel av vurderingene kom fra medisinsk kvalifiserte personer?

Leger har en spesialisert kunnskap om diagnostikk, sykdomsforløp og behandlingsalternativer, noe som kan gjøre dem bedre i stand til å vurdere nøyaktigheten og nytteverdien av KI-genererte svar. En interessant oppfølgingsanalyse kunne derfor vært å se på hvordan vurderingene fra leger skiller seg fra de øvrige respondentene. Er det for eksempel slik at leger vurderer KI-svarene som mer eller mindre presise enn lekfolk gjør? Opplever de at KI i større grad gir plausible, men potensielt misvisende svar?

Dersom det viser seg at leger vurderer KI-svarene annerledes enn den generelle befolkningen, kan dette ha flere konsekvenser. Det kan tyde på at ikke-eksperter har en annen oppfatning av hva som utgjør et godt helseråd, noe som kan påvirke hvordan pasienter forholder seg til KI-baserte verktøy. Det kan også indikere at fremtidige evalueringer av slike systemer bør inneholde en tydeligere medisinsk ekspertkomponent for å sikre faglig kvalitet.

Studien av Mork og Mjøs er et viktig bidrag til diskusjonen om KI i helsetjenesten, men den reiser også nye spørsmål som bør utforskes videre. En mer detaljert analyse av vurderingene fra leger kontra ikke-leger kunne vært et naturlig neste steg.

Litteratur
1. Mork TE, Mjøs HG, Nilsen HG et al. Kunstig intelligens og legers svar på helsespørsmål. Tidsskr Nor Legeforen 2025; 145. doi: 10.4045/tidsskr.24.0402

Publisert: 19.02.2025