Høiseths kommentar (1) fortoner seg som en avsporing av det jeg skriver i kommentaren min og dette blir dermed en klassisk stråmannsargumentasjon som bør korrigeres.
Først spør Høiseth følgende: «Mener Krumsvik at store språkmodeller (Large language models (LLM)) som ChatGPT og GPY-4 er kommet så langt i utviklingen at vi kan og bør bruke store samfunnsressurser på å få frem ny medisinsk innsikt basert på disse metodene?» Jeg nevner overhodet ingenting om å bruke store samfunnsressurser til dette i min kommentar, så hvor Høiseth tar dette i fra er jeg svært undrende til. Og han følger opp med nok en avsporing hvor han antyder at jeg støtter Direktoratet for e-helses arbeid med Helseplattformen. Dette skriver jeg heller ingenting om i kommentaren, så hvordan han klarer å relatere dette til min kommentar er jeg også svært undrende til.
Høiseth vet like godt som meg at man i en kommentar bare kan ta med noen svært få referanser, og jeg anbefaler derfor Høiseth å lese boken min, hvor et mer omfattende kunnskapsgrunnlag er presentert og som jeg baserer kommentaren min på (2).
Og de to referansene som Høiseth kritiserer (3, 4), står seg også godt og underbygger de poengene jeg løfter frem i kommentaren min. At Høiseth også her er noe upresis når han refererer til hva han mener jeg skriver i min kommentar, er dessverre her også en utfordring.
Det er også åpenbart at Høiseth ikke ser distinksjonen mellom ChatGPT og GPT-4 (eller GPY-4 som han kaller den), og argumenterer som om disse har samme kapabiliteter. Her er det viktig å forstå at GPT-4 har hele 1000 milliarder parametere, mens ChatGPT har 175 milliarder parametere. Dette gjør at GPT-4 er svært mye kraftigere og har langt større kapasitet enn ChatGPT. Så når den ene referansen jeg viser til har foretatt en av de mest omfattende testene av GPT-4 kapabiliteter (sent i 2022), og jeg har retestet GPT-4 åtte måneder senere (august 2023), så er det dette til sammen som danner basisen for å hevde at språkmodeller som GPT-4 kan beskrives som et teknologisk paradigmeskifte (2, 3). Den andre publikasjonen Høiseth kritiserer foretar en gjennomgang av blant annet kunnskapsgrunnlaget så langt rundt ChatGPT, og selv om ChatGPT nylig feiret sin ettårsdag og har en langt mindre kapasitet enn GPT-4, viser denne artikkelen likevel at ChatGPT på flere områder gjør det oppsiktsvekkende bra. Det skal derfor noe til å overse studiene som nevnes på s. 134 og 136, samt tabell 4 på s. 136, hvor nettopp det jeg skriver i kommentaren min dokumenteres (4).
Til slutt fortsetter Høiseth å være tilbakeskuende og refererer til en lederartikkel om ChatGPT publisert i januar 2023 (5) og de poengene som for nesten ett år siden løftes frem, er både relevante og viktige på det aktuelle tidspunktet. Men her burde Høiseth ha nevnt at siden den tid har den langt kraftigere GPT-4 blitt lansert (mars 2023), det er den jeg i hovedsak skriver om og som viser at de «barnesykdommene» som ChatGPT har slitt med, er i vesentlig grad forbedret i GPT-4.
Litteratur:
1. Høiseth A. Ressursbruk: Kan vi satse på maskinlæring. Tidsskr Nor Legeforen 2023. https://tidsskriftet.no/2023/12/kommentar/ressursbruk-kan-vi-satse-pa-maskinlaering#comment-3031 Lest 14.12.2023
2. Krumsvik RJ. Digital kompetanse i KI-samfunnet. Et blikk på hvordan kunstig intelligens preger livene våre. Oslo: Cappelen Damm Akademisk, 2023.
3. Bubeck S, Chandrasekaran V, Eldan R et al. Sparks of artificial general intelligence: Early experiments with GPT-4. ArXiv. Preprint 13.04.2023. https://arxiv.org/abs/2303.12712 Lest 15.12.2023
4. Ray PP. ChatGPT: A comprehensive review on background, applications, key challenges, bias, ethics, limitations and future scope. KeAi 2023; 3: 121-54. https://doi.org/10.1016/j.iotcps.2023.04.003
5. Shen Y, Heacock L, Elias J et al. ChatGPT and other large language models are double-edged swords. Radiology 2023; 307. doi: 10.1148/radiol.230163.
Maskinlæring i en brytningstid II
Høiseths kommentar (1) fortoner seg som en avsporing av det jeg skriver i kommentaren min og dette blir dermed en klassisk stråmannsargumentasjon som bør korrigeres.
Først spør Høiseth følgende: «Mener Krumsvik at store språkmodeller (Large language models (LLM)) som ChatGPT og GPY-4 er kommet så langt i utviklingen at vi kan og bør bruke store samfunnsressurser på å få frem ny medisinsk innsikt basert på disse metodene?» Jeg nevner overhodet ingenting om å bruke store samfunnsressurser til dette i min kommentar, så hvor Høiseth tar dette i fra er jeg svært undrende til. Og han følger opp med nok en avsporing hvor han antyder at jeg støtter Direktoratet for e-helses arbeid med Helseplattformen. Dette skriver jeg heller ingenting om i kommentaren, så hvordan han klarer å relatere dette til min kommentar er jeg også svært undrende til.
Høiseth vet like godt som meg at man i en kommentar bare kan ta med noen svært få referanser, og jeg anbefaler derfor Høiseth å lese boken min, hvor et mer omfattende kunnskapsgrunnlag er presentert og som jeg baserer kommentaren min på (2).
Og de to referansene som Høiseth kritiserer (3, 4), står seg også godt og underbygger de poengene jeg løfter frem i kommentaren min. At Høiseth også her er noe upresis når han refererer til hva han mener jeg skriver i min kommentar, er dessverre her også en utfordring.
Det er også åpenbart at Høiseth ikke ser distinksjonen mellom ChatGPT og GPT-4 (eller GPY-4 som han kaller den), og argumenterer som om disse har samme kapabiliteter. Her er det viktig å forstå at GPT-4 har hele 1000 milliarder parametere, mens ChatGPT har 175 milliarder parametere. Dette gjør at GPT-4 er svært mye kraftigere og har langt større kapasitet enn ChatGPT. Så når den ene referansen jeg viser til har foretatt en av de mest omfattende testene av GPT-4 kapabiliteter (sent i 2022), og jeg har retestet GPT-4 åtte måneder senere (august 2023), så er det dette til sammen som danner basisen for å hevde at språkmodeller som GPT-4 kan beskrives som et teknologisk paradigmeskifte (2, 3). Den andre publikasjonen Høiseth kritiserer foretar en gjennomgang av blant annet kunnskapsgrunnlaget så langt rundt ChatGPT, og selv om ChatGPT nylig feiret sin ettårsdag og har en langt mindre kapasitet enn GPT-4, viser denne artikkelen likevel at ChatGPT på flere områder gjør det oppsiktsvekkende bra. Det skal derfor noe til å overse studiene som nevnes på s. 134 og 136, samt tabell 4 på s. 136, hvor nettopp det jeg skriver i kommentaren min dokumenteres (4).
Til slutt fortsetter Høiseth å være tilbakeskuende og refererer til en lederartikkel om ChatGPT publisert i januar 2023 (5) og de poengene som for nesten ett år siden løftes frem, er både relevante og viktige på det aktuelle tidspunktet. Men her burde Høiseth ha nevnt at siden den tid har den langt kraftigere GPT-4 blitt lansert (mars 2023), det er den jeg i hovedsak skriver om og som viser at de «barnesykdommene» som ChatGPT har slitt med, er i vesentlig grad forbedret i GPT-4.
Litteratur:
1. Høiseth A. Ressursbruk: Kan vi satse på maskinlæring. Tidsskr Nor Legeforen 2023. https://tidsskriftet.no/2023/12/kommentar/ressursbruk-kan-vi-satse-pa-maskinlaering#comment-3031 Lest 14.12.2023
2. Krumsvik RJ. Digital kompetanse i KI-samfunnet. Et blikk på hvordan kunstig intelligens preger livene våre. Oslo: Cappelen Damm Akademisk, 2023.
3. Bubeck S, Chandrasekaran V, Eldan R et al. Sparks of artificial general intelligence: Early experiments with GPT-4. ArXiv. Preprint 13.04.2023. https://arxiv.org/abs/2303.12712 Lest 15.12.2023
4. Ray PP. ChatGPT: A comprehensive review on background, applications, key challenges, bias, ethics, limitations and future scope. KeAi 2023; 3: 121-54. https://doi.org/10.1016/j.iotcps.2023.04.003
5. Shen Y, Heacock L, Elias J et al. ChatGPT and other large language models are double-edged swords. Radiology 2023; 307. doi: 10.1148/radiol.230163.