Representative patient samples are unnecessary in clinical research

Eivind Schjelderup Skarpsno

doi:10.4045/tidsskr.19.0047

Opinions

Representative patient samples are unnecessary in clinical research

Norwegian

Eivind Schjelderup Skarpsno

See All Articles

Eivind Schjelderup Skarpsno

E-mail: eivind.s.skarpsno@ntnu.no

Eivind Schjelderup Skarpsno, research fellow in the PhD programme in medicine and health science at the Department of Public Health and Nursing, Norwegian University of Science and Technology. He teaches epidemiology and research methodology, and serves as representative of the National Research School in Population-Based Epidemiology (EPINOR).

The author has completed the ICMJE form and declares no conflicts of interest.

Article

Non-representative patient samples – in contrast to heterogeneous, representative samples – are crucial for the validity of studies.

I often read that randomised clinical studies should be based on representative samples, i.e. heterogeneous patient samples that represent the distribution of the various personal characteristics that are found in the patient population, because this will enhance their external validity (1). But for whom are these findings really valid? Representative patient samples are obviously essential if the objective of the study is to undertake opinion polls among patients or reveal the prevalence of a specific disorder. Finding answers to clinical research questions is a completely different matter. A single study cannot be used to determine whether the effect is valid for other samples and under conditions different from those that the study has investigated. For example, we cannot be certain that pre- and post-menopausal women or young and old men will derive the same effect from a proposed course of treatment. Hormonal influence, different disease histories and degrees of severity, genetic differences and varying comorbidity all have an effect. In clinical research the inclusion criteria need to be strict, to keep all these distorting factors constant. In other words, we seek to have a group with the highest possible degree of homogeneity, with high internal validity, i.e. a non-representative patient sample.

Let us assume that we wish to test a new type of disease-modifying drug among patients with ankylosing spondylitis, a chronic rheumatic disorder that typically affects the joints in the spinal column and pelvis. Let us assume that the patient group is very homogenous, for example white Norwegian menopausal women aged 50–55 who use no other drugs and were diagnosed with the disease at the same age, their disease has progressed in the same way, the concentrations of various biomarkers are the same, there are no comorbidities, they all engage in the same level of physical activity and have the same level of education. One might think that these strict inclusion criteria would weaken any findings made, because the results will not be valid for other patient groups. It is indeed a limitation that the findings will not necessarily be valid for other patient groups, but using a representative sample will not solve this problem – on the contrary. Let us say that we included men and women in all age groups, with variation in ethnicity, drug use, biomarkers, comorbidities, level of physical activity and socioeconomic status – in other words, a representative sample that represents all sub-groups in the patient population. In this case, the therapeutic effect will not necessarily be valid for the entire patient population; it will be an average effect, weighted by the therapeutic effect in the various sub-groups. As long as the sample is too small to be stratified by these factors, we have in fact no information on possible sub-groups that may respond differently to the treatment. If the objective is to test whether the disease-modifying drug is effective in other patients, the test must be undertaken on these patients specifically. It is a simplification to believe that this can be solved by a single study based on a representative patient sample.

Strict inclusion criteria, high internal validity

The objective of clinical research ought to be to produce results that we know are valid for the patients whom we are studying. By having strict inclusion criteria that keep all distorting factors constant, we can be reasonably sure that the results in fact are valid for the patient group that we are studying. Non-representative patient samples are therefore completely crucial for ensuring credible results that can be put to the best possible use in clinical practice. It is precisely the sum of high-quality studies with high internal validity that provides correct evidence about the patients in the population.

Comments ( 3 )

Dette kommentarfeltet modereres, men kommentarer blir ikke redaksjonelt behandlet ut over å sikre at de følger retningslinjer for vårt kommentarfelt.

03.04.2019:

Kommentar til debatt: Representative pasientutvalg er unødvendig i klinisk forskning (Tidsskr Nor Legeforen 2019. doi: 10.4045/tidsskr.19.0047.)

Eivind S. Skarpsno argumenterer mot representative utvalg og mener slik utvalg er «… unødvendig i klinisk forskning». Undertegnede mener denne påstanden bør nyanseres, og at ønsket til Skarpsno (dessverre) er lite forenlig med virkeligheten.
I en ideell verden vil vi kunne lage et uendelig antall (snevre) randomiserte forsøk, slik at vi kan studere behandlingseffekter i alle homogene undergrupper med potensiell relevans for klinisk praksis. I denne ideelle verdenen kan vi med andre ord detektere effektheterogenitet: hvordan behandlingseffekten varierer mellom undergrupper. Dette fremstår som en fin målsetning, men det er praktisk umulig og etisk diskutabelt å inkludere pasientantallet som er nødvendig for å gjøre alle disse forsøkene.
Derimot kan et randomisert forsøk fra en representativ pasientpopulasjon, med god ekstern validitet, gi oss informasjon om gjennomsnittseffekter i den reelle pasientpopulasjonen. Hvis forsøket er stort, kan det også gi informasjon om effekter i (pre-spesifiserte) undergrupper. Skarpsno har rett i at slike forsøk ikke sier noe om individuelle effekter, men målet om å oppdage individuelle effekter i kliniske studier er urealistisk (1). Selv om gjennomsnittsmennesket ikke finnes (2), er gjennomsnittseffekter fortsatt viktige. Det finnes interessant litteratur om generalisering av funn fra randomiserte forsøk til reelle pasientpopulasjoner (3, 4), men undertegnede erkjenner at en slik generalisering ikke er en triviell øvelse.
Skarpsno spør hvem funnene i en studie med et representativt utvalg er gyldige for. For klinikere er det viktig at randomiserte forsøk veileder beslutninger i klinisk praksis. Det er vanskelig å se for seg hvordan en klinisk studie i et ikke-representativt utvalg kan veilede vår kliniske hverdag. Derimot vil et forsøk i form av en klinisk studie med et representativt utvalg, gi funn som lar seg implementere i virkelig, klinisk praksis.
Takk til Mats Julius Stensrud for konstruktive innspill til kommentarteksten.

Litteratur
1. Senn S. Statistical pitfalls of personalized medicine. Nature Publishing Group; 2018.
2. Roislien J, Frey Froslie K. Jane and John do not exist. Tidsskrift for den Norske laegeforening : tidsskrift for praktisk medicin, ny raekke. 2019;139(1).
3. Dahabreh IJ, Robertson SE, Tchetgen EJT, Stuart EA, Hernán MA. Generalizing causal inferences from individuals in randomized trials to all trial‐eligible individuals. Biometrics. 2018.
4. Pearl J, Bareinboim E. External Validity: From Do-Calculus to Transportability Across Populations. Statist Sci. 2014;29(4):579-95.

09.04.2019:

Takk til Frederik Emil Juul for hans kommentar til min debattartikkel i Tidsskriftet der jeg påpeker at representative pasientutvalg er unødvendig i klinisk forskning. Selv om Juul har rett i at det kan være både praktiske og etiske problemer knyttet til å studere alle mulige undergrupper i pasientpopulasjonen, så er det ikke dermed sagt at prinsippet om ikke-representative pasientutvalg bør nyanseres.

Juul skriver: «I en ideell verden vil vi kunne lage et uendelig antall (snevre) randomiserte forsøk, slik at vi kan studere behandlingseffekter i alle homogene undergrupper med potensiell relevans for klinisk praksis». Juul erkjenner altså at forskning på ikke-representative pasientutvalg har relevans. Hvorfor skal vi ikke da tilstrebe denne tilnærmingen i den virkelige verden? Man trenger ikke å utføre et uendelig antall (snevre) forsøk på alle mulige undergrupper, men man bør tenke seg godt om slik at man produserer gode studier med høy indre validitet som faktisk gir riktig kunnskap om pasientene. Det trengs ingen ideell verden for å utføre flere studier på forhåndsdefinerte undergrupper i pasientpopulasjonen.

Juul skriver videre: «… Derimot kan et randomisert forsøk fra en representativ pasientpopulasjon, med god ekstern validitet, gi oss informasjon om gjennomsnittseffekter i den reelle pasientpopulasjonen» og «… Derimot vil et forsøk i form av en klinisk studie med et representativt utvalg, gi funn som lar seg implementere i virkelig, klinisk praksis.» Juuls tankemåte er (dessverre) en forenkling av hva vitenskapelig generalisering angår. Forskning handler om å håndtere forstyrrende faktorer slik at man på best mulig måte kan forstå de kausale mekanismene i det vi undersøker. Kliniske studier er derfor påliteligere hvis man begrenser variasjonen i disse faktorene, noe som faktisk er det helt motsatte av heterogene, representative pasientutvalg. Derfor bør man tilstrebe homogene, ikke-representative pasientutvalg i klinisk forskning. Dette kan gi nøyaktigere informasjon og dermed bedre veiledning i den virkelige, kliniske hverdagen. Hvis det eksisterer ulike effekter blant undergrupper av pasienter, hvorfor ønsker man da en gjennomsnittseffekt?

Juul og undertegnede er helt enig i at det er viktig at randomiserte forsøk veileder beslutninger i klinisk praksis. Misoppfatningen til Juul er å tro at dette gjøres ved å bruke heterogene, representative pasientutvalg. Juul misforstår derfor når han fastslår at funnene fra ikke-representative studier ikke lar seg implementere i virkelig, klinisk praksis.

05.08.2019:

Skarpsno velger å hoppe bukk over de praktiske konsekvensene av hans prinsipp om ikke-representative pasientutvalg. Det var blant hovedpoengene i min tidligere kommentar og ønske om nyansering.

Jeg virker å ha lykkes delvis ved at vi er enige om at det ikke lar seg utføre et uendelig antall (kliniske) forsøk. Likevel forstår jeg ikke hvordan en skal kunne gjennomføre det store antallet ikke-representative studier, med snevre inklusjonskriterier og validitet for en spesifikk, liten pasientgruppe, for å innhente «riktig kunnskap» om alle de ulike pasientgruppene som finnes i klinisk praksis.

Jeg mener klinisk forskning bør domineres av store studier med representative utvalg (gjerne med pragmatiske trekk (1)) snarere enn mange små studier med snevre pasientutvalg slik Skarpsno ønsker. Det betyr ikke at alle kliniske spørsmål om sykdommer, diagnostikk, behandling, osv. kan besvares av store enkeltstudier alene. Jeg er selvsagt enig om å tenke seg godt om og produsere gode studier, gjerne med problemstillinger som er mer relevante for pasientene (2).

Jeg står fast på at visjonen om ikke-representative pasientutvalg er urealistisk og at representative utvalg er nødvendig for praktisk og virkelighetsnær klinisk forskning.

Takk til Per Olav Vandvik for konstruktive innspill til kommentarteksten.

LITTERATUR
1. Stensrud MJ. La oss være pragmatiske. Tidsskr Nor Legeforen 2019; 139: 739.
2. Ioannidis JPA, Greenland S, Hlatky MA et al. Increasing value and reducing waste in research design, conduct, and analysis. The Lancet. 2014;383:166-75.

This article was published more than 12 months ago and we have therefore closed it for new comments.

Published: 21 February 2019

Tidsskr Nor Legeforen 21 February 2019 Vol. 139.

doi:

10.4045/tidsskr.19.0047

Received 15.1.2019, accepted 23.1.2019.

Published: 21 February 2019

Tidsskr Nor Legeforen 2019 Vol. 139.

doi: 10.4045/tidsskr.19.0047

Received 15.1.2019, accepted 23.1.2019.

PDF

Print

Representative patient samples are unnecessary in clinical research

Strict inclusion criteria, high internal validity

Pasientutvalg representative for virkelig, klinisk praksis

Hvilke funn bør implementeres i virkelig, klinisk praksis?

En urealistisk visjon

Recent Articles