Konkordans og kollokasjon
En slik undersøkelse gjøres gjerne i to deler. Først ser man på konkordans, dvs. bruksfrekvens for et ord, deretter kollokasjon, som kan defineres som en forbindelse av to eller flere ord som vanligvis opptrer sammen (3), for eksempel gjøre fremskritt og felle en dom. Dette kan også kalles aggregerte konkordanser. Man kan også bruke begrepet i en litt videre betydning enn dette, slik at kollokatene for et ord ikke trenger å stå ved siden av ordet, men at det holder at de befinner seg innenfor en kontekst og er assosiert.
Med kollokasjoner kan man se på større eller mindre kontekstvindu og også begrense dem til bare noen få ord til høyre eller venstre for å undersøke sammenhengen mellom ord og hva de typisk opptrer med. Kollokatene, altså de ordene som antas å være knyttet til et målord, og eventuelle endringer i dem, kan fortelle oss noe om forskjellige betydninger. Kollokatene kan gis en relevansverdi basert på frekvensforskjellen mellom forekomster i konkordansene (kontekst) og korpuset. Om ordet har en frekvens på 2 % av alle ordene i kontekst for målordet, samtidig som det opptrer i 0,5 % i korpuset ellers, kan vi si at det opptrer fire ganger så ofte med målordet enn utenfor. Frekvensforskjellen gir et mål på assosiasjonen mellom kollokatet og målordet: Jo høyere, jo sterkere assosiert.
Ressursene som tilbys ved Nasjonalbiblioteket, kan benyttes i medisinskterminologisk arbeid. Informasjonsflyten kan gå fra ord til tekst og så til klassifikasjonsdata, og omvendt fra klassifikasjon til tekster og så til ord og termer. Selv om ikke alt som er publisert innen medisin er gjort tilgjengelig, er det likevel store mengder informasjon som kan hentes ut.