🧠 NTNU, UiO og Nasjonalbiblioteket etablerer norsk språkmodellklynge
Tre tungvektere innen norsk KI-forskning slår seg sammen for å koordinere forskning på norske språkmodeller. Klyngen ledes på omgang — UiO starter i 2026, deretter NB eller NorwAI i 2027.
«Vi ser jo at vi har kompletterende kompetanse. Nasjonalbiblioteket er god på prosessering og tilrettelegging av data for språkmodelltrening, også på storskala trening av språkmodeller, mens Universitetet i Oslo har høy kompetanse på grunnforskning på språkmodell og evaluering. Vi på NorwAI er veldig gode på å lage språkmodeller for industriell bruk med finjustering og tilpasning.»
— Jon Atle Gulla, professor og leder for NorwAI ved NTNU
Hvorfor trengs dette?
Regjeringen har etablert seks nasjonale KI-sentre, men ingen av dem fokuserer på selve språkmodellforskningen:
«De nye nasjonale sentrene for KI vil nok bruke språkmodeller i sin forskning. Men ingen av dem har forskning på selve språkmodellene og hvordan de trenes som fokus.»
— Jon Atle Gulla
- 45 mill NOK/år — kompensasjon til journalister for bruk av nyhetsstoff i trening
- 25 mill NOK — til hvert universitet i 2026
- 50 mill NOK — til hvert universitet fra 2027
- 20 mill NOK — til NB for å trene språkmodeller
MIMIR-prosjektet beviste verdien av norske kilder
Samarbeidet vokste ut av MIMIR-prosjektet, der Kulturdepartementet ba de tre teste om norske språkmodeller ble bedre ved bruk av opphavsrettsbeskyttet materiale.
Resultatet var tydelig: Nyhetsstoff fra avisene var spesielt verdifullt for norske modeller. Dette førte til at Kulturdepartementet nå kompenserer journalister med 45 millioner kroner årlig.
Hvem gjør hva?
- Nasjonalbiblioteket: Prosessering, tilrettelegging av data, storskala trening
- UiO: Grunnforskning på språkmodeller, evaluering
- NorwAI (NTNU): Industriell bruk, finjustering, tilpasning
Hva betyr dette for norske botter?
Bedre norske språkmodeller betyr bedre norske botter. Med forskning på hvordan modeller forstår og genererer norsk, kan fremtidige AI-assistenter, chatbotter og automatiseringssystemer bli vesentlig bedre på norsk språk og kontekst.