De uitdaging
Er zit veel waardenvolle klinische data verstopt in vrije tekstvelden in gezondheidsinformatiesystemen zoals epd’s die nu niet zomaar gebruikt kunnen worden voor onderzoek.
Doel
Innovatie versnellen om klinische data uit tekstvelden/bestanden extraheren, zodanig dat deze data voor secundair gebruik, met name onderzoek, gebruikt kan worden.
Hoe
Doel is kennis en kunde op gebied van Text Mining (TM) en Natural Language Processing (NLP) bij elkaar brengen welke in de (Nederlandse) gezondheidszorg gebruikt kan worden.
Doelgroep
Experts op gebied van TM & NLP, data-scientists, onderzoekers, softwareleveranciers (open en closed source).
Waar aan gewerkt gaat worden
Uitgangspunt is dat door de community opgeleverde producten in principe open source zijn. Concreet zal er gewerkt worden aan:
Datasets waarop getraind kan worden
Er is grote behoefte aan klinische datasets waarop getraind kan worden.
Algoritmes
Large Language Models. Een of meerdere modellen.
Pipelines
Werkwijze / datafaciliteiten om data op te halen.
Showcases
Laten zien dat TM en NLP werken.
Werkvormen
Online community
Er is een online community ingericht waar iedereen toegelaten kan worden.
Fysiek bijeenkomsten
Twee keer per jaar een fysieke bijeenkomst met break-outs voor open source en closed source
Challenges
Mogelijk zullen challenges georganiseerd worden om elkaar werk te beoordelen.
Secretariaat
Health-RI.