Start community voor textmining en natural language processing

Pim Volkert · 11 apr 2023

De uitdaging

Er zit veel waardenvolle klinische data verstopt in vrije tekstvelden in gezondheidsinformatiesystemen zoals epd’s die nu niet zomaar gebruikt kunnen worden voor onderzoek.

Doel

Innovatie versnellen om klinische data uit tekstvelden/bestanden extraheren, zodanig dat deze data voor secundair gebruik, met name onderzoek, gebruikt kan worden.

Hoe

Doel is kennis en kunde op gebied van Text Mining (TM) en Natural Language Processing (NLP) bij elkaar brengen welke in de (Nederlandse) gezondheidszorg gebruikt kan worden.

Doelgroep

Experts op gebied van TM & NLP, data-scientists, onderzoekers, softwareleveranciers (open en closed source).

Waar aan gewerkt gaat worden

Uitgangspunt is dat door de community opgeleverde producten in principe open source zijn. Concreet zal er gewerkt worden aan:

Datasets waarop getraind kan worden

Er is grote behoefte aan klinische datasets waarop getraind kan worden.

Algoritmes

Large Language Models. Een of meerdere modellen.

Pipelines

Werkwijze / datafaciliteiten om data op te halen.

Showcases

Laten zien dat TM en NLP werken.

Werkvormen

Online community

Er is een online community ingericht waar iedereen toegelaten kan worden.

Fysiek bijeenkomsten

Twee keer per jaar een fysieke bijeenkomst met break-outs voor open source en closed source

Challenges

Mogelijk zullen challenges georganiseerd worden om elkaar werk te beoordelen.

Secretariaat

Health-RI.

Start community voor textmining en natural language processing

Pim Volkert

Well-known member

De uitdaging​

Doel​

Hoe​

Doelgroep​

Waar aan gewerkt gaat worden​

Datasets waarop getraind kan worden ​

Algoritmes ​

Pipelines ​

Showcases ​

Werkvormen​

Online community ​

Fysiek bijeenkomsten ​

Challenges ​

Secretariaat​