Afin de traiter efficacement les données, il est nécessaire d’avoir une stratégie concernant la gestion de la connaissance de sa construction à son utilisation. Chaque projet a besoin de connaissances et en crée. Par conséquent, nous devons stocker et accéder à ces nouvelles connaissances ainsi que les relier dans un réseau de sens. C’est ce qu’on appelle l’ingénierie des connaissances.
Cette stratégie d’ingénierie des connaissances s'articule autour de trois axes :
La gestion des connaissances et ontologies pour les phénotypes
Construire des connaissances de manière significative, et les stocker de manière à permettre un accès facile pour les nouveaux projets. Comment ajouter de la sémantique à des données aux caractéristiques multiples et comment faire évoluer ce savoir au fil du temps et des avancements de la science.
- SNOMED-CT, ICPC, NANDA
- Amplification sémantique
- Représentation des données centrée sur la sémantique
Représentation conceptuelle de la connaissance
La représentation conceptuelle des connaissances ne peut se limiter à des ouvrages de références ou des dictionnaires. Il est donc impératif d’explorer des pistes nouvelles pour représenter et utiliser efficacement ce savoir. L’utilisation de langages formels, de bases de données en graphes ou de gestionnaires d’ontologies en sont quelques exemples.
- Stockage – triple store DB
- Formalismes descriptifs génériques
- Requêtes RDF Query - SPARQL
Ressources lexico-sémantiques
Les ressources lexico-sémantiques sont un élément indispensable à une approche des données basées sur les connaissances. Ils contiennent la sémantique et permettent la mise en relation cohérente des données générées dans le milieu de la santé. La création et l'entretien de ces ressources sont un rôle majeur de ce domaine.
- Documents cliniques annotés et classifiés manuellements
- Larges corpus d’expressions multicodées manuellement
- Questionnaires cliniques manuellement codés en SNOMED-CT : français, allemand, italien, anglais, grec.