SemSemi – Groupe d'intérêt

Techniques et applications de la sémantique

Compte-rendu du numéro 0 du séminaire Objets Numériques et Sémantique

| 2 commentaires

La première occurrence su séminaire ‘Objets Numériques et Sémantique‘ a eu lieu le 6 Octobre 2015 à Telecom ParisTech.

Il ne s’agissait pas vraiment d’un premier séminaire, mais plutôt d’un numéro 0, pour initier une dynamique et valider l’idée qu’il y avait là un besoin.

Nous étions 5 à Telecom ParisTech et 2 en visioconférence. 8 autres personnes ou équipes avaient manifesté leur intérêt, mais n’ont pas pu participer pour des questions de calendrier ou à cause de la mise en oeuvre tardive de la vidéoconférence.

Nous avons commencé par une brève présentation des participants:
Jean-Claude Moissinac introduit le séminaire et les motivations pour sa création
Olivier Berger évoque ses travaux relatifs à l’utilisation de la sémantique pour améliorer la collaboration dans des équipes distantes (il a aussi présenté brièvement en fin de séminaire les possibilités de représentation sémantique d’articles scientifiques qu’il utilise)
Gregory Grefenstette évoque ses travaux sur la représentation des données personnelles
Jean-Louis Dessalles évoque ses travaux sur la représentation et l’exploitation des connaissances, qui s’appuient sur l’analyse de la façon dont l’homme assure ces fonctions
Isabelle Bloch évoque ses travaux portant sur l’exploitation de connaissances sur un domaine pour améliorer des résultats en reconnaissance et marquage sémantique d’images
Ces premiers échanges ont déjà donné des pistes pour de prochains séminaires.

Présentation par  Fabian Suchanek

Suit 1/2 h de présentation de résultats de recherche par Fabian Suchanek (https://suchanek.name/talk.html)
La présentation porte d’abord sur la création de Yago, une base de connaissances sur des personnes, des lieux, des faits, similaire à DBPedia, mais présentant la caractéristique, par construction, d’avoir une très grande précision (au sens des termes consacrés de précision et de rappel). Ensuite, diverses possibilités d’exploitation ou d’extension de Yago sont présentées: recensement et description sémantique de nombreux objets décrits sur le Web (projet IBEX), analyses d’une base d’archives du journal Le Monde (projet Semantic Culturomics), méthodes de protection anti-copie d’une base de connaissances publiée,… Des descriptions des différents projets évoqués sont accessibles à partir de cette page.

Présentation par Karima Rafes

Karima présente les possibilités offertes par la Center for Data Science en matière de traitement de données sémantiques, notamment grâce à la mise en oeuvre de triple-store
Concernant les triple-stores, elle présente le système de tests comparatifs, qui peut aider les équipes à choisir l’outil qu’elles souhaitent utiliser. Les résultats sont accessibles ici et sont mis à jour fréquemment.
Un portail permettant de référencer des jeux de données a été créé. Il permet la description de jeux de données qui peuvent être en accès public ou seulement par les participants du CDS. On peut ensuite chercher des jeux de données, par exemples pour trouver des données similaires. L’idée est de rendre accessibles certains jeux de données par d’autres équipes; par exemple, une équipe de traitement de données peut bénéficier des données produites par une équipe réalisant des observations.

Conclusion

Les échanges lors de cette première occurrence ont confirmé l’utilité de créer un mode d’échange entre les personnes impliquées dans le développement des techniques et des applications des représentations sémantiques.

Il va donc falloir pérenniser cette initiative. Les contributeurs sont les bienvenus pour présenter des travaux ou contribuer à la vie de ce réseau.

Contact: Jean-Claude Moissinac

Auteur : Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

2 Commentaires

  1. Pour le pointeur vers nos travaux sur le Linked Data comme perspective d’amélioration de l’ntéropérabilité des outils de développement dans les communautés Open Source (ainsi que l’utilisation de Linked Data pour les articles publiés en preprint) : http://www-public.telecom-sudparis.eu/~berger_o/publications.html

  2. Très intéressant, merci. Désolé de n’avoir pas réussi à rejoindre la vidéoConf !?
    J’espère faire mieux la prochaine fois,…

    BA,

    Gérard

Laisser un commentaire