{ LAURENT KEVERS,.N+PERS }
Je suis linguiste informaticien et chercheur en traitement automatique du langage (TAL).
Mes diverses expériences professionnelles m'ont amené à m'intéresser plus particulièrement à l'extraction et à la recherche d'information. J'ai eu l'occasion de travailler sur divers problèmes de TAL tels que :
- la constitution de corpus (bruts ou annotés), et d'outils de base pour le TAL;
- l'identification de langue;
- la reconnaissance et l'extraction d'entités nommées;
- l'extraction d'informations spécifiques (temporelles, juridiques);
- la classification automatique de textes;
- la recherche de documents similaires;
- l'accès sémantique aux documents dans le cadre des moteurs de recherche.
Je m'occupe actuellement du développement de ressources et d'outils de TAL pour une langue peu dotée : la langue corse (au sein du Projet BDLC, Univestité de Corse).
Je suis actuellement disponible pour des missions ponctuelles et/ou à temps partiel!
Je vous invite à consulter cette page, ainsi que mes profils Linked in, HAL, Google Scholar ou Academia ou pour en savoir plus.
- Classification automatique de documents textuels (apprentissage artificiel supervisé)
- Détection de documents sémantiquement similaires (apprentissage artificiel non-supervisé)
- Mise au point de ressources linguistiques (français, anglais, néerlandais)
- Extraction de métadonnées (dans la jurisprudence)
- Structuration de documents non-structurés (pour la jurisprudence)
- Linked Data appliqué aux données juridiques (utilisation des technologies du web sémantique pour lier et organiser les documents)
Titre : ”Accès sémantique aux bases de données documentaires. Techniques symboliques de traitement automatique du langage pour l'indexation thématique et l'extraction d'informations temporelles”. Directeur : Cédrick Fairon.
Mémoire de fin d'études : L. Kevers et J.-B. Van Zuylen, Création et exploitation d'archives audiovisuelles numériques.
Promoteur: Jean-Marie Jacquet.
| Kevers L. (2011), Accès sémantique aux bases de données documentaires. Techniques symboliques de traitement automatique du langage pour l'indexation thématique et l'extraction d'informations temporelles, thèse de doctorat en Langues et lettres, Université catholique de Louvain, 31-01-2011. |
(FR) ”Accès sémantique aux bases de données documentaires. Techniques symboliques de traitement automatique du langage pour l'indexation thématique et l'extraction d'informations temporelles”.
Dans le contexte actuel d'une société et d'une économie centrées sur l'information, l'accès à la masse grandissante de documents électroniques est devenu un enjeu capital. De nombreux outils de recherche d'informations se contentent cependant d'un scénario de recherche classique, basé sur les mots. Pourtant, la relation entre un concept et son expression ne se limite pas toujours à un lien unique. Ainsi, un concept peut souvent être désigné par plusieurs expressions (« chômeur » et « demandeur d'emploi »), et inversement, un mot peut aussi parfois désigner plusieurs concepts différents (« carotte » en tant que légume ou en géologie). Afin de gérer cette difficulté, il peut être intéressant de représenter les documents non plus dans un espace de mots, mais dans un espace de concepts.
Dans cette thèse, nous proposons trois façons d'apporter des éléments de sens à la représentation des documents : une méthode de classification supervisée (semi-)automatique de documents, la prise en compte de manière particulière de certains éléments d'informations, comme le temps, et finalement un système d'indexation thématico-temporel qui montre l'intérêt, et les perspectives en termes applicatifs, de cette approche multidimensionnelle et sémantique de l'accès à l'information.
(EN) ”Semantic access to databases of documents. Natural language processing with symbolic techniques for thematic indexation and temporal information extraction”.
Within our information society and economy, access to the growing bulk of electronic documents is a major concern. Surprisingly, information retrieval tools often only work on a classical search scheme, based on words. But, as a matter of fact, the relation between words and concepts can not always be reduced to a single link. A concept can be named by several expressions (« unemployed person » and « job-seeker »), and conversely one word can sometimes depict more than one concept (« carrot » as a vegetable or in geology). To cope with this difficulty, it might be interesting to represent documents in a concepts space in place of a words space.
In this thesis we are proposing 3 methods designed to complete the documents representation with semantic data : a (semi) automatic supervised classification method was set up to index documents, the specific processing of some information items, such as time, and finally a thematic and temporal indexing system that outlines interest and perspectives for applications within this multidimensional and semantic approach.
2015 – Séminaire du Cental : "Étude de cas d'un projet de catégorisation automatique".
2007 – Séminaire du Cental : "Traitement des expressions temporelles dans les dépêches de presse".
2005 – Journées de l'ATALA : "Traitement automatisé du grec ancien et de l’arabe non classique" (avec B. Kindt et L. Tuerlinckx).
2003 – Séminaire du LADL : "La lemmatisation des sources grecques patristiques et byzantines au service d'une description lexicale du grec ancien" (avec B. Kindt).
Membre du comité scientifique pour le volume « SMS Communication : A Linguistic Approach », édition spéciale de Lingvisticæ Investigationes (2012).
Membre du comité d'organisation pour FIL 2010 (Forum des industries de la langue), WAC3 (2007), TALN 2006 et JADT 2004
Les voyages constituent pour moi une occasion unique de combiner plusieurs passions. Randonner au travers d'inoubliables paysages, découvrir des gens et des cultures surprenantes, et tenter de retranscrire toutes ces émotions au moyen de la sérigraphie ou de la photographie. J'ai eu la chance de donner libre cours à ces passions lors d'une année sabbatique (2011-2012) qui m'a permis de visiter plus de 15 pays.
En outre, j'ai également pu randonner et découvrir:
- les Alpes (Massif des Ecrins)
- les Cévennes (chemin de Stevenson)
- les Pyrénées (tour du Mont Perdu)
- la Corse (GR20)
- l'Australie (l'Overland Track, en Tasmanie)
- l'Islande (le Laugavegur, de Landmanalaugar à Þórsmörk)