Data Scientist
Chercheur spécialisé en analyse de documents et données
Recherche (R&D)
Data Science
Machine Learning et Deep Learning
Ingénierie
Docteur ès sciences, mention informatique, je suis spécialisé dans le traitement automatique des langues et l’analyse de données via des méthodes statistiques, numériques et d’IA. Je suis actuellement data scientist à la MAIF et spécialisé dans l’analyse de documents.
Ma rencontre avec l’informatique a eu lieu à l’âge de 16 ans. J’ai débuté comme contributeur à des projets de logiciel libre (Ubuntu, GNOME, Wikipédia, etc.) et me suis dirigé vers des études dans ce domaine. Parallèlement à celles-ci, j’ai co-construit des projets, associatifs, bénévoles ou professionnels. Depuis 2021, je m’implique davantage dans le projet GNOME. Je suis co-responsable de l’ingénierie d’une application dédiée à la traduction pour laquelle j’assure les services de mise en production et d’assurance qualité.
Passionné par l’ingénierie informatique et la science des données, je me distingue du développeur par ma capacité à prendre du recul, à organiser et évaluer sur le temps long, à assurer des niveaux de qualité de production et à faire intervenir les bonnes compétences. La veille est une force essentielle de ce travail, alliée à la formation des membres de l’équipe afin d’en tirer le meilleur, à la fois sur le plan professionnel et humain.
J’ai animé des conférences, encadré des groupes de travail, initié des projets, formé des publics variés et vulgarisé des travaux scientifiques et techniques. Tout un ensemble de compétences que je souhaite exploiter et continuer à développer au long de ma vie professionnelle.
Data Scientist et Ingénieur
MAIF − DataFactory
Depuis janvier 2024
R&D : extraction d’informations depuis des documents manuscrits
ADERA − Hébergé au Laboratoire informatique (L3i) de l’Université de La Rochelle
Octobre 2022 − Décembre 2023
Ingénieur responsable de logiciel
Fondation GNOME − Indépendant
Depuis mai 2021
R&D : propagation de l’information dans la presse ancienne
Laboratoire informatique (L3i) de l’Université de La Rochelle
Octobre 2019 − Novembre 2022
J’ai exercé la fonction de chercheur en informatique, en préparation de ma thèse de doctorat. Je me suis spécialisé dans l’analyse de documents textuels et de données numériques. J’ai analysé la presse historique afin d’extraire les événements qui y sont mentionnés pour créer des chronologies et étudier la propagation de l’information.
Mes compétences en ingéniérie ont fortement contribué à ce projet : j’ai développé, mis en production et publié mes programmes pour qu’ils soient utilisés par ma communauté scientifique.
Le tapuscrit de thèse ainsi que la vidéo de la soutenance sont publics et accessibles via une page dédiée.
Création d’une plate-forme pédagogique pour les milieux éducatifs (Koala LMS)
Le LORIA, Laboratoire Lorrain de recherche en informatique
Février 2019 − Décembre 2021
J’ai été pendant deux ans le créateur et l’ingénieur responsable d’une plate-forme de gestion de contenus pédagogiques : Koala LMS. J’ai créé cet environnement applicatif à la fin de mes études, au sein du laboratoire Le Loria à Nancy.
J’ai co-fondé l’association qui a pérénisé le projet sur presque deux ans. J’ai entièrement conçu l’environnement, de l’analyse du besoin auprès des utilisateurs au développement des éléments logiciels et des supports de communication. J’étais également responsable de la mise en production de notre produit. Notre outil, un logiciel libre, a été utilisé et testé auprès de divers groupes d’étudiants à Nancy.
Archives
R&D : suivi de personnes en intérieur par la technologie Bluetooth
Laboratoire informatique (L3i) de l’Université de La Rochelle
Avril − Juillet 2018
R&D : analyse de données issues de réseaux sociaux pour les sciences humaines
Laboratoire informatique (L3i) de l’Université de La Rochelle
Avril − Juin 2017
Développement de logiciel de déploiement de systèmes d’exploitation
DSI (Direction du système d’information) de l’Université de La Rochelle
Avril − Juin 2016
Thèse de doctorat - Mention Informatique
Université de La Rochelle - Laboratoire L3i
Octobre 2019 − Novembre 2022
Master Informatique - Parcours « Données »
Université de La Rochelle - Faculté des Sciences et Technologies
2017 − 2019
Archives
Licence - Mention informatique
Université de La Rochelle - Faculté des Sciences et Technologies
2016 − 2017
DUT Informatique - Cursus Génie informatique
Université de La Rochelle - IUT Informatique
2014 − 2016
Text Line Detection in Historical Index Tables: Evaluations on a New French PArish REcord Survey Dataset (PARES)
International Conference of Asia in Digital Libraries (ICADL 2023)
Décembre 2023
Participation à la conférence ICADL 2023 pour la publication d’un jeu de données (HAL: hal-04207205v2), PARES (Parish Record Survey) contenant des images inédites de registres de recensement paroissiaux utilisés par l’INED pour réaliser des analyses démographiques sur les 17e au 20e siècles. En plus de ce jeu de données sont associées des expériences relatives à l’extraction des lignes des tableaux.
Auteurs : Guillaume Bernard, Casey Wall, Mélodie Boillet, Mickaël Coustaty, Christopher Kermorvant, Antoine Doucet
Un moteur de recherche d’événements pour explorer la presse numérique ou historique
Congrès INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 2023)
Mai 2022
Détection et suivi d’événements dans des documents de presse historique
Université de La Rochelle
Novembre 2022
Tracking news stories in short messages in the era of infodemic
Conference and Labs of the Evaluation Forum (CLEF 2022)
Septembre 2022
Participation à la conférence CLEF 2022 pour la publication d’algorithmes de suivi d’événements mentionnés dans la presse, et spécifiquement dans des textes courts (tels des télégrammes). Cette publication est associée au partage de l’ensemble des codes sources, des données et des résultats obtenus.
Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher et Antoine Doucet
Event Related Document Retrieval with Multilingual Real World Event Representation
20th International Semantic Web Conference (Core A)
Octobre 2021
Participation à la conférence ISWC 2021 pour une démonstration d’une plate-forme permettant la recherche de documents à partir d’une représentation d’événement. Cette démonstration est un moteur de recherche documentaire et sémantique permettant la recherche de documents de presse associés à des événements du monde réel. Ce travail a été réalisé lors d’une mobilité en Espagne, à Valencía, durant trois mois.
Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher, Paolo Rosso et Antoine Doucet
A Comprehensive Extraction of Relevant Real-World-Event Qualifiers for Semantic Search Engines
Linking Theory and Practice of Digital Libraries (Core B)
Septembre 2021
Participation à la conférence TPDL 2021 avec la publication d’un papier long. Cet article traite de la caractérisation des événements du quotidien (domaine électoral, catastrophes naturelles, etc) par des bases de connaissances telles Wikipedia et Wikidata.
Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher et Antoine Doucet
Towards reconstruction of human trajectories in indoor environments
21st International Conference on Knowledge Engineering and Knowledge Management (Core B)
Novembre 2018
J’ai participé à la conférence EKAW en 2018 pour y présenter un poster présentant des techniques de suivi de personnes en intérieur par la technologie Bluetooth.
Auteurs : Guillaume Bernard, Cyril Faucher, Karell Bertet
Développement opérationnel (DevOPS)
IUT de La Rochelle − Département informatique
Années 2020, 2021, 2022
Analyse de données massives
IUT de La Rochelle − Département informatique
Années 2020, 2021, 2022
Conception et programmation objet
IUT de La Rochelle − Département informatique
Années 2019 et 2020
Archives
Formation d’étudiants de DUT Informatique
Université de La Rochelle − IUT
2015 − 2019
Anglais britannique professionnel et quotidien
Espagnol
J’étudie l’espagnol depuis 2018, en autodidacte en suivant la méthode ASSIMIL.
Dans le cadre de ma thèse, j’ai réalisé une mobilité de 10 semaines à València (Espagne) au sein de l’Universitat Politècnica de València. J’ai suivi des cours qui me certifient un niveau équivalent à A2.3 du cadre européen.
Traducteur / Relecteur / Commiteur
Fondation GNOME
Depuis 2014
Ma contribution au projet GNOME s’articule principalement sur la traduction de l’écosystème GNOME et de sa documentation. Cela inclut des composants comme le Shell, Machines, Agenda, Terminal. Au delà, je suis également le mainteneur de la traduction de Liferea, un lecteur de flux RSS.
Je fais partie, depuis 2020 de la Fondation GNOME qui gère les orientations du projet sur le long terme.
Rédacteur / Relecteur / Correcteur bénevole
Wikimédia France
Depuis 2013
Mainteneur de carte / Maper
OpenStreetMap
Depuis 2013
Archives
Trésorier de Koala Éduc (2019 - 2021)
Association Koala Éduc
Mai 2019 − Décembre 2021
Président d’association (2016 - 2017) puis Sécrétaire (2017 - 2018)
Association Rochelug
Septembre 2016 − Novembre 2018