Data Scientist

Chercheur spécialisé en analyse de documents et données

Recherche (R&D)
Data Science
Machine Learning et Deep Learning
Ingénierie

Docteur ès sciences, mention informatique, je suis spécialisé dans le traitement automatique des langues et l’analyse de données via des méthodes statistiques, numériques et d’IA. Je suis actuellement data scientist à la MAIF et spécialisé dans l’analyse de documents.

Ma rencontre avec l’informatique a eu lieu à l’âge de 16 ans. J’ai débuté comme contributeur à des projets de logiciel libre (Ubuntu, GNOME, Wikipédia, etc.) et me suis dirigé vers des études dans ce domaine. Parallèlement à celles-ci, j’ai co-construit des projets, associatifs, bénévoles ou professionnels. Depuis 2021, je m’implique davantage dans le projet GNOME. Je suis co-responsable de l’ingénierie d’une application dédiée à la traduction pour laquelle j’assure les services de mise en production et d’assurance qualité.

Passionné par l’ingénierie informatique et la science des données, je me distingue du développeur par ma capacité à prendre du recul, à organiser et évaluer sur le temps long, à assurer des niveaux de qualité de production et à faire intervenir les bonnes compétences. La veille est une force essentielle de ce travail, alliée à la formation des membres de l’équipe afin d’en tirer le meilleur, à la fois sur le plan professionnel et humain.

J’ai animé des conférences, encadré des groupes de travail, initié des projets, formé des publics variés et vulgarisé des travaux scientifiques et techniques. Tout un ensemble de compétences que je souhaite exploiter et continuer à développer au long de ma vie professionnelle.

Docteur ès sciences, mention informatique, je suis spécialisé dans le traitement automatique des langues et l’analyse de données via des méthodes statistiques, numériques et d’IA. Je suis actuellement data scientist à la MAIF et spécialisé dans l’analyse de documents. J’ai co-construit des projets, associatifs, bénévoles ou professionnels. Depuis 2021, je m’implique davantage dans le projet GNOME. Je suis co-responsable de l’ingénierie d’une application dédiée à la traduction pour laquelle j’assure les services de mise en production et d’assurance qualité.

Data Scientist et Ingénieur

MAIF − DataFactory

Depuis janvier 2024

Data Science Machine Learning et Deep Learning Ingénierie
Logo de la MAIF
J’exerce comme data scientist au sein d’une équipe dédiée à l’analyse de documents et d’images. Nous traitons divers cas d’études comme le routage des communications entrantes à la MAIF et je suis impliqué dans les problématiques de computer vision générales qui concernent tous types de documents et pour n’importe quels usages. Je suis impliqué dans la démarche OpenSource promue par la MAIF, visant à construire et partager des communs numériques.

R&D : extraction d’informations depuis des documents manuscrits

ADERA − Hébergé au Laboratoire informatique (L3i) de l’Université de La Rochelle

Octobre 2022 − Décembre 2023

Recherche (R&D) Data Science Machine Learning et Deep Learning Ingénierie
Logo de l’ADERA
J’exerce en qualité de chercheur spécialisé dans l’analyse de documents patrimoniaux. Pour ce projet, j’analyse les numérisations des tables de recensement patrimoniales (les registres d’état civil manuscrits des années 1600 à la pré-numérisation). Il est réalisé en collaboration avec une entreprise spécialisée dans l’analyse de documents historiques.

Ingénieur responsable de logiciel

Fondation GNOME − Indépendant

Depuis mai 2021

Ingénierie Internationalisation Logiciel libre Conception UX/UI
Logo du projet GNOME
Je suis co-responsable de l’application utilisée par les équipes de traduction du bureau GNOME. Je suis chargé de la résolution des problèmes, de l’ingéniérie et du développement de nouvelles fonctionnalités. J’ai mis en place une démarche de DevOPS pour assurer la mise en production et l’assurance qualité. Je participe également au développement de nouvelles fonctionnalités et à d’autres projets au sein de GNOME.

R&D : propagation de l’information dans la presse ancienne

Laboratoire informatique (L3i) de l’Université de La Rochelle

Octobre 2019 − Novembre 2022

Recherche (R&D) Data Science Machine Learning et Deep Learning Traitement des langues (NLP) Ingénierie Logiciel libre
Logo du Laboratoire Informatique, Image et Interactions (L3i) de Université de La Rochelle

J’ai exercé la fonction de chercheur en informatique, en préparation de ma thèse de doctorat. Je me suis spécialisé dans l’analyse de documents textuels et de données numériques. J’ai analysé la presse historique afin d’extraire les événements qui y sont mentionnés pour créer des chronologies et étudier la propagation de l’information.

Mes compétences en ingéniérie ont fortement contribué à ce projet : j’ai développé, mis en production et publié mes programmes pour qu’ils soient utilisés par ma communauté scientifique.

Le tapuscrit de thèse ainsi que la vidéo de la soutenance sont publics et accessibles via une page dédiée.

Création d’une plate-forme pédagogique pour les milieux éducatifs (Koala LMS)

Le LORIA, Laboratoire Lorrain de recherche en informatique

Février 2019 − Décembre 2021

Recherche (R&D) Data Science Ingénierie Logiciel libre Conception UX/UI
Logo du projet Koala LMS

J’ai été pendant deux ans le créateur et l’ingénieur responsable d’une plate-forme de gestion de contenus pédagogiques : Koala LMS. J’ai créé cet environnement applicatif à la fin de mes études, au sein du laboratoire Le Loria à Nancy.

J’ai co-fondé l’association qui a pérénisé le projet sur presque deux ans. J’ai entièrement conçu l’environnement, de l’analyse du besoin auprès des utilisateurs au développement des éléments logiciels et des supports de communication. J’étais également responsable de la mise en production de notre produit. Notre outil, un logiciel libre, a été utilisé et testé auprès de divers groupes d’étudiants à Nancy.

Archives

R&D : suivi de personnes en intérieur par la technologie Bluetooth

Laboratoire informatique (L3i) de l’Université de La Rochelle

Avril − Juillet 2018

Recherche (R&D) Data Science Machine Learning et Deep Learning Ingénierie
Logo du Laboratoire Informatique, Image et Interactions (L3i) de Université de La Rochelle
Conception et développement d’outils de suivi de visiteurs dans un musée. Ces derniers, équipés de badges Bluetooth sont identifiés par des capteurs disséminés dans le musée. J’ai développé des programmes (collecte de données et analyse), concu et déployé une architecture réseau et l’ai pérénisée (au travers l’orchestrateur Ansible) avec une remontée d’information assurée par une pile ElasticSearch.

R&D : analyse de données issues de réseaux sociaux pour les sciences humaines

Laboratoire informatique (L3i) de l’Université de La Rochelle

Avril − Juin 2017

Recherche (R&D) Data Science Machine Learning et Deep Learning Ingénierie
Logo du Laboratoire Informatique, Image et Interactions (L3i) de Université de La Rochelle
Développement d’outils d’extraction d’utilisateurs de réseaux sociaux pour leur classification automatisée. Nous cherchions à isoler des comportements ou attributs communs d’utilisateurs pour les analyser à travers leurs interactions. J’ai travaillé durant dix semaines en encadrant un stagiaire étranger, en lui apprenant des techniques de gestion de projet, d’écoute de demande client et de génie logiciel.

Développement de logiciel de déploiement de systèmes d’exploitation

DSI (Direction du système d’information) de l’Université de La Rochelle

Avril − Juin 2016

Ingénierie
Logo de Université de La Rochelle
Développement de l’outil de déploiement de systèmes d’exploitation de l’Université de La Rochelle. Le logiciel permet de programmer l’installation et la mise à jour d’images de systèmes d’exploitation sur les milliers de postes du parc informatique. Le système complet permet la réinstallation des systèmes GNU/Linux et est écrit en langage Bash. C’est un système analogue à Kickstart de RedHat™.

Thèse de doctorat - Mention Informatique

Université de La Rochelle - Laboratoire L3i

Octobre 2019 − Novembre 2022

Recherche (R&D) Data Science Machine Learning et Deep Learning Traitement des langues (NLP)
Logo de l’Université de La Rochelle
Inscrit à l’Université de La Rochelle, et membre du laboratoire d’informatique, le L3i (Informatique, Images et Interactions), équipe « Documents et contenus numériques » ainsi que « Modèles et connaissances ».

Master Informatique - Parcours « Données »

Université de La Rochelle - Faculté des Sciences et Technologies

2017 − 2019

Major de promotion Data Science Ingénierie
Logo de Université de La Rochelle
Master obtenu avec la mention très bien. Formation orientée traitement de données et gestion des systèmes d’information. J’ai suivi développé de nouvelles compétences en dématérialisation, fouille de données, big-data et analyse de données.

Archives

Licence - Mention informatique

Université de La Rochelle - Faculté des Sciences et Technologies

2016 − 2017

Major de promotion Formation technique
Logo de Université de La Rochelle
Obtenu avec la mention bien (moyenne > 15,50 sur les deux semestres). Formation en une année qui comprend des modules de structure de données et de programmation C/C++, de théorie autour de la compilation, de programmation logique, sécurité des réseaux et interfaces homme-machines.

DUT Informatique - Cursus Génie informatique

Université de La Rochelle - IUT Informatique

2014 − 2016

Major de promotion Formation technique
Logo de Université de La Rochelle
Major de « Parcours Génie Logiciel » (moyenne des quatre semestres > 15). Formation de deux ans de technicien en informatique aux multiples compétences : développement web et orienté objet avec utilisation de SDK (Java, Qt), gestion avancée de bases de données (Oracle SQL, MySQL), modélisation UML et BPM et génie logiciel, gestion de projet Agile - niveau d’anglais technique avancé. La formation intégrait également des enseignements de droit, mathématiques, économie, comptabilité et gestion d’entreprise.

Text Line Detection in Historical Index Tables: Evaluations on a New French PArish REcord Survey Dataset (PARES)

International Conference of Asia in Digital Libraries (ICADL 2023)

Décembre 2023


Participation à la conférence ICADL 2023 pour la publication d’un jeu de données (HAL: hal-04207205v2), PARES (Parish Record Survey) contenant des images inédites de registres de recensement paroissiaux utilisés par l’INED pour réaliser des analyses démographiques sur les 17e au 20e siècles. En plus de ce jeu de données sont associées des expériences relatives à l’extraction des lignes des tableaux.

Auteurs : Guillaume Bernard, Casey Wall, Mélodie Boillet, Mickaël Coustaty, Christopher Kermorvant, Antoine Doucet

Un moteur de recherche d’événements pour explorer la presse numérique ou historique

Congrès INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 2023)

Mai 2022


Logo du congrès INFORSID 2023
Publication d’une démonstration à l’issue d’un travail de stage (HAL: hal-04113008v1) réalisé par un étudiant de l’université de Bordeaux. Ce travail est issue des travaux de thèse mentionnés plus bas.

Détection et suivi d’événements dans des documents de presse historique

Université de La Rochelle

Novembre 2022


Logo de Université de La Rochelle
Manuscrit de thèse de doctorat (informations complètes sur la page dédiée) portant sur la détection et le suivi des événements rapportés dans la presse historique (1850 − 1950). C’est-à-dire de trier chronologiquement des événements détectés par des outils d’IA pour reconstruire une histoire complète, de l’origine des événements aux débouchées journalistiques.

Tracking news stories in short messages in the era of infodemic

Conference and Labs of the Evaluation Forum (CLEF 2022)

Septembre 2022


Logo de la conférence CLEF 2022

Participation à la conférence CLEF 2022 pour la publication d’algorithmes de suivi d’événements mentionnés dans la presse, et spécifiquement dans des textes courts (tels des télégrammes). Cette publication est associée au partage de l’ensemble des codes sources, des données et des résultats obtenus.

Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher et Antoine Doucet

Event Related Document Retrieval with Multilingual Real World Event Representation

20th International Semantic Web Conference (Core A)

Octobre 2021


Logo de la conférence ISWC 2021

Participation à la conférence ISWC 2021 pour une démonstration d’une plate-forme permettant la recherche de documents à partir d’une représentation d’événement. Cette démonstration est un moteur de recherche documentaire et sémantique permettant la recherche de documents de presse associés à des événements du monde réel. Ce travail a été réalisé lors d’une mobilité en Espagne, à Valencía, durant trois mois.

Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher, Paolo Rosso et Antoine Doucet

A Comprehensive Extraction of Relevant Real-World-Event Qualifiers for Semantic Search Engines

Linking Theory and Practice of Digital Libraries (Core B)

Septembre 2021


Logo de la conférence TPDL 2021

Participation à la conférence TPDL 2021 avec la publication d’un papier long. Cet article traite de la caractérisation des événements du quotidien (domaine électoral, catastrophes naturelles, etc) par des bases de connaissances telles Wikipedia et Wikidata.

Auteurs : Guillaume Bernard, Cyrille Suire, Cyril Faucher et Antoine Doucet

Towards reconstruction of human trajectories in indoor environments

21st International Conference on Knowledge Engineering and Knowledge Management (Core B)

Novembre 2018


Logo de la conférence EKAW 2018

J’ai participé à la conférence EKAW en 2018 pour y présenter un poster présentant des techniques de suivi de personnes en intérieur par la technologie Bluetooth.

Auteurs : Guillaume Bernard, Cyril Faucher, Karell Bertet

Développement opérationnel (DevOPS)

IUT de La Rochelle − Département informatique

Années 2020, 2021, 2022

Formation technique Ingénierie BAC+2 / BAC+3
Logo de l’IUT Informatique de La Rochelle
Responsabilité pédagogique du module de développement opérationnel qui, sur 8 semaines a consisté à former les étudiants aux problématiques de DevOPS. Centré sur la pratique, les étudiants étaient mis dans une situation proche de la réalité (vie d’un projet préexistant). Ils devaient reprendre les différentes étapes du cycle DevOPS et notamment créer des pipeline d’intégration continue et de déploiement continu à l’aide de Gitlab CI. Le déploiement et la surveillance du système s’est effectué sur Microsoft Azure.

Analyse de données massives

IUT de La Rochelle − Département informatique

Années 2020, 2021, 2022

Formation technique Data Science Traitement des langues (NLP) BAC+2 / BAC+3
Logo de l’IUT Informatique de La Rochelle
Préparation d’une partie de cours et enseignement sur 8 semaines. Les étudiants ont été initiés à l’analyse de données avec Python. Ils ont travaillé en grande partie sur les problématiques de traitement du langage naturel. Le cours a consisté à les former sur les notions de traitement de contenus textuels (nettoyage, normalisation, etc.) et l’interprétation des contenus (méthodes TF-IDF, analyse LDA, etc). Le cours s’est terminé sur un projet de 2 semaines pour lequel les étudiants devaient choisir leur propre jeu de données et fournir une analyse complète de son contenu.

Conception et programmation objet

IUT de La Rochelle − Département informatique

Années 2019 et 2020

Formation technique Ingénierie BAC+2 / BAC+3
Logo de l’IUT Informatique de La Rochelle
Intervention sur des séances de TD et de TP pour apporter aux étudiants des notions relatives à l’architecture logicielle (conception et développement de ces architecture, patrons de conception adaptés, etc). Introduction au développement piloté par les tests et à la notion de qualité de code.

Archives

Formation d’étudiants de DUT Informatique

Université de La Rochelle − IUT

2015 − 2019


Logo de Université de La Rochelle
J’ai accompagné durant quatre ans des groupes d’étudiants de DUT Informatique en leur proposant des nouveaux sujets de travaux pratiques en accord avec leur programme : programmation orientée objet (héritages, implémentations d’interfaces, création d’algorithmes, etc), administration de systèmes Unix ou gestion base de données et développement Web.

Anglais britannique professionnel et quotidien

Drapeau de la Grande-Bretagne
Pratique de l’anglais britannique professionnel au quotidien par la lecture, la conversation et l’écriture. Les documents scientifiques que je rédige sont en anglais ainsi que nombre de mes interlocuteurs scientifiques ou associatifs.

Espagnol

Drapeau de l’Espagne

J’étudie l’espagnol depuis 2018, en autodidacte en suivant la méthode ASSIMIL.

Dans le cadre de ma thèse, j’ai réalisé une mobilité de 10 semaines à València (Espagne) au sein de l’Universitat Politècnica de València. J’ai suivi des cours qui me certifient un niveau équivalent à A2.3 du cadre européen.

Traducteur / Relecteur / Commiteur

Fondation GNOME

Depuis 2014


Logo de la fondation GNOME

Ma contribution au projet GNOME s’articule principalement sur la traduction de l’écosystème GNOME et de sa documentation. Cela inclut des composants comme le Shell, Machines, Agenda, Terminal. Au delà, je suis également le mainteneur de la traduction de Liferea, un lecteur de flux RSS.

Je fais partie, depuis 2020 de la Fondation GNOME qui gère les orientations du projet sur le long terme.

Rédacteur / Relecteur / Correcteur bénevole

Wikimédia France

Depuis 2013


Logo de Wikipédia
Je contribue durant mon temps libre à certaines sections de la Wikipedia française, par des ajouts et corrections diverses. Depuis 2015, après avoir réalisé plus de 500 modifications, je suis devenu patrouilleur et m’attache d’avantage à surveiller les modifications des nouveaux venus, de la mise en forme, de l’ajout de sources, du formatage d’éléments du wiki.

Mainteneur de carte / Maper

OpenStreetMap

Depuis 2013


Logo d’OpenStreetMap
Je me suis impliqué en 2013 dans le projet OpenStreetMap avec l’envie de cartographier et répertorier le plus d’éléments possibles de mon village. Depuis mon arrivée à La Rochelle, je m’occupe du secteur des Minimes et surveille les modifications du centre-ville. Je profite de mes déplacement pour apporter des corrections là où c‘est possible.

Archives

Trésorier de Koala Éduc (2019 - 2021)

Association Koala Éduc

Mai 2019 − Décembre 2021


Logo de l’association Koala Éduc
J’ai co-fondé l’association Koala Éduc en 2019 dans le cadre de mon stage de M2 pour soutenir et pérenniser le développement de son projet Koala LMS. La structure propose un accompagnement pour la mise en place de nouvelles pratiques pédagogiques à la fois numériques et physiques. Elle accueille des stagiaires de DUT et plus pour leur permettre de se former dans un environnement de travail concret, complet et professionnel.

Président d’association (2016 - 2017) puis Sécrétaire (2017 - 2018)

Association Rochelug

Septembre 2016 − Novembre 2018


Logo de l’association Rochelug
L’association Rochelug est un groupe d’utilisateurs de Linux et de logiciels libres dans la communauté d’agglomération de La Rochelle. Les rencontres entre les membres ont lieu deux fois par mois, et sont l’occasion de discuter d’informatique libre, de Linux entre passionnés.