Interview

Charlotte Samson – Datascientist chez Intellig’IA

Par Juliette Feller

1. Peux-tu te présenter en quelques mots ?

Je suis Charlotte Samson, je suis Datascientist TAL chez Intellig’IA depuis un peu plus d’un an.

2. Quel est ton parcours ?

J’ai fait un bac S section internationale allemand et ensuite j’ai fait math info sciences du langage, d’abord à Lyon, puis à Paris. Ensuite j’ai fait une L3 et un Master informatique linguistique qui m’ont permis de faire plusieurs stages dans différents domaines. Aussi bien l’ENS que dans une Civic Tech que dans une entreprise Big Data et enfin chez Intellig’IA.

3. Comment es-tu arrivée chez Intellig’IA ?

J’ai fait mon stage de M2 de six mois chez Intellig’iA et je suis restée par la suite.

4. Quelle est ta mission ?

Ma mission chez Intellig’IA c’est d’extraire les informations clés des états hypothécaires, les relations aussi qu’ont ces informations clés entre elles, et donc de partir des données non structurées de l’état hypothécaire et de retrouver une forme, une structure avec ces informations.

5. Comment accomplis-tu cette mission ?

Avec un mélange plusieurs techniques. Il va y avoir aussi bien du Machine Learning pour certaines extractions d’informations, que des règles pour d’autres, qui vont mélanger plein de caractéristiques du texte et des données. Donc ça va être aussi bien des coordonnées, que leur forme avec des expressions régulières, que les positions relatives entre elles. Enfin, ça va regrouper plusieurs éléments pour pouvoir les extraire.

6. Qu’est-ce-que le TAL ?

Le TAL, c’est le traitement automatique des langues, ou le traitement automatique du langage naturel. C’est un domaine qui allie l’informatique, l’intelligence artificielle et la linguistique. C’est, en fait, dès qu’une machine doit traiter, interpréter, du langage naturel, que cela va être mis en place. En fait, c’est un domaine qui regroupe plein de choses et qui est présent dans la vie de tous les jours, plus qu’on ne le pense. Aussi bien de la voix d’un GPS, que la traduction automatique, que la correction orthographique par exemple sur un téléphone. Cela regroupe plein de domaines.

7. La plus grande difficulté pour extraire les données d’un EHF ?

La plus grande difficulté, c’est le fait qu’il y ait beaucoup de cas particuliers auxquels il faut faire attention. Donc ne pas faire des choses trop génériques ou bien prendre en compte ces cas particuliers. Et aussi le fait que, mis à part au niveau de certaines parties comme des compléments, on n’a pas réellement du langage naturel. On a par exemple des tableaux, mais qu’on ne peut pas extraire sous forme directement de tableaux donc qu’il faut reconstruire. On n’a pas une réelle syntaxe, donc ce sont toutes ces choses là qui nous obligent à choisir des techniques un peu différentes.

8. Ce dont tu es la plus fière au sein de ta mission ?

Le fait de m’être familiarisée avec des concepts du notariat pour pouvoir extraire correctement les informations qui étaient nécessaires et peut être aussi le fait d’avoir dû m’éloigner des techniques classiques et d’avoir su rebondir pour essayer d’autres techniques qui étaient plus adaptées aux EHF.

9. Un exemple de fonctionnalité présente ?

Il va déjà y avoir les références cadastrales, les lots et les volumes associés à ces références. On va avoir une arborescence qui permet de visualiser les divisions, les remembrements et les changements de désignation des références cadastrales. On va aussi avoir la détection de servitudes et de beaucoup d’éléments.

10. Un gros projet sur lequel tu travailles et qui verra le jour cette année ?

C’est la sortie de la V1 d’Intellig’IA et par la suite j’espère aussi l’intégration d’autres éléments sur lesquels on est en train de travailler.

Aucun commentaire publié

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

#Communiqué de presse

#Communiqué de presse Notre communiqué de presse est sorti ! 🤩 📕 Carnet de bord d’un bien immobilier qui[…]

Interview de Ouarda Fenek – Data Scientist

Interview Ouarda Fenek – Data Scientist chez Intellig’IA 1. Peux-tu te présenter en quelques mots ? Je m’appelle Ouarda[…]

Les réponses d’Intellig’IA face au paradoxe de la digitalisation des EHF

Les réponses d’Intellig’IA face au paradoxe de la digitalisation des EHF Dans l’article précédent, nous déclinions l’ensemble des difficultés[…]