Interview

Ouarda Fenek – Data Scientist chez Intellig’IA

1. Peux-tu te présenter en quelques mots ?

Je m’appelle Ouarda Fenek et je suis Data Scientist chez Intellig’IA.

2. Quel est ton parcours ?

J’ai fait une licence en informatique, j’ai ensuite développé un grand intérêt
pour l’intelligence artificielle. J’ai donc poursuivi avec un master de datascience à la Sorbonne. J’ai renforcé mon parcours avec des expériences professionnelles, notamment un stage à l’Université de Montréal au Canada, un autre au sein de Huawei Technologies France, tous en relation avec l’intelligence artificielle et la datascience.

3. Comment es-tu arrivée chez Intellig’IA ?

Me retrouver au sein d’Intellig’IA est une suite logique à mon parcours. Nous faisons du traitement automatique du langage et de la reconnaissance de textes manuscrits. Ce sont deux branches de la datascience sur lesquelles j’ai beaucoup travaillé. Je continue à le faire chez Intellig’IA, mais de façon plus ciblée, notamment sur le traitement des documents juridiques.

4. Quelle est ta mission ?

Je travaille notamment sur le traitement de la partie manuscrite des EHF. Avec l’équipe, nous voulons faire une extraction ciblée avec une recherche comparative des éléments présents dans Fidji. Par exemple, si l’on repère une radiation dans Fidji, on va récupérer sa référence d’enliassement qu’on va rechercher dans le stock afin de pouvoir faire le lien entre les deux. Nous travaillons aussi sur l’extraction d’autres informations clés, notamment les servitudes, les réserves, les interdictions et les dates extrêmes d’effet.

5. Comment accomplis-tu cette mission ?

Initialement, nous avons opté pour un modèle préexistant, mais au vu des résultats et de la structure du document, nous avons décidé de construire notre propre modèle. C’est ce que nous avons fait. À titre indicatif, actuellement nous atteignons un taux de réussite de 85% pour l’extraction des références d’enliassement.

6. Quelles difficultés rencontres-tu au sein de ta mission ?

Ce qui rend la tâche difficile dans un premier lieu, c’est la taille des écritures. C’est écrit tellement petit que des fois, nous mêmes, humains, à l’oeil nous avons du mal à les lire. Alors c’est moins évident pour une machine. Ensuite, il y a les différences d’écriture, il y a par exemple différentes façons d’écrire un « P » mais là où ça devient délicat, c’est lorsque les personnes écrivent un « P » qui se rapproche du « F ». C’est d’autant plus difficile pour le modèle de faire la distinction entre les deux. Une autre difficulté consiste en la structure elle même du document. Il est présenté sous forme de colonnes. Des fois, il y a une en-tête, des fois, pas. Il faut pouvoir prendre tout ça en considération lors de l’analyse. Et enfin c’est une tâche difficile, car le langage naturel n’est pas formel. Les personnes utilisent des abréviations, des substitutions et ce n’est pas facile de faire analyser ça par une machine.

7. Quand verra le jour cette évolution ?

Comme vous le savez, la première version d’Intellig’IA est déjà lancée. Nous travaillons actuellement sur l’intégration du traitement de la partie manuscrite. Çela ne va pas tarder à arriver. Restez branchés !

jacktoto

Interview

Ouarda Fenek – Data Scientist chez Intellig’IA

IA explicable : dans les coulisses de notre équipe

IA souveraine pour le notariat et l’immobilier | Intellig’IA

IA et notariat : guide CSN, secret professionnel, conformité | Intellig’IA

Suivez-nous sur les réseaux