Offers “SNCF”

Pourvu SNCF

STAGE 3 - DATASCIENCE AU SEIN DE SNCF RESEAU H/F

  • Stage
  • Saint-Denis (Seine-Saint-Denis)
  • IT development

Position filled!

Job description



Vos missions

Sujet 3 : Analyse textuelle des documents de prescription
Afin d’assurer la sécurité des circulations sur le réseau ferroviaire français, SNCF Réseau a rédigé au fil des années une très grande quantité de textes de prescription. Ces documents sont de natures et de consistances variées : procédures métiers, règles de conception ou de maintenance, textes de haut niveau, …

Le volume de textes a fortement augmenté au cours du temps, ce qui rend sa gestion de plus en plus complexe : textes qui font référence les uns aux autres, mises à jour partielles voire contradictoires… Les textes sont également souvent écrits avec un vocabulaire technique en partie spécifique au ferroviaire.

Dans ce cadre, le but du stage sera d’explorer les possibilités offertes par les nouvelles technologies de traitement automatique du langage, pour un corpus de plusieurs centaines de textes, afin de :

identifier le plus automatiquement possible les liens entre les textes
identifier les grands thèmes abordés dans chacun des textes à analyser et cartographier sémantiquement le corpus de texte
créer un moteur de recherche sémantique, permettant d’obtenir une réponse dans un document à partir de mots clés recherchés, voire d’une question posée en langage naturel.

 Le stagiaire pourra s’appuyer sur les différents outils utilisés par l’équipe et certains outils proposés par les plateformes cloud utilisées en interne.

Le stage sera structuré en plusieurs activités :

Etude bibliographique et état de l’art des outils disponibles
Mise en œuvre d’un prototype permettant de tester la meilleure approche retenue
Tests et qualification des résultats
Communication des résultats auprès des différentes parties intéressées en interne

Profil recherché

Bac +4/+5 (école d’ingénieur, cursus universitaire en informatique)
Expérience en traitement automatique du langage souhaitée
Autonomie
Capacité de synthèse et à restituer des résultats  de manière vulgarisée
Curiosité pour des sujets techniques 

Compétences et Qualités souhaitées

·  Bac +4/+5 (école d’ingénieur, cursus universitaire en informatique) Expérience en traitement automatique du langage souhaitée Autonomie Capacité de synthèse et à restituer des résultats  de manière vulgarisée Curiosité pour des sujets techniques

Tous nos métiers sont ouverts aux personnes en situation de handicap.

Utilisation de vos données personnelles

Dans le cadre de notre processus de recrutement, vos données personnelles renseignées sur votre formulaire de candidature font l’objet d’un traitement par les équipes de recrutement de SNCF. Vous pouvez à tout moment, consulter, modifier ou supprimer vos données directement depuis votre compte candidat (NB : cas de suppression, vos données feront l’objet d’un archivage avec accès restreint pour une durée de 5 ans conformément à l’article L1134-5 du code du travail.)
En savoir plus sur l’utilisation des données