Solutions Connect it

Academos

Comment utiliser le Text Mining pour comprendre son entreprise

Utilisation de techniques de Text Mining pour segmenter automatiquement des milliers de mentors en catégories homogènes et améliorer les recommandations aux jeunes.

135 000
utilisateurs sur la plateforme
<100
catégories homogènes créées
IA
segmentation automatisée par Text Mining

Informations client

Industrie
Application de mentorat
Localisation
Montréal
Taille
OBNL — 135 000 utilisateurs
Services
Intelligence d'affaires Science des données
Academos

La problématique d'affaires

Fondé en 1999, Academos est un organisme à but non lucratif qui connecte les jeunes de 14 à 30 ans avec la réalité du monde du travail grâce à une application de mentorat virtuel qui leur permet de dialoguer gratuitement avec des milliers de professionnels passionnés par leur métier.

Pour trouver un mentor, les jeunes doivent utiliser une barre de recherche et entrer des mots-clés. L'algorithme leur suggère alors des profils contenant ces mots-clés. Si un jeune recherche « médecine », les profils des médecins vont sûrement l'intéresser, mais peut-être aussi ceux des pharmaciens, psychologues et autres professionnels de la santé l'intéresseraient encore davantage!

Avec des milliers de mentors inscrits sur l'application, impossible de faire la segmentation à la main. Il fallait trouver une façon d'apprendre à l'ordinateur quels mentors sont semblables.

Défis principaux

Recherche par mots-clés trop limitée pour découvrir des profils connexes
Impossible de segmenter manuellement des milliers de mentors
Le regroupement par diplômes échoue à cause des reconversions professionnelles et parcours atypiques
Les intitulés de poste (4-5 mots) ne contiennent pas assez d'information pour un regroupement fiable

La solution mise en œuvre

Utilisation de techniques de Text Mining pour regrouper les profils semblables en exploitant les centaines de mots contenus dans les descriptions rédigées par les mentors à leur inscription : description de leur travail, journée typique, points forts et points moins appréciés de leur emploi.

Notre hypothèse : les mentors utilisant des mots semblables dans ces descriptions occupent probablement un poste semblable. Après plusieurs heures de nettoyage de données, de transformations et de perfectionnement d'algorithmes, nous avons obtenu un résultat convaincant.

Deux pistes de solutions plus simples (regroupement par diplômes et par mots-clés des intitulés de poste) ont d'abord été évaluées et écartées, confirmant la nécessité d'une approche de Text Mining plus sophistiquée.

Analyse de données textuelles (Text Mining)

Extraction de connaissances à partir des textes rédigés par les mentors pour identifier des similarités entre profils.

Segmentation automatique

Regroupement algorithmique des milliers de mentors en catégories homogènes basées sur le lexique utilisé dans leurs descriptions.

Distinction fine des métiers

L'algorithme est capable de distinguer des nuances, comme les métiers physiques de la construction vs ceux liés à la conception et aux plans.

Recommandations améliorées

Les résultats permettent de recommander des profils semblables en termes d'intérêts mais différents en termes d'emplois.

Les résultats

L'algorithme est en mesure de segmenter les mentors en groupes uniformes. Certains groupes sont assez évidents et d'autres sont plus surprenants mais logiques : les artistes de textures, producteurs cinématiques et animateurs 3D regroupés en « Arts Visuels »; les scrum masters, architectes de solutions et développeurs en « Logiciel »; les linguistes, rédactrices et traducteurs sous « Langues »; les physiothérapeutes, orthophonistes et intervenants en zoothérapie sous « Relation d'aide ».

Les milliers de mentors ont pu être regroupés dans moins d'une centaine de catégories homogènes. Academos est maintenant en mesure de mieux connaître les thématiques abordées par ses mentors, de concentrer ses efforts pour recruter dans les catégories sous-représentées et d'améliorer ses suggestions aux jeunes.

1000+
mentors segmentés automatiquement
<100
catégories homogènes identifiées
100%
automatisé par intelligence artificielle

Technologies utilisées

Python Text Mining NLP

Prêt à obtenir des résultats similaires ?

Discutons de comment nous pouvons transformer votre entreprise.

Discutez avec notre équipe