AcademosOu comment utiliser le Text Mining pour comprendre son entreprise.
Text Mining chez Academos
OBNL
Type d’entreprise
135 000
Utilisateurs
Application de mentorat
Industrie
Montréal
Siège social
L’entreprise
La problématique d’affaires
Avec plusieurs milliers de mentors inscrits sur son application, on peut dire qu’Academos voit toutes sortes de métiers et de profils intéressants !
Pour trouver un mentor, les jeunes doivent utiliser une barre de recherche et entrer des mots-clés.
L’algorithme leur suggère alors des profils contenant ces mots-clés. C’est plutôt simple… mais !
Si un jeune recherche médecine, les profils des médecins vont surement l’intéresser, mais peut-être aussi que ceux des pharmaciens, psychologues et autres professionnels de la santé l’intéresseraient encore davantage !
Les objectifs :
- Créer des regroupements de mentors qui partagent des caractéristiques communes
- Identifier des thématiques qui pourraient être mises de l’avant par Academos
Mais comment identifier les mentors qui sont semblables à ceux proposés actuellement ? Nous savons intuitivement qu’un médecin, une pharmacienne, un vétérinaire, et une infirmière partagent des ressemblances. Cela dit, avec des milliers de mentors inscrits sur l’application, impossible de faire la segmentation à la main…
Comment donc apprendre à l’ordinateur qu’ils sont semblables ?
Piste de solution #1
Une première avenue à explorer est de regrouper les mentors selon leurs diplômes. A priori, regrouper les mentors selon leurs études peut sembler prometteur, mais les reconversions professionnelles et les parcours atypiques montrent rapidement la limite de cette approche.
Piste de solution #2
Continuons avec une approche tout aussi simple, c’est-à-dire regrouper les intitulés de poste partageant les mêmes mots clés.
Spoiler alert : le résultat n’est pas assez bon, les intitulés de postes (environ 4 ou 5 mots) ne contiennent pas assez d’information pour regrouper de façon fiable des métiers semblables.
Par exemple, regrouper un entrepreneur général, un général militaire et un médecin généraliste parce qu’ils utilisent tous le mot-clé général n’est pas idéal. Sans compter que les personnes ayant des postes hyperspécialisés ou moins communs ne sont regroupés avec aucun autre métier.
La solution mise en œuvre
Utiliser des techniques de Text Mining pour regrouper les profils semblables
Pour commencer, qu’est-ce que le text mining déjà ?
L’analyse de données textuelles (ou text mining) est un domaine de l’intelligence artificielle. Elle désigne un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains.
-Wikipedia
Lorsqu’ils s’inscrivent sur l’application, tous les mentors d’Academos remplissent les champs suivants :
- Une description de leur travail,
- Une description de leur journée typique,
- Les points forts de leur emploi,
- Les points moins appréciés à propos de leur emploi
En utilisant les centaines de mots contenues dans ces textes, nous avons beaucoup plus d’informations pour regrouper adéquatement les mentors semblables. Notre hypothèse est que les mentors utilisant des mots semblables dans ces descriptions occupent probablement un poste semblable (jusqu’à un certain point).
Quelques heures de nettoyage de données, de transformations et de perfectionnement d’algorithmes plus tard, nous avons obtenu un résultat assez convaincant !
Les résultats
L’algorithme est en mesure de segmenter les mentors en groupes uniformes. Certains groupes sont assez évidents et d’autres sont plus surprenants (mais logiques quand on y pense) ! Jugez par vous-même :
- Les artistes de textures, producteurs cinématiques, animateurs 3D et artistes d’effets spéciaux de jeux vidéo et autres métiers créatifs sont regroupés en une catégorie “Arts Visuels”
- Les scrum masters, architectes de solutions, analystes fonctionnels, développeurs logiciels et autres profils semblables sont regroupés en une catégorie “Logiciel”
- Les linguistes, rédactrices techniques, auteurs éditeurs et traducteurs sont regroupés sous “Langues”
- Les physiothérapeutes, orthophonistes, préposés aux bénéficiaires et intervenants en zoothérapie sont regroupés sous “relation d’aide”
Au final, les milliers de mentors ont pu être regroupés dans moins d’une centaine de catégories assez homogènes en termes de lexique utilisé dans leur description. Par exemple, l’algorithme est en mesure de distinguer les métiers physiques de la construction et ceux liés davantage à la conception et aux plans.
Avec cette analyse en main, Academos est en mesure de mieux connaître les thématiques abordées par ses mentors, de mieux concentrer ses efforts à trouver des mentors dans les catégories sous-représentées et améliorer ses suggestions de mentors aux jeunes en recommandant des profils qui sont à la fois semblables en termes d’intérêts, et différents en termes d’emplois !