Chapitre I: Introduction
Contents
Chapitre I: Introduction¶
Présentation du NLP¶
Le Natural Language Processing, ou Traitement du Langage Naturel, est une branche de l’intelligence artificielle se concentrant sur les données textuelles et linguistiques dans le but de rendre des machines capable de “comprendre” le contenu de documents et les nuances du langage.
Cela a permis l’émergence de nouvelles technologies telles que les:
Traducteurs automatiques: Pour convertir du texte d’une langue à une autre.
Générateurs de texte: Pour compléter automatiquement des phrases lors de la rédaction d’un email ou de SMS.
Moteurs de recherche: Pour obtenir les résultats les plus pertinents en fonction de mots clés.
Assistants vocaux: Afin de donner des commandes vocales et contrôler ses appareils domestiques.
Aujourd’hui banalisées, ces technologies relevaient du rêve il y a quelques décennies de cela, c’est grâce à l’essor des réseaux de neurones et des meilleures performances des machines que nous sommes capables d’établir des modèles suffisament fin pour saisir les nuances du langage.
Le Natural Language Processing est cependant toujours un sujet d’actualité important et continue d’être étudié.
Plan du cours¶
Afin de pouvoir suivre ce cours au mieux il est recommandé d’avoir des connaissances dans les prérequis listés ci-dessous.
Prérequis:¶
Langage Python
Librairies Numpy et Pandas
Algèbre linéaire, probabilités et statistiques
Fondamentaux du Machine learning (Descente de gradient, Clustering, Régularisation…)
Le cours se décomposera en trois chapitres, chaque chapitre possèdera une partie de mise en pratique des connaissances acquises:
Plan:¶
Chapitre I: Introduction
Chapitre II: Notions générales
Modélisation statistique du langage
Modèles de langue
Embeddings
Chapitre III: NLP & Deep learning
Les réseaux de neurones récurrents
Pipelines NLP