Formation Natural Language Processing (NLP) et Text Mining

Objectif et modalités

Objectif : Durant cette formation les stagiaires découvrent les méthodes de la statistique textuelle. Ils découvrent les processus d’extraction de caractéristiques, de sélection et de classement dans des volumes importants de données textuelles. A l’issue de la formation, le participant connaît les principaux algorithmes de Machine Learning dédiés au traitement du langage naturel et sait évaluer les performances de chacun des algorithmes.

Durée : 3 jour (7h par jour) - Possibilité de distancer les journées dans le temps 

Prix : 1200€ (Tarif HT par participant, soit 400€ HT / jour. Entreprises : contactez nous pour un devis personnalisé)

Prérequis : connaissances générales sur le Machine Learning ainsi qu'en statistiques 

Un programme de formation complet

Les approches traditionnelles en Text Mining

  • La récupération et l'exploration du corpus de textes

  • Stemming, Lemmatization et suppression des mots de liaison

  • Tout rassembler pour nettoyer et normaliser les données

 

Feature Engineering pour la représentation de texte

  • Comprendre la syntaxe et la structure du texte

  • Le modèle Bag of Words et Bag of N-Grams

  • Le modèle TF-IDF, Transformer et Vectorizer

  • Le modèle Word2Vec et l’implémentation avec Gensim

 

La similarité des textes et classification non supervisée

  • Les concepts essentiels de similarité

  • Analyse de la similarité des termes : distances Hamming, Manhattan, Euclidienne et Levenshtein

  • Analyse de la similarité des documents

  • Les algorithmes de classification non supervisée

La classification supervisée du texte

  • Prétraitement et normalisation des données

  • Modèles de classification, régression logistique, support Vector Machines, Random Forest, Gradient Boosting Machines

  • Évaluation des modèles de classification

Natural Language Processing et Deep Learning

  • Les librairies NLP : NLTK, TextBlob, SpaCy, Gensim, Pattern, Stanford CoreNLP

  • Les librairies Deep Learning : Theano, TensorFlow, Keras

  • RNN et Long Short-Term Memory. Les modèles bidirectionnels RNN

  • Les modèles Sequence-to-Sequence

Datagenius formation machine learning et natural language processing

Pourquoi nous choisir pour vous former ? 

Nous sommes un centre agréé de formation, gage de la qualité de nos formations en Data Science et en Intelligence Artificielle, de notre équipe pédagogique et du suivi des stagiaires.

 

Nous avons une expérience de part notre activité de conseil dans la réalisation de projets de Data Science et d’Intelligence Artificielle offrant une excellente connaissance théorique mais aussi une très bonne vision sur l’application “réelle” en entreprise de l’Intelligence Artificielle et de la Data Science.

 

Nous proposons une approche très pragmatique avec des travaux pratiques adaptables aux données du client pour faciliter et accélérer la réalisation de projets internes.

Nous vous formons dans toute la France ou alors dans nos locaux à Lyon. Cette formation est également proposée en distanciel.

Prochaines dates 

Voici les dates des prochaines sessions inter-entreprises : 

  • Mercredi 15 septembre 2021 au vendredi 17 septembre 2021 

  • Mercredi 13 octobre 2021 au vendredi 15 octobre 2021

  • Mercredi 17 novembre 2021 au vendredi 19 novembre 2021

  • Mercredi 8 décembre 2021 au vendredi 10 décembre 2021​

Vous êtes intéressés par la formation : contactez nous !

Par mail

Par téléphone