Plan du site  
pixel
pixel

Articles - Étudiants SUPINFO

L'Active Learning

Par Melissa CHANU Publié le 13/11/2017 à 11:00:20 Noter cet article:
(0 votes)
Avis favorable du comité de lecture

Nous parlons de l’Active Learning, dit apprentissage actif. Nous sommes dans une époque révolue des nouvelles technologies, d’algorithme révolutionnaire. Mais nous entendons aussi beaucoup d’écoles ou d’universités commencer à mettre en pratique l’active learning sur les étudiants et les plus jeunes. Nous verrons ce que nous appelons l’active learning, comment l’utilisons nous, dans quel cadre !

Méthode ou modèle

Une méthode c’est un ensemble de choses à faire, elle se situe au niveau du « comment » sans avoir besoin d’expliciter de façon approfondie le « pourquoi ». Disons que, dans une méthode, les objectifs à atteindre sont supposés connus et évidents. Quand ils sont évoqués, c’est toujours d’une manière vague et purement allusive. De plus, elle n’a pas besoin d’être cohérente avec autre chose. Elle fonctionne à part. Il n’y a qu’à la suivre, mais si l’on y change quelque chose, les conséquences n’ont rien de dramatique.

Un modèle c’est un ensemble de mises en relation entre le « pourquoi »et le « comment ». Le « pourquoi » étant défini. Si bien qu’un modèle se présente, non comme un ensemble de directives mais comme une suite de raisonnement. Un modèle est un système. Et comme tout système, les éléments qui le constituent ne peuvent être modifiés sans modifier tout le système voir le détruire.

L’apprentissage semi-supervisé pour améliorer les performances en combinant les données avec labels (peu) et sans labels (beaucoup).

- Classification semi-supervisé (discrimination) : entrainer sur des données avec labels et exploiter les données (beaucoup) sans labels pour améliorer les performances.

- Clustering semi-supervisé : clustering des données sans labels en s’aidant des données avec labels ou paires de contraintes.

L’active Learning est une méthode d’apprentissage semi-supervisé où une réponse intervient au cours du processus. Plus précisément contrairement au cadre classique où les données sont connues et imposées, en active learning, c’est l’algorithme d’apprentissage qui demande des informations pour des données précises. Cette technique repose sur l’hypothèses que l’acquisition des données non étiquetées est beaucoup moins coûteuse que celle de données étiquetées.

L’apprentissage actif est basé sur la résolution de problèmes, apprentissage par l’expérience. Avec des interactions pour savoir s’il y a des erreurs ou si l’algorithme trouve la réponse sans confirmation.

A l’inverse, l’apprentissage passif n’a pas d’interactions car toutes les réponses sont déjà étiquetées donc on les connait toutes. Le coté actif, c’est une sorte d’algorithme qui va demander à l’humain une vérification sur ce qu’il ne sait pas. A partir de cela il va enlever toutes les prédictions qu’il a fait tout seul. Le moment ou ça ne devient pas clair pour lui, il va redémarrer et redemander les informations. Il faut déterminer la frontière entre les différents types de données. Le principe de la technique est de trouver la requête la plus pertinente, pendant le processus d’apprentissage afin de maximiser le gain d’informations sur le problème. C’est pour cela que ce type d’apprentissage nécessite des interactions avec un oracle, humain ou non. Contrairement à l’apprentissage passif, c’est l’apprenant qui choisit les données à étiqueter par l’oracle.

Le clustering

Le clustering est une des méthodes d’analyse de données. Elle vise à diviser un ensemble de données en différents paquets homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes. En clair, le clustering cherche à faire des classes telle que :

- Les différences infra-classe soient minimales pour obtenir des clusters

- Les différences interclasse soient maximales afin d’obtenir des sous-ensembles bien différenciés.

Par rapport à l’apprentissage supervisé passif, l’apprentissage actif permet d’obtenir de bons résultats avec un ensemble de données étiquetées réduits. Le processus c’est qu’un algorithme va être donné pour former des itérations, on parle de non supervisé ou propagation. Ça va nous servir pour le clustering.

Les deux processus d'apprentissage

Il existe deux grands processus d’apprentissage qui doivent être couplés à des stratégies communes de sélection de données à étiqueter. Nous détaillerons d’abord ces trois processus, puis les stratégies communes de sélection. Dans une dernière partie sera détaillé les limitations rencontrées dans l’usage de telles méthodes.

Pour l’apprentissage constructive, le principe est de sélectionner les exemples les plus informatifs ;

Pour l’approche sélective, la région d’incertitude est recalculée après chaque exemple et les nouveaux exemples sont tirés dans cette région.

Il existe deux grandes approches pour l’Active Learning, l’approche constructive c’est-à-dire que l’apprenant construit ses questions. Et l’approche sélective, dans ce cas l’apprenant sélectionne des exemples dans un échantillon non étiqueté. L’algorithme de départ peut laisser penser qu’il est non supervisé, mais l’ensemble final a pour résultat apprentissage semi supervisé.

1er labélisation par l’expert

2eme propagation

3eme recherche des zones incertaines soit j’interviens sur toute la zone ou bien sur une partie tout dépend de comment j’écris l’algorithme

A propos de SUPINFO | Contacts & adresses | Enseigner à SUPINFO | Presse | Conditions d'utilisation & Copyright | Respect de la vie privée | Investir
Logo de la société Cisco, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société IBM, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sun-Oracle, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Apple, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sybase, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Novell, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Intel, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Accenture, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société SAP, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Prometric, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Toeic, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo du IT Academy Program par Microsoft, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management

SUPINFO International University
Ecole d'Informatique - IT School
École Supérieure d'Informatique de Paris, leader en France
La Grande Ecole de l'informatique, du numérique et du management
Fondée en 1965, reconnue par l'État. Titre Bac+5 certifié au niveau I.
SUPINFO International University is globally operated by EDUCINVEST Belgium - Avenue Louise, 534 - 1050 Brussels