Réseau neuronal artificiel (ANN) dans l’apprentissage automatique – Data Science Central
On septembre 24, 2021 by adminRéseaux neuronaux artificiels – Introduction
Les réseaux neuronaux artificiels (ANN) ou réseaux neuronaux sont des algorithmes de calcul.
Ils sont destinés à simuler le comportement de systèmes biologiques composés de « neurones ». Les ANN sont des modèles computationnels inspirés des systèmes nerveux centraux des animaux. Ils sont capables d’apprentissage automatique ainsi que de reconnaissance des formes. Ils se présentent comme des systèmes de « neurones » interconnectés qui peuvent calculer des valeurs à partir d’entrées.
Un réseau neuronal est un graphe orienté. Il est constitué de nœuds qui, dans l’analogie biologique, représentent des neurones, reliés par des arcs. Cela correspond aux dendrites et aux synapses. Chaque arc est associé à un poids alors qu’à chaque nœud. Appliquer les valeurs reçues en entrée par le nœud et définir la fonction d’activation le long des arcs entrants, ajustée par les poids des arcs.
Un réseau neuronal est un algorithme d’apprentissage automatique basé sur le modèle d’un neurone humain. Le cerveau humain est constitué de millions de neurones. Il envoie et traite des signaux sous forme de signaux électriques et chimiques. Ces neurones sont reliés par une structure spéciale appelée synapses. Les synapses permettent aux neurones de transmettre des signaux. A partir d’un grand nombre de neurones simulés se forment des réseaux neuronaux.
Un réseau neuronal artificiel est une technique de traitement de l’information. Il fonctionne comme la façon dont le cerveau humain traite l’information. Le RNA comprend un grand nombre d’unités de traitement connectées qui travaillent ensemble pour traiter l’information. Ils génèrent également des résultats significatifs à partir de celle-ci.
Nous pouvons appliquer le réseau neuronal non seulement pour la classification. Il peut également s’appliquer pour la régression d’attributs cibles continus.
Les réseaux neuronaux trouvent une grande application dans l’exploration de données utilisée dans les secteurs. Par exemple, l’économie, la criminalistique, etc et pour la reconnaissance des formes. Il peut également être utilisé pour la classification de données dans une grande quantité de données après un entraînement minutieux.
Un réseau neuronal peut contenir les 3 couches suivantes :
- Couche d’entrée – L’activité des unités d’entrée représente l’information brute qui peut alimenter le réseau.
- Couche cachée – Pour déterminer l’activité de chaque unité cachée. Les activités des unités d’entrée et les poids sur les connexions entre l’entrée et les unités cachées. Il peut y avoir une ou plusieurs couches cachées.
- Couche de sortie – Le comportement des unités de sortie dépend de l’activité des unités cachées et des poids entre les unités cachées et de sortie.
Couches de réseaux neuronaux artificiels
Le réseau neuronal artificiel est généralement organisé en couches. Les couches sont étant constituées de nombreux « nœuds » interconnectés qui contiennent une « fonction d’activation ». Un réseau neuronal peut contenir les 3 couches suivantes :
a. Couche d’entrée
L’objectif de la couche d’entrée est de recevoir en entrée les valeurs des attributs explicatifs pour chaque observation. Habituellement, le nombre de nœuds d’entrée dans une couche d’entrée est égal au nombre de variables explicatives. La ‘couche d’entrée’ présente les modèles au réseau, qui communique à une ou plusieurs ‘couches cachées’.
Les nœuds de la couche d’entrée sont passifs, c’est-à-dire qu’ils ne modifient pas les données. Ils reçoivent une valeur unique sur leur entrée et dupliquent cette valeur sur leurs nombreuses sorties. De la couche d’entrée, elle duplique chaque valeur et envoyée à tous les nœuds cachés.
b. Couche cachée
Les couches cachées appliquent des transformations données aux valeurs d’entrée à l’intérieur du réseau. Dans celle-ci, les arcs entrants qui vont des autres nœuds cachés ou des nœuds d’entrée sont connectés à chaque nœud. Les arcs sortants sont connectés aux nœuds de sortie ou à d’autres nœuds cachés. Dans la couche cachée, le traitement réel est effectué via un système de « connexions » pondérées. Il peut y avoir une ou plusieurs couches cachées. Les valeurs qui entrent dans un nœud caché sont multipliées par des poids, un ensemble de nombres prédéterminés stockés dans le programme. Les entrées pondérées sont ensuite additionnées pour produire un seul nombre.
c. Couche de sortie
Les couches cachées sont ensuite reliées à une « couche de sortie ». La couche de sortie reçoit les connexions des couches cachées ou de la couche d’entrée. Elle renvoie une valeur de sortie qui correspond à la prédiction de la variable de réponse. Dans les problèmes de classification, il n’y a généralement qu’un seul nœud de sortie. Les nœuds actifs de la couche de sortie combinent et modifient les données pour produire les valeurs de sortie.
La capacité du réseau neuronal à fournir une manipulation utile des données réside dans la sélection adéquate des poids. Ceci est différent du traitement conventionnel de l’information.
Structure d’un réseau neuronal
La structure d’un réseau neuronal est également appelée « architecture » ou « topologie ». Elle se compose du nombre de couches, d’unités élémentaires. Elle consiste également en un mécanisme d’ajustement des poids interconchangés. Le choix de la structure détermine les résultats qui vont être obtenus. C’est la partie la plus critique de la mise en œuvre d’un réseau neuronal.
La structure la plus simple est celle dans laquelle les unités se répartissent en deux couches : Une couche d’entrée et une couche de sortie. Chaque unité de la couche d’entrée a une seule entrée et une seule sortie qui est égale à l’entrée. L’unité de sortie a toutes les unités de la couche d’entrée connectées à son entrée, avec une fonction de combinaison et une fonction de transfert. Il peut y avoir plus d’une unité de sortie. Dans ce cas, le modèle résultant est une régression linéaire ou logistique, selon que la fonction de transfert est linéaire ou logistique. Les poids du réseau sont des coefficients de régression.
En ajoutant 1 ou plusieurs couches cachées entre les couches d’entrée et de sortie et des unités dans cette couche, le pouvoir prédictif du réseau neuronal augmente. Mais le nombre de couches cachées doit être aussi faible que possible. Cela garantit que le réseau neuronal ne stocke pas toutes les informations de l’ensemble d’apprentissage, mais qu’il peut les généraliser pour éviter le surajustement.
Le surajustement peut se produire. Il se produit lorsque les poids font que le système apprend les détails de l’ensemble d’apprentissage au lieu de découvrir les structures. Cela se produit lorsque la taille de l’ensemble d’apprentissage est trop petite par rapport à la complexité du modèle.
Une couche cachée est présente ou non, la couche de sortie du réseau peut parfois avoir beaucoup d’unités, lorsqu’il y a beaucoup de classes à prédire.
Avantages et inconvénients des réseaux neuronaux
Voyons quelques avantages et inconvénients des réseaux neuronaux :
- Les réseaux neuronaux sont performants avec des données linéaires et non linéaires mais une critique courante des réseaux neuronaux, notamment en robotique, est qu’ils nécessitent une grande diversité de formation pour un fonctionnement réel. Il en est ainsi parce que toute machine d’apprentissage a besoin de suffisamment d’exemples représentatifs pour capturer la structure sous-jacente qui lui permet de généraliser à de nouveaux cas.
- Les réseaux neuronaux fonctionnent même si une ou quelques unités ne répondent pas au réseau mais pour mettre en œuvre des réseaux neuronaux logiciels importants et efficaces, il faut engager beaucoup de ressources de traitement et de stockage. Alors que le cerveau dispose d’un matériel adapté à la tâche de traitement des signaux à travers un graphe de neurones, la simulation d’une forme même très simplifiée sur la technologie Von Neumann peut contraindre un concepteur de réseau neuronal à remplir des millions de lignes de base de données pour ses connexions – ce qui peut consommer de vastes quantités de mémoire informatique et d’espace disque dur.
- Les réseaux neuronaux apprennent à partir des données analysées et ne nécessitent pas de reprogrammation, mais ils sont qualifiés de modèles « boîte noire », et fournissent très peu d’informations sur ce que ces modèles font réellement. L’utilisateur a juste besoin de l’alimenter en entrée et de le regarder s’entraîner et attendre la sortie.
Conclusion
Les réseaux neuronaux sont considérés comme des modèles mathématiques simples pour améliorer les technologies d’analyse de données existantes. Bien qu’il ne soit pas comparable à la puissance du cerveau humain, il constitue tout de même la brique de base de l’intelligence artificielle.
Laisser un commentaire