next up previous contents
Next: Mesures précises du triplet Up: À la recherche de Previous: Conclusions de la CC

Une autre technique: le réseau de neurones artificiels

Vu l'énorme quantité de spectres d'étoiles C obtenus par KDI (plus de 1000), l'attrait des méthodes automatisées de classification est flagrant. Les réseaux de neurones artificiels (RNA) semblent intéressants à première vue puisqu'ils sont particulièrement adaptés à la reconnaissance des structures morphologiques. De plus, certains programmes de RNA sont disponibles gratuitement.

En astronomie, c'est pour la classification que les RNA ont été utilisés. Certains ont fait de la classification spectrale (Weaver et Torres-Dodgen, 1995; Folkes et al., 1996) et d'autres de la classification morphologique de galaxies (Mahonen et Hakala, 1995). Le RNA identifie dans un ensemble de spectres ou d'images des groupes aux caractéristiques semblables. Toujours en astronomie, Charbonneau et al. (1998) ont utilisé les RNA en hélioséismologie pour déterminer le taux de rotation du coeur solaire.

Le terme ``réseau de neurones artificiels'' trouve son origine dans la ressemblance avec le fonctionnement des neurones humains. Un RNA est constitué d'une ou plusieurs couches de noeuds. Chaque noeud reçoit un signal de tous les noeuds de la couche précédente, en effectue le traitement, puis fournit un signal de sortie utilisé pour la couche suivante (figure gif [Skapura p. 7]).

 

Il suffit d'entraîner le RNA à reconnaître un premier ensemble de données (l'ensemble d'entraînement) afin que la sortie de la dernière couche de noeuds envoie un signal clair (une combinaison de '0' et de '1') associé à (et uniquement à) un groupe choisi de données. Ensuite, lorsqu'on fait passer l'ensemble inconnu à travers le RNA, on est capable de le classer en se basant sur les résultats du RNA entraîné.

Prenons l'exemple de spectres d'étoiles C. Admettons que nous ayons plusieurs spectres très peu bruités représentatifs des quatre principaux types d'étoiles C (C-N, C-J, C-H et C-R). Nous pourrions nous en servir comme ensemble d'entraînement. Il existe plusieurs façons de fournir les paramètres d'entrée de la première couche de noeuds. Dans le cas le plus simple, nous pourrions choisir un RNA avec 1024 noeuds sur la première couche correspondant à l'intensité des 1024 colonnes d'un CCD. La sortie de chaque noeud de cette première couche serait alors envoyée à une couche intermédiaire comportant vraisemblablement moins de noeuds qui à leur tour enverraient leur signal à la dernière couche ne comportant que quatre noeuds. La façon dont chaque noeud traite la valeur d'entrée pour fournir une valeur de sortie dépend de la fonction d'activation. Cette fonction renvoie une valeur située entre 0 et 1 selon la valeur d'entrée (aussi comprise entre 0 et 1). Le but d'un RNA est d'obtenir un signal clair à la sortie de la dernière couche. Dans notre cas, les quatre noeuds devraient prendre les valeurs suivantes: 0001 lorsqu'on fournit au réseau le type C-N d'étoiles C, 0010 pour le type C-J, 0100 pour le type C-H, et 1000 pour le type C-R. Voilà donc à quoi sert l'ensemble d'entraînement, à ajuster les fonctions d'activation des différents noeuds pour obtenir des valeurs bien tranchées à la sortie.

Or, à la base de l'entraînement du RNA, il est vital d'être capable d'identifier les différentes classes de spectres. C'est la première étape avant même d'utiliser le RNA: regrouper en classes les quatre types de spectres à haut S/B.

Malheureusement, dans le cadre de ce projet, même cette première étape est difficilement réalisable. Face à un bon spectre de 7700 Å à 8700 Å , il est impossible de savoir à laquelle des quatre classes il appartient. Au mieux, on trouve deux classes seulement: selon que le triplet de calcium soit faible ou fort. Trouver des différences entre tous les bons spectres est une tâche très ardue. Connaître leur classe dans la classification de Barnbaum n'aide en rien puisque le domaine de longueur d'onde n'est pas le même ici. On ne peut donc pas faire l'entraînement. Par ailleurs, Folkes et al. (1996), dans leur article sur la classification spectrale de galaxies à faible S/B, ont montré que le RNA pouvait diviser toutes les galaxies en seulement quatre classes, guère mieux. Pourtant, leur ensemble d'entraînement comportait des spectres déjà très différents par simple inspection.

Voilà donc pourquoi l'avenue des RNA n'a pas été explorée davantage. Ce n'est pas la panacée qui fera magiquement une bonne classification. Tout au plus un RNA pourrait-il distinguer deux classes de spectres: ceux avec un fort triplet de calcium et ceux avec un triplet normal. Mais il est déjà possible de faire cette distinction par inspection visuelle.


next up previous contents
Next: Mesures précises du triplet Up: À la recherche de Previous: Conclusions de la CC

Loic Albert
Wed May 12 16:45:53 EDT 1999