paysages de fitness et neutralitéverel/talks/se... · 1 paysages de fitness philippe collard,...

Post on 12-Oct-2020

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Paysages de Fitness

Philippe Collard, Sébastien Verelpc@unice.fr, verel@i3s.unice.fr

Projet TEALaboratoire I3S

Université de Nice­Sophia Antipolis/CNRS

1

Paysage de Fitness ­ Plan

3. Paysage de Fitness et Rugosité4. Fitness Cloud5. Paysage de Fitness et Neutralité

1

Paysage de Fitness

Définition : (Wrigth 1932)(S,f,V) est un paysage de fitness où :

S Ensemble des solutions f : S ­> R fonction à optimiser V Relation de voisinage

1

Paysage de Fitness

Problème d’optimisation:Trouver Sopt, f(sopt) = max f(s) | s in S

Maximum local: Sloc

Pour tout s in V(sloc), f(s) <= f(sloc)

1

Exemples

Représentation binaire : mutation 1 bit

Représentation permutation (T.S.P.):2­Opt

Représentation Arbre (Prog.Gen): Insertio, délétion….

1

Paysage de Fitness et Rugosité

Présence optima locaux Continuité du paysage (smooth)

Difficulté d’optimisation

1

Mesures de Rugosité

Nombre d’optima locaux Distribution des optima locaux Distances entre optima

Par marche adaptative ou analytiquement

1

Micro exemples

OneMax : S = 0,1^N f(s) = #1

Fonction « trap »: …voir tableau

1

Autocorrélation

Autocorrélation (Weinberger) : (s0, s1, s2, s3, ….) marche aléatoireRho(l) = cov(f(sn), f(sn+l))

/ (sig[f(sn)]sig[f(sn+l)])

Longueur de corrélation : 1 / ln(Rho(1))

1

Cause de la rugosité

Epistasie : lien entre les gènes ou variables, degré de

non linéarité

Epistasie équivalent à rugosité NK­Fitness landscapes

1

Rugosité ­ conclusion

Rugosité : vision d’un grimpeur

Rugosité : notion d’information locale

1

Paysages de Fitness et Neutralité

1. Origine Biologique du concept de neutralité2. Neutralité = ?3. Comment mesurer la neutralité ?4. Les paysages de fitness sont­ils neutres ?5. Des modèles pour étudier la neutralité6. Comment exploiter le concept de neutralité?

1

Origines Biologiques Théorie neutraliste de l’évolution

Kimura 1983

Evolution moléculaireCorrespondance génotype/phénotype très

redondanteLarge proportion de mutations sélectivement

neutresMoteur principal de l'évolution ?

sélection adaptative rôle des forces stochastiques (dérive génétique)

Dans la nature les populations ne sont pas fixées sur un optimum local

1

Neutralité =Redondance + Opérateur neutre

Ensemble de neutralité (ES)– Ensemble de génotypes d’iso­fitness

Réseau de neutralité (RN)– Connections intra ES par opérateur neutre

RN de taille suffisamment importante∃ «Portes» entre les RNUne large proportion du paysage peut être

approchée par exploration d’un réseauAugmente la probabilité d’atteindre un niveau

de fitness donnée à partir d’une pop aléatoire

1

Du Grimpeur au Nageur …

Ou comment s’échapper d’un optimum local grâce aux mutations ?

1

Marche adaptative sur un paysage de fitness avec neutralité

Succession de phases1. Gain de fitness

3. Dérive aléatoire

1

Neutralité et dynamique évolutionniste

Longues périodes de stabilité (phénotypique)– Dérive dans un réseau de neutralité– Effet d’un opérateur neutre (mutation)

Ponctuées par de rapide augmentation de fitness – Découverte inopinée d’un meilleur mutant– Effet de mutation adaptative rare

Mutation = opérateur neutre ?Rôle du croisement ?Convergence prématurée !

1

Intérêt de la neutralité pour la recherche ou l’optimisation

Donne un moyen de maintenir une certaine diversité génotypique sans risque de perdre les fitness

Potentialité pour s’échapper de certains optima locaux

1

Comment mesurer la neutralité ?

Redondance– Distribution des génotypes selon la fitness (DOS)

Connectivité– intra RN

• Nombre et Taille des RN• nombre de mutations neutres par génotype (neutral

degree) (Barnett)– inter RN

• Percolation (théorie des graphes)• Taux d’innovation (neutral random walks, Schuster)• Evolvability (Smith 2002)

1

Densité d’Etats

Distribution des configurations selon les valeurs de fitness

Représente la taille des ensembles d’iso­fitness

Indique la probabilité d’atteindre un niveau de fitness donné

Distribution Normale (binomiale)– Unitation, Paysage NK– SAT, max­CSP, TSP

1

DOS : Paysage NKN=16 K=12

1

Intérêts et Limites du D.O.S

Mesure indépendante du voisinagecodage, voisinage, opérateur

Permet de « situer » une population initiale aléatoire

La « queue » de la distribution est un indice de difficulté

Extension : prise en compte le dynamique – Distribution des Coûts de Processus (Hao &

Belaidouni)

1

Innovation le long d’un RNHuynen 1996, Barnett 1998

On comptabilise le nombre de phénotypes « innovants » rencontrés dans le voisinage du chemin aléatoire neutre (neutral walks) sur le RN

1

Les paysages académiquessont­ils neutres ?

Fonctions de De Jong– Redondance induite par la modalité

Redondance– Unitation : redondance– NK : redondance

Redondance + Mutation neutre– Royal Road

1

Fonction Royal Road(Holland, Forrest, Mitchell 95)

N = 3 blocs * 10 bitssopt=111111111111111111111111111111 3s3 =********************1111111111 +1s2 =**********1111111111********** +1s1 =1111111111******************** +1

4 réseaux de neutralité– fitness 3 : 1– fitness 2 : ~ 3.103

– fitness 1 : ~ 3.106

– fitness 0 : ~ 109

1

Fonction Royal Road Crutchfield & al. 99

MutationPositive (adaptative) : rare

1111101111********************Négative (délétère) : rare

1111111111********************Neutre : les plus fréquentes

1000000001********************Pop 250Probabilité de mutation 0.005

1

Fonction Royal Roadfitness vs. générations

1

Fonction Royal RoadPopulation vs. générations

Population=(P0,P1,P2,P3)

Pi = proportion de chaînes de fitness i

1

Les paysages « réels » sont­ils neutres ?

Evolution of neural network controllers in robotic

Silicon chip electronic circuit evolution (FPGA) (Harvey ICES96)

Circuit de reconnaissance de la parole (Thompson 2001)

1

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

1

Terraced Labyrinth fitness function Crutchfield & al. 99

Fitness déterminée par un arbreNœud : réseau de neutralité

– Schéma– Fitness associée

Constellation : zone de transition– mutuellement exclusives sur un même nœud

Branche : portail entre réseaux adjacents– instanciation d’une constellation

Sous­nœud : réseau de meilleure fitness– spécialisation de schéma

1

Labyrinthe en terrasses

*************** 1

00000**********

2

00000**111*****

4

00000**111**110

6

000001011100110

8

11111**********

3

11111***0101101

4

11111***1100010

5

111110000101101

7

111110011100010

6

1

Labyrinthe en terrasseset mutations

Mutation adaptative– rare– Contrôlée par la taille des constellations

Mutation neutre– Fréquente (muter sur une constellation)– diminue quand la fitness augmente

Mutation délétère– augmente avec la fitness– 1 seule mutation peut « ramener » à la racine

1

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

1

Paysages NKKauffman 1993

N = longueur du chromosomeK = degré d’épistasieFitness additive

– Σ des contributions de chaque gène– Contribution d’un gène dépend

• Allèle du gène• Allèles de K autres gènes

– K=0 : fitness linéaire (smooth landscape)– K=N­1 : fitness aléatoire (rugged landscape)

1

•DOS binomiale•Mutations neutres très rares

Paysages NK : K=2Kauffman 1993

1

Paysages NKp Barnett 1998

Paysages NK + neutralitép=probabilité qu’une contribution soit nulle

• p=0 : paysage NK (pas de neutralité)• P=1 : paysage plat

La probabilité qu’une mutation soit neutre augmente avec p

1

Paysages NKp : K=2Barnett 1998

1

DOS : N=16 K=12 p=0.8

1

NKp : proportions des mutations neutresN. Geard & al. (CEC 2002)

1

N=20 K=4 pop=1000 mutation=0.001

p=0

p=0.99

1

Paysages NKq Newman & Engelhardt 1997

Les contributions à la fitness sont des entiers dans [0..q] (quantised NK)

Intuitivement on construit un paysage NK en « terrasses »

La probabilité qu’une mutation soit neutre diminue avec q

Le nombre de réseaux de neutralité augmente exponentielle avec N

Percolation dans les plus grands réseaux de neutralité

1

Paysages NKq : K=2 q=2Newman & Engelhardt 1997

1

DOS : N=16 K=12 q=2

1

NKq : proportion des mutations neutresN. Geard & al. (CEC 2002)

1

Comparaisons : NKp, NKqN. Geard & al. (CEC 2002)

Distribution des mutations neutres– Quand la fitness augmente :

• Le nombre de mutations négatives augmente• Le nombre de mutations positives diminue

– NKp• Le nombre de mutations neutres diminue avec la fitness

– NKq• Le nombre de mutations neutres est maximum pour la

fitness moyenne

1

Comment exploiter le concept de neutralité en Evolution artificielle ?

Etudier la neutralité intrinsèque– Redondance (DOS)– Connectivité (intra/inter)

Neutralité synthétique– Introduire de la redondance

• codage• bruit dans le calcul de la fitness• Méta codage (stratégies d’évolution)

– Concevoir des opérateurs neutres• Exploiter les symétries

1

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• Recombinaison

Indépendante du problème– Neutralité synthétique minimale

1

Voyageur de commerce24 villes concentriques

Concevoir un Opérateur neutre – Exploiter les symétries du

problème

– « Compatible » avec le croisement (PMX)

1

Voyageur de commerceOpérateur neutre et Symétrie

1

Voyageur de commercesolution optimale

1

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• recombinaison

Indépendante du problème– Neutralité synthétique minimale

1

Neutralité synthétique minimale P. Collard & al. (EA 99)

Dualité : neutralité synthétique minimale

Mapping génotype/phénotypef : Ω R

Mapping étenduF : 0,1x Ω RF(0x) = f(x)F(1x) = f(x)

1

Neutralité synthétique minimale

Redondance F : 0,1 * Ω R F(x)=F(x)

Invariance de la Densité d’Etats

Contraction de la distance Hammingd(0000,1111)=λ d(00000,10000)=1

d(0000,0011)= λ/2 d(00000,11100)= λ/2

Opérateur neutre : mirroringx x

1

Neutralité synthétique minimale Etude expérimentale

200 bits100 chromosomes1000 générationsMutation 0.5 par chromosomeMirroring 0.02Croisement 0.7Tournoi

1

Trajectoire du centroïdesans neutralité

1

Neutralité synthétique d’ordre 1Trajectoire du centroïde

1

Neutralité synthétique d’ordre 1Mean/max fitness

1

Neutralité synthétique d’ordre 1Proportion cumulée des génotypes

1

Neutralité et Conclusion

Peu de résultats théoriques ou empiriques sur la structure des paysages neutres

Résultats sur des paysages simples ou idéalisés

Etudier la neutralité intrinsèqueConcevoir des opérateurs neutres

Neutralité et difficulté ??…

1

Distributions des mutations neutresN. Geard & al. (CEC 2002)

top related