paper title (use style: paper title)manifest.univ-ouargla.dz/documents/archive/archive... · web...

12
1 Extraction de connaissances et classification des arythmies cardiaques par les réseaux de neurones BENALI MEDJAHED Oussama 1 , ZEGHOUDI Abdelfettah 2 , HADJ SLIMANE Zine-Eddine 3 Laboratoire de Génie Biomédical, Département de Génie Electrique et Electronique, Faculté de Technologie, Université Abou Bekr Belkaïd. Tlemcen BP 230. 13000 Algérie. Fax : (213) 043 28 56 85 Email : ou ss e b m@ l i v e . f r , a . z e gh o u d i @ h o t m ail. f r , h a d j s l i m @ y a h oo . f r Résumé : L’électrocardiogramme (ECG) est l’examen le plus couramment effectué, car il est rapide à mettre en place, peu coûteux et surtout non-invasif, donc très peu contraignant pour le patient. Il facilite le diagnostic de certaines arythmies cardiaques. L'analyse de ce signal et l'identification de ses paramètres constituent une étape primordiale pour le diagnostic. Dans ce papier, nous nous proposons un système d’analyse et de classification des battements cardiaques. On présente ici une stratégie de lec ture automatique du signal qui nous a permet de repérer les zones « pertinentes » qui sont révélatrices du fonctionnement cardiaq ue et de ses troubles éventuels. Trois types d’arythmies sont considérés dans cette étude : Extrasystole Ventriculaire (ESV), Bloc de Branche Droit (BBD), et Bloc de Branche Gauche (BBG), en plus du battement normal (N). Pour cela on propose différents classificateur des arythmies cardiaques par application des réseaux de neurones, notre système a été validé sur des signaux réels de la base de données MIT_BIH, les résultats obtenus en termes de taux de reconnaissance(TR), sensibilité(SE),spécificité(SP)et prédictivité(PP)sont uniformes et varient de l’un à l’autre pour chaque réseau utilisé. Mots Clés: ECG, classification, pertinentes, arythmies cardiaques, base MIT-BIH, réseaux de neurones, TR, SE, SP, PP I. INTRODUCTION L’ECG est la représentation graphique des forces électromotrices générées par l'activité cardiaque, enregistrées par des électrodes placées à la surface du corps. Il y a plus d'un demi-siècle, une convention internationale a décidé de fournir cette représentation sous la forme immuable de l'ECG à 12 dérivations. Ce fut un des tout premiers efforts de standardisation à l’échelle mondiale d'un examen médico- technique [1]. Aujourd'hui, en cette fin du XXe siècle, l'ECG est un examen irremplaçable : de réalisation aisée au moyen d'un appareillage simple, il a grandement bénéficié des progrès récents de l'électronique et de l'informatique [2]. Le signal électrocardiogramme est largement répandu pour le diagnostic des arythmies cardiaques. Les travaux de recherches pour la classification du signal cardiaque remontent à 1957 où les premières approches étaient

Upload: nguyenkhanh

Post on 15-Sep-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

1

Extraction de connaissances et classification des arythmies cardiaques par les réseaux de neurones

BENALI MEDJAHED Oussama1, ZEGHOUDI Abdelfettah2, HADJ SLIMANE Zine-Eddine3

Laboratoire de Génie Biomédical, Département de Génie Electrique et Electronique, Faculté de Technologie, Université AbouBekr Belkaïd. Tlemcen BP 230. 13000 Algérie. Fax : (213) 043 28 56 85Email : ou ss e b m@ l i v e . f r , a . z e gh o u d i @ h o t m ail. f r , h a d j s l i m @ y a h oo . f r

Résumé :L’électrocardiogramme (ECG) est l’examen le plus couramment effectué, car il est rapide à mettre en place, peu coûteux et

surtout non-invasif, donc très peu contraignant pour le patient. Il facilite le diagnostic de certaines arythmies cardiaques.

L'analyse de ce signal et l'identification de ses paramètres constituent une étape primordiale pour le diagnostic. Dans ce papier,

nous nous proposons un système d’analyse et de classification des battements cardiaques. On présente ici une stratégie de lec

ture automatique du signal qui nous a permet de repérer les zones « pertinentes » qui sont révélatrices du fonctionnement

cardiaq ue et de ses troubles éventuels. Trois types d’arythmies sont considérés dans cette étude : Extrasystole Ventriculaire

(ESV), Bloc de Branche Droit (BBD), et Bloc de Branche Gauche (BBG), en plus du battement normal (N). Pour cela on

propose différents classificateur des arythmies cardiaques par application des réseaux de neurones, notre système a été validé

sur des signaux réels de la base de données MIT_BIH, les résultats obtenus en termes de taux de reconnaissance(TR),

sensibilité(SE),spécificité(SP)et prédictivité(PP)sont uniformes et varient de l’un à l’autre pour chaque réseau utilisé.

Mots Clés: ECG, classification, pertinentes, arythmies cardiaques, base MIT-BIH, réseaux de neurones, TR, SE, SP, PP

I. INTRODUCTION

L’ECG est la représentation graphique des forces électromotrices générées par l'activité cardiaque, enregistrées par des électrodes placées à la surface du corps. Il y a plus d'un demi-siècle, une convention internationale a décidé de fournir cette représentation sous la forme immuable de l'ECG à 12 dérivations. Ce fut un des tout premiers efforts de standardisation à l’échelle mondiale d'un examen médico- technique [1].Aujourd'hui, en cette fin du XXe siècle, l'ECG est un examen irremplaçable : de réalisation aisée au moyen d'un appareillage simple, il a grandement bénéficié des progrès récents de l'électronique et de l'informatique [2]. Le signal électrocardiogramme est largement répandu pour le diagnostic des arythmies cardiaques. Les travaux de recherches pour la classification du signal cardiaque remontent à 1957 où les premières approches étaient principalement basées sur l’utilisation de la méthode des arbres de décision et la méthode statistique [1]. Par la suite, de nouvelles approches ont été développées telles que l’approche syntaxique, les systèmes experts, la logique floue et les réseaux de neurones.

Pour résoudre un problème de classification, nous disposons de toute une panoplie de méthodes qu'il faut utiliser en connaissant bien leurs capacités et surtout leurs limitations. Dans toutes les expériences (théoriques et pratiques) effectuées par plusieurs chercheurs [2], les réseaux de neurones conduisent à de bons résultats. Bien dimensionnés, ils obtiennent toujours les meilleurs taux de classification.

Dans cette optique, nous proposons de concevoir un classificateur des arythmies cardiaques, les classes de sortie sont :

Normal (N). Extrasystole ventriculaire (V). Bloc de branche gauche(L). Bloc de branche droit(R).

Dans cet article, nous avons donc opté pour les classifieurs neuronaux en raison de leurs efficacités à résoudre des problèmes de classification. Nous présenterons les étapes et les algorithmes utilisés pour extraire les paramètres caractéristiques d’un battement cardiaque, puis, nous détaillerons la méthodologie adoptée pour la mise au point de notre système de classification et présenterons les principaux résultats obtenus.

II. NOTIONS MEDICALES

L'électrocardiographie (ECG) est une représentation graphique du potentiel électrique qui commande l'activité musculaire du cœur. Ce potentiel est recueilli par des électrodes à la surface de la peau [3].

Fig. 1 : ECG d’un sujet sain

On peut distinguer dans un ECG différentes ondes : Onde P : correspond à la contraction des oreillettes. Complexe QRS : correspond à la contraction des

ventricules. Onde T : correspond au relâchement des ventricules

Contrairement aux battements normaux ; les extrasystoles ventriculaires (ESV), Bloc de Branche Droit (BBD), et Bloc de Branche Gauche (BBG) sont des battements anormaux [4]

Fig. 2 : ECG d’un sujet qui présente des ESV

Fig. 3 : ECG d’un sujet qui présente des BBG

Fig. 4. ECG d’un sujet qui présente des BBD

III. EXTRACTION DES PARAMETRES DE SIGNAL ECG

A) Données ECGLes signaux cardiaques de la base de données MIT/BIH [5]sont la norme employée par beaucoup de chercheurs pour l’évaluation des détecteurs d’arythmies. Nous avons aussi utilisé cette base ; Elle contient 48 enregistrements, chaque enregistrement à une durée de 30mn et une fréquence d’échantillonnage de 360HZ ; ces signaux contiennent des battements normaux, extrasystoles ventriculaires, bloc de branche gauche, droite.

B) Chargement et Extraction des paramètres du signalECGParce qu’il est un système interactif et convivial de calculnumérique et de visualisation graphique, Matlab7.8 était l’environnement sous lequel nous avons travaillé avec le software de traitement du signal ECG [6] développé par notre labo de génie biomédicale s’appelé NASI.

Fig. 5 : interface de logiciel NASI

Avec ce software, les différentes ondes et leurs pics respectifs sont identifiés et détectés, ainsi, on procède à :

Détecter le pic R (mesure de la fréquence cardiaque). Détecter les ondes Q et S (mesure de la durée du

complexe QRS). Détecter l’onde T (calcul des intervalles QT et ST). Détecter l’onde P et sa morphologie (mesure de PP et

PR).

C) PREPARATION DES BASES DE DONNEES

Dans ce travail, nous nous intéressons à la classification des battements cardiaques normaux et anormaux. Nous allons utiliser des enregistrements ECG d’une durée de 30 minutes pour 16 patients, qui ont été sélectionnés de la base de données MIT-BIH (voir tableau 01). La fréquence d’échantillonnage des signaux d’ECG dans la base de données est : Fe = 360Hz.

IV. L’APPRENTISSAGE DES RESEAUX DE

NEURONES

L'apprentissage d'un réseau de neurone s peut être considéré comme une action de la mise à jour de ses poids des connexions synaptiques, afin de résoudre le problème demandé. L'apprentissage est la caractéristique principale des réseaux de neurones.On peut distinguer deux types d'apprentissage : l'apprentissage supervisé et l'apprentissage non -supervisé. Les deux types d'apprentissage ont pour but d'ajuster les poids de connexions entre les neurones, en s'accordant de certaines règles [7].Dans notre étude, nous avons envisagé le moded’apprentissage supervisé.

A) Apprentissage superviséUn apprentissage supervisé se caractérise par la présence d'unensemble de différents objets et de formes classés conçus sous la forme.( Xi , C j ) , 1 ≤ i ≤N , 1 < j < m , m < NAu début de la procédure, une machine est conçue pour s'occuper de la classification de ces objets. En se basant sur les critères de ces derniers (ressemblances et divergences), elle propose une classification détaillée des différentes composantes d'une base d'apprentissage [8].

B) Les descripteurs du vecteur d'entréeNous avons introduit six descripteurs caractérisant le vecteurd'entrée de notre classifieur

La largeur des complexes QRSUne tachycardie est la succession de trois ESV donc nous avons trois descripteurs représentés pour les trois largeurs de QRS consécutive. La largeur du complexe QRS est un paramètre pertinent pour l'identification de la tachycardie ventriculaire (caractérisé par un QRS large)

L'intervalle RRL'intervalle RR est définie comme étant la distance entre deux pics R qui se suivent ; avec RRp traduit la distance

entre le pic R du battement présent et le pic R du battement qui le précède et RRs traduit la distance entre le pic R du battement présent et le pic R du battement suivant, notons que le rythme RR est un paramètre important vue que la Tachycardie ventriculaire sont caractérisé par un rythme régulier.Comme nous avons trois battements consécutifs, donc nos deux descripteurs qui caractérisent l'intervalle RR (le premier entre les deux premiers battements et le second entre le deuxième et le troisième battement).

Le rapport RRS / RRp

Dans le cas d'un rythme régulier, le rapport RRs/RRp est un paramètre qui caractérise la classe normale, généralement ce rapport est au voisinage de « 1 ». Mais ça variation peut être indicative dans le cas d'une arythmie.

L’amplitude DRSC’est l’amplitude entre le pic R et la fin de l’onde Q)

Le segment STC’est la différence entre la fin de complexe QRS et le début de l’onde T.

C) Application de l'analyse à composante principale (ACP) L’application de l'ACP permet de choisir et faire la réduction des paramètres du vecteur d'entrée.

D) Séparation des bases de donnéesII est nécessaire de disposer de deux bases de données : Une base pour effectuer l'apprentissage et une autre pour tester le réseau obtenu et déterminer ses performances.

V. PHASE DE TEST (VALIDATION)Ce test permet à la fois de voir les performances du systèmeneuronal et de détecter le type de données qui pose un problème de distinction au niveau du réseau.

Pour évaluer nos classificateurs, nous avons utilisé quatre lois statistiques basées sur la reconnaissance des catégories mutuellement exclusives de :

TP (true positive) : c'est le nombre de cas V classé V TN (true négative) : c'est le nombre de cas N classé N FP (false positive) : c'est le nombre de cas N classé V FN (false négative) : c'est le nombre de cas V classé N

Tab.1 : Matrice de confusion.

Quelques critères d’évaluation [9] :L’évaluation du classificateur de RN a été faite par le calcul de la spécificité (Sp), la sensibilité (Se), la prédictivité et le taux de classification TC (Classification Correcte CC)

Se = Tp / (Tp + Fn) (1) Sp= Tn / (Tn + Fp) (2) PP = 100*TP/(TP+FP) (3) TC= (Tp + Tn) / (Tp + Tn + Fp + Fn) (4)

Avec : Tp (True positive) : nombre de cycles cardiaques présentant une «V » reconnu comme des «V ».Tn (True negative) : nombre de cycles cardiaques qui ne présentent pas de «V » reconnu comme « Normal »Fp (False positive) : nombre de cycles cardiaques ne présentant pas une pathologie «V » reconnu comme des V.CC : c'est le taux de classification totale, elle est calculéecomme suit [10]: CC = (TP+TN)/ (TP+TN+FP+FN) (5)

VI. EXPERIMENTATION REALISEENotre travail se décompose en deux parties :

A. changements de la structure de RNNous avons proposés cinq types de RN, l'apprentissage se fait avec une base de données qui contient 4 enregistrements ‘NV’ suivants [106 200 208 233] après l’application de l’ACP ;La différence entre ces types de RN c’est :-le nombre de la couche cachée.-le nombre de neurones de la couche cachée. RN1 (apprent1VN): une couche cachée qui contient 6

neurones. RN2 (Apprent2VN) : une couche caché qui contient 8

neurones. RN3 (Apprent3VN) : une couche caché qui contient 4

neurones. RN4 (Apprent4VN) : deux couches cachées qui contient

4 neurones pour chaque couche. RN5 (Apprent5VN) : deux couches cachées qui contient

6 neurones pour chaque couche.Nous avons fait des essais; On a fixé les poids et les nombres d'itérations et on a obtenu les résultats représentés dans le tableau si dessous :

Tab.2: les caractéristiques des différents typesd’apprentissage.

Une fois le réseau de neurones est entraîné (après apprentissage), il est nécessaire de le tester sur une base de données différente de celle utilisée pour l'apprentissage.Ce test permet à la fois de voir les performances du système neuronal et de détecter le type de données qui pose un problème de distinction au niveau du réseau.Les résultats sont regroupés respectivement dans le tableau suivant :

Tab.3 : Matrice de confusion de chaque réseau.

Tab.4 : les critères d’évaluation de chaque réseau.

Les taux de classifications sont évalués par les histogrammes suivants :

Détection Nombre desbattements

Typed’arythmie

Nasi1 30 battements BBGNasi2 31 battements BBGNasi3 30 battements BBGNasi4 31 battements BBGNasi5 32 battements BBGNasi6 32 battements ESVNasi7 30 battements ESVNasi8 31 battements ESVNasi9 31 battements BBDNasi10 30 battements BBDNasi11 19 battements NNasi12 25 battements NNasi13 25 battements NNasi14 25 battements NNasi15 25 battements NNasi16 23 battements ESV

taux

taux de classification :116

100%

50%

Nous avons effectué un classifieur à quatre classes (N, ESV, BBG, BBD), en appliquant à l’entrée de classificateur les descripteurs suivants :

Le rapport RRS / RRp

L'intervalle RR La largeur des complexes QRS

0%r1 r2 r3 r4 r5 RN

Fig.6: l’histogramme du TR 116 pour chaque réseau.

taux de classification :217

Le segment ST DRS

Le nombre de neurones de la couche cachée égale 6.La mise à jour des poids est arrêtée lorsque l’erreur ou le nombre d’itération est vérifié :

100%

taux 50%

0%RN

r1 r2 r3 r4 r5

L’erreur est égale 10-3

Le nombre d’itérations utilisé (RN1 : 10 itérations, RN2 : 9 itérations).

L’apprentissage se fait avec deux bases de donnéesFig.7: l’histogramme du TR 217 pour chaque réseau.

taux de classification :223

97%

96%

différentes, donc on obtient de deux RN : RN1 avec [Nasi12Nasi7 Nasi2 Nasi10], et RN2 avec [Nasi11 Nasi6Nasi1Nasi9].Une fois le réseau de neurones est entraîné (après apprentissage), il est nécessaire de le tester sur une base de

taux95%

94%r1 r2 r3 r4 r5 RN

données différente de celle utilisée pour l'apprentissage. Le tableau suivant résume les résultats obtenus :

Fig.8: l’histogramme du TR 223 pour chaque réseau.

B. changement de la base d’apprentissage et les classes de sortie

1. Classificateur a quatre classes :On a créé notre nouvelle base de données à partir des signaux choisis précédemment de la base MIT-BITH contient les détections suivantes :

Tab.5 : Nouvelle base de données

Tab.6 : les performances des deux classificateursSE1 : représente la sensibilité ESV SE2 : représente la sensibilité BBD SE3 : représente la sensibilité BBG

2. Classificateur a deux classes :Dans cette dernière étape, on propose de faire un classifieur à deux classes (N, V), avec un RN à une couche caché qui contient 6 neurones.On fait l’apprentissage par le biais de l’enregistrement 106 pour le premier réseau, et le 119 pour le deuxième, car ils contiennent un nombre important des cas pathologiques.Le programme d’apprentissage va s’arrêter sous l’une desconditions suivantes :

L’erreur inférieure à 10-3. Le nombre d’itérations égale à 3000.

Les résultats obtenus pour la phase d’apprentissage sont représentés dans le tableau suivant :

Tab.7 : Nombre d’epochs et le temps écoulé pour chaque apprentissage

Les résultats pour la phase de test (validation) sont représentés par le tableau suivant :

Tab.8 : Performances des deux classificateurs

VII. INTERPRETATION DES RESULTATS

o On remarque dans les résultats de la 1er partie que le classificateur N°2 (RN2) qui est composé de 8 neurones et une seule couche cachée a donné des résultats légèrement meilleurs que les autres classificateurs (classificateur N°2:

=93.30, =99.77, =98.54), donc le taux de compression augmente avec l’augmentation de nombre de neurones de la couche cachée.

o En lisant entre les lignes des résultats obtenus dans leTab.8, on trouve que le classificateur N°2 (à base de réseaux appris par la base 119) à un très bon taux de reconnaissance moyenne qui égale à 95.35 % aussi un temps écoulé très réduit égal 0.22 s au contraire du classificateur N°1, ce qui nous confirme que le choix des bases d’apprentissage dans la classification automatique des pathologies cardiaques est très important.

o Lors de la comparaison des classificateurs a quatre classes par rapport à deux classes, en trouve que le taux de classification est meilleur dans le classificateur à deux classes que l’autre.

VII. CONCLUSION

Dans cet article, nous avons proposé un système d’aide au diagnostic des arythmies cardiaques, utilise la classification par les réseaux de neurones, on commence tout d’abord par localiser les ondes QRS, P, et T et par le calcul des paramètres temporels et morphologiques qui caractérisent un battement, Ensuite nous avons implémenté différents systèmes d’analyse et de classification des battements cardiaques basée sur l’approche des réseaux de neurones artificiels à apprentissage supervisé ce qui a nous confirme que le choix de variables d'un classificateur est bien souvent déterminant pour sa qualité, et il est possible d’obtenir des performances légèrement meilleures en utilisant plus de neurone en couche cachée.

REFERENCES[1] P.W.Macfarlane, «The coming of age of Electrocardiology, in: Comprehensive Electrocardiology - Theory and Practice in Health and disease », Macfarlane P.W., Veitch Lawrie T.D., eds., volume 1. Pergamon Press, New York, pp.3-40, 1989.[2] C. Brohet, Y. Ider, H. Küymen et al. «Advanced Computerized Electrocardiography without an electrocardiograph : the Cardionics PC-based system », in : Medinfo 89, Barber B, Cao D, Qin D., Wagner G, eds, North Holland pp. 591-593, 1989.[3] J.Willis Hurst, « Naming of the Waves in the ECG, With a Brief Account of Their Genesis », Circulation 1998;98:1937-42.[4] A. Carré, « révision accélérée en Cardiologie », Maloine; Édition : 2e éd. (1986)[5] Moody GB, Mark RG. The MIT-BIH Arrhythmia Database on CD-ROM and software for use with it. Computers in Cardiology 17:185-188 (1990).[6] M. MOKHTARI , A. MESBAH, « Apprendre et maîtriserMATLAB », édition Springer, 1997.[7] A .Vania, « Utilisation de données météo et des réseaux de neurones pour la Prédiction de vitesse de vent », master2éme Année en juillet 2006.[8] M. A Chikh, « Classification des signaux biomédicaux », cours master 2éme Année EBM 2010/2011[9] L. Aziez, A. Semeria, « Introduction de la reconnaissance de caractères Par réseaux neuronales », Coordinateur P. Collard 2002 / 2003[10] M. A. Chikh, « analyse du signal ECG par les réseaux de neurones et la logique floue : application à la reconnaissance des PVC », Thèse de doctorat. Faculté des sciences d’ingénieurs,Tlemcen.2005