percepcion del tono fundamental en pacientes...

6
PERCEPCI ´ ON DEL TONO FUNDAMENTAL EN PACIENTES CON IMPLANTE COCLEAR ´ Angel de la Torre (1)* , Cristina Rold ´ an (2) , Patricia Rosales (1) , Manuel Sainz (2,3) (1) Dpto. de Electr ´ onica y Tecn. Comp., Universidad de Granada, 18071 Granada (Espa˜ na) (2) Servicio ORL, Hospital Universitario S. Cecilio, 18012 Granada (Espa˜ na) (3) Dpto. Cirug´ ıa y sus Especialidades, Universidad de Granada, 18071 Granada (Espa˜ na) * Tel: +34.958.24.32.71 Fax: +34.958.24.32.30 e-mail: [email protected] Resumen La percepci´ on del tono fundamental es importante para la percepci´ on de la voz, ya que proporciona informaci´ on ´ util para la identificaci´ on de locutores, permite la extracci´ on de informa- ci´ on pros´ odica, y es usada para enfatizar palabras clave en las frases. Adem´ as, en el caso de los idiomas tonales la entonaci´ on es una caracter´ ıstica con valor fon´ etico, por lo que en estos ca- sos la percepci ´ on del tono va m´ as all´ a de suministrar informaci ´ on suprasegmental. En el caso de pacientes con p´ erdidas auditivas que han re- cibido implantes cocleares, las limitaciones t´ ecnicas asociadas al procedimiento de estimulaci´ on del nervio auditivo condicionan los mecanismos de percepci ´ on del tono fundamental. En este tra- bajo analizamos las posibilidades y limitaciones de los implantes cocleares con respecto a la percepci ´ on del tono fundamental. 1. Introducci´ on Los implantes cocleares han supuesto un avance muy impor- tante en el tratamiento de las hipoacusias severas y profundas [1]. El sistema de implante coclear consta de un elemento interno, implantado mediante una intervenci´ on quir´ urgica, y un elemento externo. El elemento interno dispone de una gu´ ıa portaelectro- dos alojada en el interior de la c´ oclea, un electrodo de referencia (usualmente colocado bajo el m´ usculo temporal) y un receptor- estimulador. La parte externa dispone de bater´ ıas, un micr´ ofono, un procesador y un transmisor para establecer una conexi´ on me- diante un acoplamiento inductivo con el receptor-estimulador de la parte interna. En la figura 1 se representan los principales ele- mentos de un sistema de implante coclear. El principio b´ asico del implante coclear consiste en recoger el sonido, procesarlo y ge- nerar pulsos el´ ectricos en el interior de la c´ oclea que estimulan el nervio auditivo, proporcionando al paciente una sensaci´ on de audici´ on. De este modo, en los pacientes afectados por una hi- poacusia severa o profunda de tipo neurosensorial el mecanismo de transducci ´ on es sustituido por el implante coclear [1, 2]. En la actualidad, la eficacia del implante coclear est´ a aceptada y fuera de toda duda. El implante coclear proporciona, en la mayor par- te de los casos, una percepci´ on del sonido con calidad suficiente para el reconocimiento de voz, y es elevado el porcentaje de pa- cientes implantados capaces de mantener conversaciones fluidas sin necesidad de apoyo visual [3, 4]. Sin embargo, a pesar de proporcionar una calidad aceptable (y de mejorar considerablemente las posibilidades del paciente con respecto a la situaci ´ on previa a la implantaci ´ on) los implantes cocleares presentan algunas limitaciones, relacionadas con el pro- cedimiento de estimulaci´ on. La percepci´ on auditiva en un o´ ıdo sano es un proceso complejo, que involucra al o´ ıdo externo, el ıdo medio, el o´ ıdo interno (en el que juegan un papel importante la mec´ anica de la membrana basilar, las c´ elulas ciliadas externas Figura 1: Elementos de un sistema de implante coclear. e internas, los fluidos intracocleares, etc.) y las v´ ıas auditivas (in- cluyendo la inervaci´ on aferente y eferente del nervio coclear y diversas estaciones en el tronco cerebral hasta llegar a la corte- za cerebral). Cuando se utiliza un implante coclear se sustituye el mecanismo natural de estimulaci ´ on por un proceso que resulta bastante tosco si se compara con la percepci´ on en el o´ ıdo sano [5]. Frente a las cerca de 6.000 c´ elulas ciliadas internas, entre 15.000 y 20.000 externas, y alrededor de 40.000 terminaciones nerviosas en el o´ ıdo sano, los implantes cocleares disponen, en la actualidad, de un n´ umero muy reducido de canales (entre 8 y 32 dependiendo de marcas y modelos). Por otra parte, frente a la conexi´ on sin´ aptica entre las c´ elulas ciliadas y las terminacio- nes nerviosas, los electrodos del implante suministran corriente a una regi´ on cuya extensi´ on es dif´ ıcil de controlar. Adem´ as, en el implante coclear no son posibles los mecanismos activos de sintonizaci´ on (asociados a la inervaci´ on eferente de las c´ elulas ciliadas externas). Estos factores hacen que el implante, a pesar de ser muy ´ util para la detecci ´ on de sonidos y para la percepci ´ on e inteligibilidad de la voz, presente limitaciones muy importantes, como pueden ser la inteligibilidad de la voz en condiciones de ruido o la percepci ´ on de sonidos complejos (como por ejemplo la usica). Estas limitaciones est´ an relacionadas con la resoluci´ on espectral que se puede obtener del implante coclear [6, 7]. Este trabajo se centra en la habilidad para la percepci ´ on de la frecuencia en los pacientes con implante coclear. La resoluci´ on en frecuencia juega un papel importante en la percepci´ on del to- no fundamental en la voz. Este aspecto va a afectar al control del tono en la voz producida por pacientes implantados, as´ ı como a la percepci´ on de las caracter´ ısticas suprasegmentales de la voz aso- ciadas al tono, o, en el caso de los idiomas tonales (como ocurre en algunas lenguas orientales) a la discriminaci´ on de los rasgos

Upload: dinhkhanh

Post on 17-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

PERCEPCION DEL TONO FUNDAMENTAL EN PACIENTES CONIMPLANTE COCLEAR

Angel de la Torre(1)∗, Cristina Roldan(2), Patricia Rosales(1), Manuel Sainz(2,3)

(1)Dpto. de Electronica y Tecn. Comp., Universidad de Granada, 18071 Granada (Espana)(2) Servicio ORL, Hospital Universitario S. Cecilio, 18012 Granada (Espana)

(3) Dpto. Cirugıa y sus Especialidades, Universidad de Granada, 18071 Granada (Espana)∗ Tel: +34.958.24.32.71 Fax: +34.958.24.32.30 e-mail:[email protected]

ResumenLa percepcion del tono fundamental es importante para la

percepcion de la voz, ya que proporciona informacion util parala identificacion de locutores, permite la extraccion de informa-cion prosodica, y es usada para enfatizar palabras clave en lasfrases. Ademas, en el caso de los idiomas tonales la entonaciones una caracterıstica con valor fonetico, por lo que en estos ca-sos la percepcion del tono va mas alla de suministrar informacionsuprasegmental.

En el caso de pacientes con perdidas auditivas que han re-cibido implantes cocleares, las limitaciones tecnicas asociadas alprocedimiento de estimulacion del nervio auditivo condicionanlos mecanismos de percepcion del tono fundamental. En este tra-bajo analizamos las posibilidades y limitaciones de los implantescocleares con respecto a la percepcion del tono fundamental.

1. IntroduccionLos implantes cocleares han supuesto un avance muy impor-

tante en el tratamiento de las hipoacusias severas y profundas [1].El sistema de implante coclear consta de un elemento interno,implantado mediante una intervencion quirurgica, y un elementoexterno. El elemento interno dispone de una guıa portaelectro-dos alojada en el interior de la coclea, un electrodo de referencia(usualmente colocado bajo el musculo temporal) y un receptor-estimulador. La parte externa dispone de baterıas, un microfono,un procesador y un transmisor para establecer una conexion me-diante un acoplamiento inductivo con el receptor-estimulador dela parte interna. En la figura 1 se representan los principales ele-mentos de un sistema de implante coclear. El principio basico delimplante coclear consiste en recoger el sonido, procesarlo y ge-nerar pulsos electricos en el interior de la coclea que estimulanel nervio auditivo, proporcionando al paciente una sensacion deaudicion. De este modo, en los pacientes afectados por una hi-poacusia severa o profunda de tipo neurosensorial el mecanismode transduccion es sustituido por el implante coclear [1, 2]. En laactualidad, la eficacia del implante coclear esta aceptada y fuerade toda duda. El implante coclear proporciona, en la mayor par-te de los casos, una percepcion del sonido con calidad suficientepara el reconocimiento de voz, y es elevado el porcentaje de pa-cientes implantados capaces de mantener conversaciones fluidassin necesidad de apoyo visual [3, 4].

Sin embargo, a pesar de proporcionar una calidad aceptable(y de mejorar considerablemente las posibilidades del pacientecon respecto a la situacion previa a la implantacion) los implantescocleares presentan algunas limitaciones, relacionadas con el pro-cedimiento de estimulacion. La percepcion auditiva en un oıdosano es un proceso complejo, que involucra al oıdo externo, eloıdo medio, el oıdo interno (en el que juegan un papel importantela mecanica de la membrana basilar, las celulas ciliadas externas

Figura 1:Elementos de un sistema de implante coclear.

e internas, los fluidos intracocleares, etc.) y las vıas auditivas (in-cluyendo la inervacion aferente y eferente del nervio coclear ydiversas estaciones en el tronco cerebral hasta llegar a la corte-za cerebral). Cuando se utiliza un implante coclear se sustituyeel mecanismo natural de estimulacion por un proceso que resultabastante tosco si se compara con la percepcion en el oıdo sano[5]. Frente a las cerca de 6.000 celulas ciliadas internas, entre15.000 y 20.000 externas, y alrededor de 40.000 terminacionesnerviosas en el oıdo sano, los implantes cocleares disponen, enla actualidad, de un numero muy reducido de canales (entre 8 y32 dependiendo de marcas y modelos). Por otra parte, frente ala conexion sinaptica entre las celulas ciliadas y las terminacio-nes nerviosas, los electrodos del implante suministran corrientea una region cuya extension es difıcil de controlar. Ademas, enel implante coclear no son posibles los mecanismos activos desintonizacion (asociados a la inervacion eferente de las celulasciliadas externas). Estos factores hacen que el implante, a pesarde ser muyutil para la deteccion de sonidos y para la percepcion einteligibilidad de la voz, presente limitaciones muy importantes,como pueden ser la inteligibilidad de la voz en condiciones deruido o la percepcion de sonidos complejos (como por ejemplo lamusica). Estas limitaciones estan relacionadas con la resolucionespectral que se puede obtener del implante coclear [6, 7].

Este trabajo se centra en la habilidad para la percepcion de lafrecuencia en los pacientes con implante coclear. La resolucionen frecuencia juega un papel importante en la percepcion del to-no fundamental en la voz. Este aspecto va a afectar al control deltono en la voz producida por pacientes implantados, ası como a lapercepcion de las caracterısticas suprasegmentales de la voz aso-ciadas al tono, o, en el caso de los idiomas tonales (como ocurreen algunas lenguas orientales) a la discriminacion de los rasgos

foneticos asociados a la entonacion.Para estudiar las posibilidades que ofrece el implante, prime-

ro analizamos los mecanismos involucrados en la percepcion deltono y que limitaciones aparecen como consecuencia del proce-dimiento de estimulacion en el implante coclear. Tambien anali-zamos como afecta la estrategia de codificacion del sonido en lapercepcion del tono fundamental. Finalmente hemos analizado laresolucion en frecuencia en sujetos implantados mediante tests dediscriminacion frecuencial, utilizado como estımulo tanto tonospuros como senales vocalicas sinteticas (senales periodicas gene-radas a partir de un modelo de produccion de voz). Los resultadosobtenidos en este estudio ponen de manifiesto que los sistemasactuales de implante coclear proporcionan un grado aceptable depercepcion del tono fundamental para la voz, presentando limi-taciones importantes en el caso de sonidos complejos (senalesmulti-pitch). Estos resultados resultan de gran interes a la hora deplanificar la rehabilitacion auditiva de los pacientes implantados.

2. Percepcion de la frecuencia en el oıdonormal y en el oıdo implantado

2.1. Mecanismos de percepcion de la frecuencia

La percepcion de la frecuencia cuando se estimula el oıdocon un tono puro, es un proceso complejo, basado en el lugardel maximo desplazamiento de la membrana basilar y del meca-nismo activo de las celulas ciliadas delorgano de Corti. El puntode maxima estimulacion de la coclea depende de la frecuencia deltono utilizado. Para frecuencias bajas se situa cerca del apex y pa-ra frecuencias altas, cerca de la base. La teorıa de la percepcionque asocia a cada punto de la coclea una frecuencia caracterısticase denomina teorıa tonotopica. La resolucion espectral del oıdosano esta determinada por el numero de celulas ciliadas y termi-naciones nerviosas del nervio auditivo y por su disposicion a lolargo de la coclea. En la coclea hay alrededor de 6000 celulas ci-liadas internas y cerca de 40.000 terminaciones nerviosas que lasinervan. Su disposicion permite una resolucion espectral proximaa 1/10 de tono, o lo que es equivalente, un oıdo entrenado serıacapaz, por ejemplo, de distinguir tonos de 450 Hz y 455 Hz (esdecir,∆f/f ≈ 1,2 %).

La senal de audio no es estacionaria, es decir, sus propieda-des (distribucion espectral de la intensidad) varıan en el tiempo.El oıdo puede percibir estas variaciones gracias a la respuestadinamica de las celulas ciliadas y del nervio auditivo. De estemodo, el patron de estimulacion que transmite el nervio auditi-vo varıa en el tiempo de acuerdo con la evolucion temporal de lasenal de audio. Debido al proceso de generacion de potencialesde accion, tanto las neuronas como las celulas ciliadas, tras haberproducido una descarga, necesitan un tiempo de relajacion antesde estar en condiciones de producir un nuevo disparo. Por esto, latasa maxima de disparo se ve limitada a unos 400 o 500 disparospor segundo, lo que determina la resolucion temporal del oıdo.Gracias a la respuesta dinamica del oıdo, para las senales cuyafrecuencia fundamental es muy inferior a la tasa maxima de dis-paro, los disparos en las neuronas se sincronizan, teniendo lugaren los instantes en los que la senal presenta mas energıa. Me-diante este mecanismo, la frecuencia fundamental puede quedarrepresentada en el patron temporal de estimulacion en el nervioauditivo. De este modo, para senales de frecuencia fundamen-tal baja (muy inferior a 400 Hz), la frecuencia fundamental sepuede percibir a traves del patron temporal de estimulacion. Estemecanismo de percepcion se denomina principio de codificaciontemporal o principio de temporizacion.

Existen, por tanto, dos mecanismos que permiten la percep-cion de la frecuencia fundamental: el descrito por la teorıa to-notopica y el descrito por el principio de codificacion temporal.

El principio tonotopico es el dominante en la percepcion de fre-cuencias altas (especialmente para frecuencias superiores a 400Hz) mientras que el principio de codificacion temporal dominapara frecuencias bajas.

2.2. Limitaciones asociadas a la estimulacion electrica

Hay diferencias muy importantes entre la generacion de po-tenciales de accion en un oıdo sano y la estimulacion electricadel nervio auditivo mediante el implante coclear. La conexionsinaptica entre las celulas ciliadas y las fibras nerviosas permiteque la vibracion de la membrana basilar en un punto determina-do de la coclea produzca potenciales de accion unicamente en lasterminaciones que inervan las celulas ciliadas en ese punto de lacoclea. Sin embargo, la estimulacion electrica mediante electro-dos produce un campo de corriente en una region no confinada,que da lugar a la generacion de potenciales de accion en una re-gion relativamente extensa de la coclea (mucho mas que en elcaso de la estimulacion natural) [8].

Por otra parte, la generacion de potenciales de accion en unacelula ciliada no afecta a las celulas ciliadas situadas en su perife-ria, por lo que en la estimulacion natural, los estımulos se generanindependientemente en las distintas regiones de la coclea sin in-terferir unas celulas ciliadas con otras. En el caso de los implantescocleares (tambien debido a que no existe sinapsis entre los elec-trodos y las terminaciones nerviosas), si se estimulan simultanea-mente dos electrodos, se produce una interferencia entre ambasestimulaciones. Esto es debido a que se ha establecido una dife-rencia de potencial entre el primer electrodo y el de referencia,y otra diferencia de potencial entre el segundo electrodo y el dereferencia, y puesto que en general la estimulacion en el primery el segundo electrodo son distintas, va a aparecer una diferenciade potencial tambien entre el primer y el segundo electrodo, queva a estimular de forma incontrolada las terminaciones situadasentre ambos electrodos.

Como consecuencia de esto, se evita la estimularse si-multanea de dos electrodos, por lo que el proceso de estimulacionde electrodos debe realizarse de forma secuencial, estimulando encada instante de tiempo ununico electrodo1.

Estas dos limitaciones que presentan los implantes coclearesson comunes a todos los disenos y son consecuencia del hecho deutilizar electrodos que suministran corriente electrica para gene-rar los potenciales de accion en el nervio auditivo. La tecnologıaactual no permite por el momento realizar una conexion con elnervio auditivo que permita una estimulacion selectiva de las dis-tintas fibras nerviosas o que permita la estimulacion simultaneaen varios puntos de la coclea sin producir interferencia. Esta esla razon por la que todos los sistemas de implante coclear dispo-nen de un numero muy reducido de electrodos (en comparacioncon el numero de celulas ciliadas externas) dando lugar a unaresolucion espectral tonotopica muy limitada. Teniendo en cuen-ta la interaccion entre canales debida a la extension del campoelectrico [8], resulta muy difıcil obtener resoluciones que supe-ren la equivalente a 12 canales por decada (lo que corresponde a∆f/f ≈ 21 %).

Sin embargo, la percepcion del tono por parte de pacien-tes implantados, usualmente mejora este lımite tonotopico. Engeneral los pacientes presentan un buen control del tono al ha-blar. Existen ademas pacientes capaces de entonar adecuadamen-te canciones, lo que indica resoluciones espectrales superiores a1/4 tono (∆f/f < 3 %). En estos casos, la resolucion espec-tral esta asociada, fundamentalmente, al patron temporal de esti-mulacion proporcionado por el implante coclear. Los implantes

1La estimulacion simultanea en todos los canales en modo bipolar esuna alternativa, aunque presenta otros inconvenientes.

de alta tasa de estimulacion (que proporcionan pulsos, para cadaelectrodo, con una tasa muy superior a la tasa maxima de disparodel nervio auditivo) permiten percibir el tono fundamental, a par-tir del patron temporal de estimulacion, ya que los instantes demaxima estimulacion electrica (y las descargas en el nervio audi-tivo) se sincronizan con los picos de energıa de la senal de audio,de forma similar al caso de la audicion normal. Los sistemas deimplante coclear actuales proporcionan tasas de estimulacion su-ficientemente altas (alcanzandose en algunos casos varios milesde pulsos por segundo en cada electrodo), por lo que en estos ca-sos la resolucion temporal y la resolucion espectral asociada alprincipio de codificacion temporal, no se debe ver reducida sig-nificativamente con respecto a la audicion normal.

2.3. Resolucion espectral basada en el principio tonotopico yde codificacion temporal

La percepcion del sonido basada en los principios tonotopicoy de codificacion temporal se puede ilustrar analizando senalesmediante espectrogramas. Los espectrogramas de banda estrechamostrarıan los aspectos de la senal que se pueden percibir conuna buena resolucion espectral tonotopica, donde la sintonizacionfrecuencial predomina sobre la sincronizacion temporal. Los es-pectrogramas de banda ancha muestran los aspectos perceptiblesa partir del patron temporal de estimulacion, donde la sincroniza-cion resulta de mayor importancia.

En el caso de tonos puros, la resolucion en frecuencia requie-re una buena capacidad de sintonizacion, y puesto que se trata desonidos estacionarios, dependeunicalmente de la percepcion to-notopica. En el caso de senales periodicas de tipo vocalico (gene-radas por un tren de pulsos periodicos filtrados), el espectrogramade banda estrecha muestra los picos espectrales correspondientesa la serie de armonicos, mientras que el de banda ancha mues-tra los picos temporales (que corresponderıan, en el caso de unasenal de voz, con los pulsos glotales). En este caso, la frecuenciadel tono fundamental se podrıa resolver mediante el principio to-notopico (espectrograma de banda estrecha) o a traves del patrontemporal de codificacion (espectrograma de banda ancha). Esteconcepto se puede aplicar a sonidos periodicos ricos en armoni-cos. En los implantes cocleares, como se ha discutido anterior-mente, la resolucion espectral tonotopica es muy limitada, debi-do al reducido numero de canales. Sin embargo, la alta resoluciontemporal de los sistemas de alta tasa de estimulacion permite ob-tener una resolucion espectral adecuada para el tono fundamentalen el caso de sonidos de tipo vocalico.

En la figura 2 se ilustra esto con algunos ejemplos. Se harepresentado, para varias senales, un espectrograma de banda es-trecha (con una resolucion espectral de 16 Hz y una resoluciontemporal de 62.5 ms), un espectrograma de banda ancha (con re-solucion espectral de 200 Hz y resolucion temporal de 5 ms). Semuestra tambien una porcion de la senal en el tiempo y el ”es-timulograma” o representacion del patron de estimulacion queproporciona, para cada canal, el implante coclear. El estimulogra-ma se ha obtenido para la configuracion por defecto del implanteCOMBI40+ de MED-EL (con 12 canales y una tasa de estimula-cion de 1527 pulsos por segundo en cada canal). Se han analizado3 senales diferentes: (a) un tono puro (de 404 Hz), (b) una senalsintetizada usando un modelo de produccion de voz, obtenida fil-trando un tren de pulsos periodicos (cuya frecuencia fundamentales 150 Hz), y (c) una senal de voz correspondiente a la sılaba /pa/.

En el caso del tono puro, en el espectrograma de banda estre-cha se aprecia que solo hay una lınea espectral. Dicha lınea apa-rece ensanchada en el espectrograma de banda ancha, debido a lamenor resolucion espectral. Se observa la quasi-estacionariedadde la senal (la senal se ha modulado con una ventana de Hammingde 0.4 segundos de duracion). El estimulograma proporciona un

(A) Tono puro (404 Hz)

tiempo (s)

frec

uenc

ia (

Hz)

0 0.05 0.1 0.15 0.2 0.250

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 0.1 0.2 0.30

1000

2000

3000

4000

tiempo (s)

cana

l

0.1 0.2 0.3

2

4

6

8

10

12

0.1 0.11 0.12 0.13 0.14 0.15−5

0

5

tiempo (s)

ampl

itud

(B) Senal sintetica de tipo vocalico (f0=150 Hz)

tiempo (s)

frec

uenc

ia (

Hz)

0 0.1 0.2 0.3 0.40

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 0.1 0.2 0.3 0.40

1000

2000

3000

4000

tiempo (s)

cana

l0.1 0.2 0.3 0.4 0.5

2

4

6

8

10

12

0.1 0.11 0.12 0.13 0.14 0.15−0.2

−0.1

0

0.1

0.2

tiempo (s)

ampl

itud

(C) Senal de voz (sılaba /pa/)

tiempo (s)

frec

uenc

ia (

Hz)

0 0.1 0.2 0.30

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 0.1 0.2 0.30

1000

2000

3000

4000

tiempo (s)

cana

l

0.1 0.2 0.3

2

4

6

8

10

12

0.1 0.11 0.12 0.13 0.14 0.15−6

−4

−2

0

2

4

6

tiempo (s)

ampl

itud

Figura 2:Percepcion de la frecuencia para tres senales: (A) tonopuro; (B) senal sintetizada mediante un modelo de produccionde voz; (C) senal de voz correspondiente a la sılaba /pa/. Paracada senal hemos representado: (1) un espectrograma de bandaestrecha (resolucion: 62.5 ms - 16 Hz); (2) un espectrograma debanda ancha (resolucion: 5 ms - 200 Hz); (3) la amplitud de lasenal en el tiempo; y (4) el ”estimulograma” o patron de activi-dad del implante coclear COMBI40+ de MED-EL.

patron parecido al espectrograma de banda ancha. Se aprecia queel canal 2 es el que proporciona un nivel mayor de estimulacion.Los canales adyacentes proporcionan tambien estimulacion de-bido al ligero solapamiento entre filtros. El estimulograma ofre-ce una resolucion espectral muy pobre, y a partir deeste resultadifıcil determinar la frecuencia del tono. Ante este patron de esti-mulacion, se podrıa decir que la frecuencia se encuentra entre 323Hz y 418 Hz, probablemente mas proxima a estaultima (pues elnivel de estimulacion es mayor en el canal 3 que en el 1).

En el caso de la senal sintetica, en el espectrograma de ban-da estrecha se puede apreciar la serie de armonicos asociada a laperiodicidad de la senal. El tono fundamental se puede resolverobservando la primera lınea espectral, o midiendo la distancia en-tre dos lıneas adyacentes. En el espectrograma de banda ancha nose resuelve la serie de armonicos (porque la resolucion espectral,200 Hz, es insuficiente para resolver la frecuecia fundamental,150 Hz). Sin embargo, se puede apreciar la periodicidad de lasenal en el tiempo, ya que el espectrograma permite observar losinstantes de mas energıa (que corresponden a los pulsos). De es-te modo, el espectrograma de banda ancha permitirıa determinarque la senal presenta una periodicidad, cuyo periodo fundamentales 6.6 ms, y a partir de esto se podrıa concluir que el tono funda-mental de esta senal es 150 Hz. En el estimulograma se apreciaesta misma periodicidad en el tiempo, y por tanto la estimulacionproporcionada por el implante coclear permitirıa detectar el tonofundamental para una senal de este tipo. Para la senal de voz, seobserva un comportamiento similar. El implante coclear permite,por una parte, percibir los formantes (lo que posibilita identificarlos fonemas) y por otra resolver el tono fundamental a traves delpatron temporal de estimulacion.

Este analisis permite concluir que, mediante el implante co-clear, es tecnicamente posible percibir el tono fundamental atraves del principio de codificacion temporal. Para ello es nece-sario que el implante disponga de una alta tasa de estimulacion(para permitir una buena representacion temporal) y en cualquiercaso la resolucion obtenida se vera limitada por la tasa maximade disparo de las terminaciones del nervio auditivo. Ademas delos aspectos tecnicos y fisiologicos, la capacidad para percibir eltono fundamental dependera del aprovechamiento por parte delpaciente de la informacion proporcionada por el implante coclear,y por tanto requiere el desarrollo o aprendizaje de ciertas habili-dades auditivas.

3. Influencia de la estrategia de codificacionen la percepcion del tono

Para estudiar como influye la estrategia de codificacion en lapercepcion del tono hemos sintetizado senales de audio a partirdel patron de estimulacion proporcionado por el procesador delimplante, de acuerdo con las estrategias de codificacion. Hemosconsiderado las estrategias CIS y CIS+ implementadas en los pro-cesadores CIS-PRO+ (de petaca) y TEMPO+ (retroauricular) deMED-EL. Las principales innovaciones que introduce la estrate-gia CIS+ con respecto a la CIS son el uso de filtros FIR (en lugarde IIR) en el banco de filtros y la deteccion de envolvente basadaen filtros en cuadratura de fase (en lugar de usando un detectorde rectificador y filtrado paso-baja). Estas mejoras proporcionanuna mejor sincronizacion de la estimulacion en los distintos ca-nales, mayor estabilidad, y una representacion mas precisa de lasvariaciones en el tiempo de las propiedades de la senal.

Al sintetizar las senales de audio, hemos modelado una situa-cion en la que las lesiones del nervio coclear son mınimas, sien-do posible una buena sincronizacion temporal de las respuestasa la estimulacion electrica. Tambien hemos considerado una si-tuacion en la que, debido a las lesiones cocleares, hay una menor

sincron. mala sincron. buenaCIS CIS+ CIS CIS+

SNR equiv. (dB) 7.1 7.3 8.2 14.5Dist. espectral 5.94 5.93 5.57 2.60Error sor-son ( %) 39.9 40.0 28.1 21.9Desv. estim.f0 ( %) 63.2 61.0 33.5 5.6

Tabla 1:Analisis de la influencia de la estrategia de codificacion yde la capacidad de sincronizacion sobre la calidad de percepcionde la voz.

supervivencia neuronal, dando lugar a una escasa sincronizaciontemporal de la respuesta a la estimulacion electrica. La buena omala sincronizacion de la respuesta neural dependera, principal-mente, de las condiciones del paciente: porcentaje de terminacio-nes nerviosas supervivientes, duracion y evolucion de la perdidaauditiva, causa de la sordera, etc. Hemos evaluado la calidad delas frases sintetizadas (teniendo en cuenta tanto la estrategia decodificacion como la capacidad de sincronizacion) a traves de 4medidas:

SNR equivalente: La hemos definido como la relacionsenal ruido necesaria para que, contaminando la frase ori-ginal con ruido blanco, se obtenga la misma calidad queen la frase sintetizada. La comparacion se ha realizado porun grupo de oyentes (normoyentes) mediante evaluacionsubjetiva.

Distancia espectral: Hemos definido una distancia espec-tral de tiempo corto promediada en frecuencia, que ha sidomedida entre las frases originales y las sintetizadas. Estadistancia representa la diferencia entre las envolventes es-pectrales y puede considerarse un indicador de la perdidade inteligibilidad de los fonemas debida al proceso de co-dificacion y sıntesis.

Error en la identificacion de segmentos sordos-sonoros:Hemos comparado, sobre las frases originales y sinteti-zadas, la identificacion de segmentos sordos-sonoros queproporciona un algoritmo convencional de etiquetado y es-timacion del tono fundamental [9].

Desviacion relativa en la frecuencia fundamental estima-da: Para los segmentos identificados como sonoros en am-bas versiones de la frase (original y sintetizada) hemosanalizado la diferencia en las estimaciones de la frecuen-cia fundamental.

Estas medidas de calidad se han promediado para 50 frases.En la tabla 1 se muestran los resultados del analisis descrito. Sepuede observar que la mejor calidad es obtenida en el caso enque coinciden la estrategia CIS+ y una buena capacidad de sin-cronizacion por parte del paciente. En esta situacion se consi-gue una calidad muy superior a las otras tres situaciones en todoslos aspectos considerados. Cabe destacar tambien que, segun esteanalisis, los pacientes que por sus lesiones cocleares no tuvieranuna buena capacidad de sincronizacion no apreciarıan las mejorastecnicas de la estrategia CIS+ con respecto a la CIS. Para los pa-cientes con una buena capacidad de sincronizacion sı se observauna mejora significativa de calidad gracias al uso de la estrategiaCIS+.

4. Evaluacion de la resolucion en frecuenciaPara estudiar la resolucion en frecuencia (tanto la tonotopica

como la basada en el principio de codificacion temporal) hemosrealizado tests subjetivos a pacientes implantados. Los tests sehan realizado tambien sobre sujetos normoyentes para disponerde una referencia con la que comparar los resultados. En los test

100 200 300 500 1000 2000 3000 5000 10000

0.1

0.2

0.3

0.5

1

2

3

5

10

20

50

frecuencia (Hz)

disc

rimin

ació

n ∆

f / f

(%

)

Normoyentes

Implantados

Discriminación frecuencial para tonos puros

50 100 200 300

0.1

0.2

0.3

0.5

1

2

3

5

10

20

50

frecuencia del tono fundamental (Hz)

disc

rimin

ació

n ∆

f / f

(%

)

Discriminación frecuencial para señales periódicas tipo voz

Normoyentes

Implantados

Figura 3:Evaluacion de la capacidad de discriminacion frecuen-cial para sujetos normoyentes (lıneas en rojo) y pacientes im-plantados (lıneas azules). La resolucion frecuencial se ha deter-minado para tonos puros (grafica superior) y para sonidos pe-ri odicos sinteticos de tipo vocalico (grafica inferior). Los trazosrepresentan la media± la desviacion estandar.

se han incluido 10 sujetos normoyentes y 10 pacientes implanta-dos con el sistema COMBI40+ de MED-EL.

Hemos medido la resolucion en frecuencia para tonos pu-ros (para medir la resolucion espectral tonotopica) y para senalessinteticas de tipo vocalico (para medir la basada en el principio decodificacion temporal) a distintas frecuencias. Para determinar laresolucion frecuencial, se presentaban al sujeto dos estımulos defrecuencias parecidas,f y f + ∆f , y se le preguntaba si percibıalos estımulos como iguales o diferentes. Para confirmar la capaci-dad de discriminacion, se introducıan de forma aleatoria parejasde sonidos de frecuencias iguales. La capacidad de discrimina-cion frecuencial se ha medido en porcentaje, teniendo en cuentael cociente∆f/f , donde∆f es la diferencia de frecuencia en-tre dos sonidos que eran distinguibles de forma sistematica por elsujeto.

La figura 3 muestra los resultados del test de discriminacionfrecuencial (media y desviacion estandar en funcion de la fre-cuencia). En el caso de los sujetos normoyentes, la discrimina-cion frecuencial tonotopica es maxima alrededor de 1 kHz (alcan-zando valores del 0.8 % en promedio), y cae hacia bajas y altasfrecuencias. Los pacientes implantados presentan una capacidadde discriminacion frecuencial tonotopica significativamente peor.En este caso, la resolucion es maxima para bajas frecuencias (al-canzando, en promedio, el 8 %) y a medida que nos desplazamosa frecuencias mayores cae rapidamente (llegando a valores proxi-mos al 30 % para 4 kHz). Se observa una gran dispersion en losresultados entre los sujetos implantados.

La discriminacion frecuencial basada en la codificacion tem-poral es maxima, tanto para normoyentes como para implantados,para las frecuencias mas bajas. Esto es coherente con el hecho de

que la tanto la capacidad de sincronizacion de las terminacionesnerviosas como la capacidad de analizar el patron temporal deestimulacion son mayores para bajas frecuencias. En este caso,la resolucion frecuencial se situa en torno al 1 % para los sujetosnormoyentes, y en torno al 4 % para los implantados, siendo lasdiferencias entre ambos grupos mucho menos acusadas que en elcaso de la discriminacion frecuencial tonotopica.

Se observa que los pacientes implantados obtienen una reso-lucion espectral tonotopica muy pobre en comparacion con la delos normoyentes. Sin embargo, el implante coclear proporciona,a partir del patron temporal de estimulacion, una resolucion su-ficiente para percibir las variaciones de tono de la senal de voz.Las variaciones de tono en una frase, que tıpicamente se encuen-tran en un rango entre∆f/f=20 % y∆f/f=50 % (dependien-do del locutor) resultarıan claramente apreciables para un sujetoimplantado. La discriminacion frecuencial es tambien adecuadapara percibir el tono musical para un porcentaje considerable depacientes implantados (una diferencia de 1/4 de tono correspondea∆f/f=3 %). Esta habilidad se verificarıa para la voz cantada yserıa aplicable a otras fuentes de sonido o instrumentos (con tonofundamental en bajas frecuencias, ricas en armonicos y periodosde ataque y caıda lentos).

Las diferencias observadas entre los distintos pacientes im-plantados con respecto a la discriminacion frecuencial parecenestar relacionados con diversos factores, como la etiologıa de lasordera, el estado de las terminaciones nerviosas, la experienciaen el uso del implante o el entrenamiento auditivo. Se ha obser-vado tambien una mejor discriminacion frecuencial para los pa-cientes que disponen de una mayor tasa de estimulacion.

5. Control del tonoEl analisis del control del tono en la voz producida por pa-

cientes implantados proporciona tambien informacion sobre lahabilidad para percibir el tono fundamental. Los sordos poslo-cutivos, al cabo de un cierto tiempo de privacion auditiva pierdenpoco a poco el control de la voz, deformando algunos fonemas ymostrando alteraciones en que afectan a la intensidad y al tono.Una vez implantados, la audicion proporcionada por el implantepermite que los pacientes oigan su propia voz, de modo que estarealimentacion hace que mejore considerablemente el control dela voz. En el caso de ninos con sorderas profundas prelocutivasimplantados, el analisis del tono resulta mas interesante, pues elcontrol del tono lo han aprendido a partir de la percepcion pro-porcionada por el implante coclear.

En la figura 4 hemos analizado la voz producida por una mu-jer normoyente, y dos ninos sordos prelocutivos implantados. Elprimero de ellos fue implantado a principios de los noventa conel sistema NUCLEUS22, un implante con 22 electrodos que uti-lizaba una estrategia de baja tasa de estimulacion (MPEAK) enel periodo en que el nino aprendio a hablar. El segundo utilizael sistema COMBI40+, mas actual, que dispone de 12 canales yutiliza una estrategia de alta tasa de estimulacion (CIS). Para ca-da caso, se ha grabado una frase, de la cual se ha representadoun espectrograma de banda estrecha, un espectrograma de bandaancha, la amplitud de la senal en el tiempo, y la salida de un de-tector de tono fundamental (la frecuencia fundamental en funciondel tiempo para los segmentos de voz sonoros).

En estas figuras se observa que el paciente con la tasa de es-timulacion mayor presenta un mejor control del tono fundamen-tal. Este paciente modifica el tono de acuerdo con el significadoglobal de la frase, haciendo uso del valor semantico de esta ca-racterıstica suprasegmental. Sin embargo, el paciente implantadocon un sistema de baja tasa de estimulacion presenta un menorcontrol del tono. En este caso las modificaciones del tono no se

(A) Mujer normoyente(/seis-dos-tres-tres-zero/)

tiempo (s)

frec

uenc

ia (

Hz)

0 0.5 1 1.50

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 0.5 1 1.50

1000

2000

3000

4000

0 0.5 1 1.5 20

100

200

300

400

tiempo (s)

frec

uenc

ia d

el to

no fu

ndam

enta

l (H

z)

0 0.5 1 1.5 2−1

−0.5

0

0.5

1

tiempo (s)

ampl

itud

(B) Nino implantado con NUCLEUS22(/i-coxerlamaleta-iabaxo/)

tiempo (s)

frec

uenc

ia (

Hz)

0 0.5 1 1.5 2 2.50

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 0.5 1 1.5 2 2.50

1000

2000

3000

4000

0 1 2 30

50

100

150

200

250

300

tiempo (s)

frec

uenc

ia d

el to

no fu

ndam

enta

l (H

z)

0 1 2 3−1

−0.5

0

0.5

1

tiempo (s)

ampl

itud

(C) Nino implantado con COMBI40+(/iral-patio-i-xugando/)

tiempo (s)

frec

uenc

ia (

Hz)

0 1 2 30

1000

2000

3000

4000

tiempo (s)

frec

uenc

ia (

Hz)

0 1 2 30

1000

2000

3000

4000

0 1 2 3 40

50

100

150

200

250

300

tiempo (s)

frec

uenc

ia d

el to

no fu

ndam

enta

l (H

z)

0 1 2 3 4−1

−0.5

0

0.5

1

tiempo (s)

ampl

itud

Figura 4:Ejemplos de frases pronunciadas por: (A) una mujernormoyene; (B) un nino implantado con el sistema NUCLEUS22;(C) un nino implantado con COMBI40+. Entre parentesis apa-recen las transcripciones foneticas de las frases pronunciadas.Para cada frase se han representado espectrogramas de bandaestrecha y ancha, la senal en el tiempo y la frecuencia fundamen-tal de los segmentos sonoros.

planifican de acuerdo con el significado global de la frase, si-no que hay variaciones casi aleatorias del tono, que se observanpracticamente para cada sılaba, y que varıan en un rango muchomas estrecho que en el caso del sujeto normoyente o del pacienteimplantado con un sistema de alta tasa de estimulacion.

Estas observaciones son consistentes con el hecho de que enel caso de los pacientes implantados, la percepcion del tono de lavoz esta basado en el principio de codificacion temporal y no enel principio tonotopico.

6. ConclusionesLos implantes cocleares proporcionan una resolucion espec-

tral tonotopica muy pobre, debido a limitaciones tecnicas del pro-cedimiento de estimulacion. Sin embargo, proporcionan un gradode discriminacion frecuencial aceptable para sonidos periodicosde tipo vocalico. Esta resolucion es obtenida a traves del patrontemporal de estimulacion. Por esta razon, las estrategias de co-dificacion orientadas a preservar la resolucion temporal (de altatasa de estimulacion) proporcionan una mejor percepcion del to-no que las orientadas a preservar la resolucion espectral (con unnumero elevado de canales).

Los principales factores involucrados en la percepcion del to-no fundamental se pueden agrupar en aspectos de origen tecnico(la tasa de estimulacion y la estrategia de codificacion) y aspectosde origen fisiologico (estado de las terminaciones nerviosas y sin-cronizacion de la respuesta neural al estımulo electrico). Tambieninfluyen aspectos como el entrenamiento auditivo y la experienciaen el uso del implante coclear. Los implantes cocleares de alta ta-sa de estimulacion proporcionan una discriminacion frecuencialadecuada para percibir el tono fundamental en senales de voz. Enalgunos casos permiten tambien un grado de percepcion del tonoaceptable para la musica. Para potenciar esta habilidad serıa con-veniente que los programas de entrenamiento auditivo para pa-cientes implantados incluyeran un entrenamiento especıfico parala percepcion del tono fundamental ası como determinados ejer-cicios de educacion musical.

7. Referencias[1] B. Wilson, C. Finley, D. Lawson, R. Wolford, D. Eddington and W.

Rabinowitz. “Better speech recognition with cochlear implants”.Na-ture, (352):236–238, 1991.

[2] P.C. Loizou. “Mimicking the human ear”.IEEE Signal ProcessingMagazine, pages 101–130, 1998.

[3] P. Blamey, P. Arndt, F. Bergeron, G. Bredberg and J. Brimacom-be. “Factors affecting auditory performance of postlinguisticallydeaf adults using cochlear implants”.Audioogy and Neuro-otology,(1):293–306, 1996.

[4] R.S. Tyler, H. Fryauf-Bertschy, D.M. Kelsay, B.J. Gantz, G.P. Wood-worth and A. Parkinson. “Speech perception by prelingually deafchildren using cochlear implant”.Otolaryngol. Head Neck Surg.,(117):180–187, 1997.

[5] J.O. Pickles.An introduction to the phisiology of hearing. RavenPress. London, 1982.

[6] M. Sainz, A. de la Torre and C. Roldan. “Frequency resolution incochlear implant patients”.6th Europ. Symp. on Paediatric CochlearImplantation, Feb 2002.

[7] A. de la Torre, M. Sainz and C. Roldan. “Perception of the tonewith cochlear implants. Influence of the coding strategy”.7th Intern.Cochlear Implant Conference, Sep 2002.

[8] A. de la Torre, M. Sainz and C. Roldan. “Influence of placement andconfiguration of the electrodes over the perception using cochlearimplants”. 6th Europ. Symp. on Paediatric Cochlear Implantation,Feb 2002.

[9] L.R. Rabiner and R.W. Schafer.Digital processing of speech signals.Prentice Hall, 1978.