instituto tecnologico superior de los...

28
Presenta: Carlos Ediberto Pérez Pérez Asesor: Dr. Fernando Pech May Balancán. Tabasco Febrero del 2019 INSTITUTO TECNOLOGICO SUPERIOR de los RIOS

Upload: others

Post on 23-Apr-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Presenta:

Carlos Ediberto Pérez Pérez

Asesor:

Dr. Fernando Pech May

Balancán. Tabasco Febrero del 2019

INSTITUTO TECNOLOGICO SUPERIOR

de los RIOS

Page 2: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Definición de Aprendizaje Profundo

Algunas Aplicaciones de Aprendizaje Profundo

Tipos de Aprendizaje Profundo

Resúmenes de Texto

Trabajos relacionados en la extracción de resúmenes

Palabras Embebidas

Herramientas de Palabras Embebidas

Contenido

1

Page 3: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Definición de Aprendizaje Profundo

• Área de la Inteligencia Artificial que se ocupa

de emular el enfoque de aprendizaje que los

seres humanos utilizan para obtener ciertos

tipos de conocimiento.

2

Page 4: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Importancia de Aprendizaje Profundo

Aprendizaje Profundo es importante gracias a la gran

velocidad cuando se trata de procesar grandes

volúmenes de datos.

3

Page 5: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Ventajas de Aprendizaje Profundo

• Mayor similitud posible con el trabajo de las propias neuronas

humanas

• La propia máquina y su sistema pueden reaccionar ante errores

sin necesidad de que se les dé orden alguna

• Son capaces de encontrar nuevas estrategias o alternativas para

hacer mas eficiente una tarea

4

Page 6: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Desventaja de Aprendizaje Profundo

• El reto que supone su desarrollo, el cual no está

todavía plenamente completado.

5

Page 7: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

• Traductores inteligentes

• Reconocimiento de voz

• Reconocimiento facial

• Visión computacional

• Traducción automática

• Conversión Texto a Voz

• Reconocimiento de Patrones en Imágenes

• Extracción de resúmenes

Algunas Aplicaciones de Aprendizaje Profundo

6

Page 8: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Tipos de Aprendizaje Profundo

RNN (Redes Neuronal Recurrente): Red con bucles que permiten

que la información persista y son capaces de manejar datos

secuenciales como por ejemplo los textos.

CNN (Red Neuronal Convolucional): Red Neuronal Profunda con

capas 2D y su arquitectura esta adecuada para procesar datos

como las imágenes.

7

Page 9: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

RNN Simple

• Tiene la forma de una cadena de modulo repetitivo de red

neuronal.

• Cuenta con una capa llamada tanh que es la función de

activación con valores de -1 y 1.

8

Page 10: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

LSTM es un tipo de RNN que consiste en múltiples puertas capaces

de aprender dependencias a largo plazo, esto evita recordar

información por periodo de largo tiempo.

La clave de este RNN-LSTM es

el estado Ct-1 , lo cual corre

directo por todo el diagrama

con interacciones lineales

menores.

LSTM

9

Page 11: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Las RNN-LSTM consta de 4 etapas.

1.- Decidir la

información a arrojar

del estado de la celda.

RNN - LSTM

10

2.- Decidir la nueva

información que se

almacenara en el

estado de la celda

Page 12: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

3.- Actualización del

estado de la celda

anterior Ct-1.

11

RNN - LSTM

4.- Decidir lo que se

generara como salida.

Page 13: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

(RNN - adelante, RNN – atrás)

1. El primer LSTM funciona con múltiples capas y son capaces

de aprender dependencia a largo plazo.

2. El segundo LSTM es una copia invertida de la secuencia de

entrada, lo que proporciona un contexto adicional a la red y

un aprendizaje mas rápido y completo

LSTM Bidireccional

12

Page 14: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Es un texto producido de uno o mas textos, que contiene una porción

significativa de la información respecto al texto original.

La extracción de resúmenes tiene como desafío la identificación de los

conceptos y las entidades clave en el documento.

Resumen de Texto

13

Page 15: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

• Resumen Abstractivo: Genera oraciones nuevas a

partir del documento Original.

• Resumen Extractivo: Selecciona fragmentos del

texto original y luego los organiza para formar un

resumen.

14

Enfoques para el resumen de texto:

Page 16: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Trabajos Relacionados en la

extracción de resúmenes

15

Page 17: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Resumen extractivo utilizando Aprendizaje Profundo

Propone un enfoque de resumen de texto para informes.

Este enfoque consta de tres fases:

• Extracción de características

• Mejora de características

• Generación de resumen

Las oraciones se califican según esas características mejoradas y

se construye un resumen extractivo.

16

Page 18: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Resumen de texto abstractivo utilizando rnns secuencia a

secuencia y beyond

Genera resumen abstractiva utilizando redes neuronales

recurrentes de decodificador y codificador atencional.

Propone:

• Modelado de palabras clave

• Captura de la jerarquía de la estructura de oraciones a

palabras

• Nuevo conjunto de datos que consta de resúmenes de varias

oraciones

17

Page 19: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

SummaRuNNer: una secuencia basada en una red neuronal recurrente

Modelo para el resumen extractivo de documentos

Genera resumen extractivo de documentos basado en la

técnica secuencial SummaRuNNer con modelo en la red

neuronal recurrente.

Permite la visualización de sus predicciones divididas por

características abstractas como:

• Contenido de información

• Prominencia

• Novedad

18

Page 20: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Algunas herramientas de Aprendizaje Profundo

19

• Tensorflow: Biblioteca de aprendizaje profundo de

código abierto para investigación y se basa en un

sistema de redes neuronales

• CNTK: Paquete de herramientas de aprendizaje

profundo de código abierto de Microsoft en GitHub.

Page 21: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

• Caffe: Es un framework teniendo en cuenta la

expresión, la velocidad y la modularidad

• Theano: Es una biblioteca para cálculo numérico en

Python en código abierto

20

Algunas herramientas de Aprendizaje Profundo

Page 22: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

• Torch: Biblioteca de código el cual soporta

rutinas básicas de indexado, recorte,

transposición, revisión de tipos,

redimensionamiento, almacenamiento

compartido y clonación

21

Algunas herramientas de Aprendizaje Profundo

Page 23: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Palabras Embebidas

Conjunto de lenguajes de modelado y técnicas de aprendizaje en procesamiento dellenguaje natural.

Representación de las palabras en vectores continuos.

22

Page 24: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Herramientas de Palabras Embebidas

• Word2vec

• Glove

• Gensim

• Indra.

23

Page 25: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Word2vec

• Modelos relacionados que se utilizan para predecir vectores de

palabras.

• Toma como entrada un gran corpus de texto y produce un espacio

vectorial.

• A cada palabra única en el corpus se le asigna un vector

correspondiente en el espacio.

24

Page 26: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Conclusión

En conclusión, hoy en día el aprendizaje profundo es untema de mucha relevancia ya que se esta implementandopara problemas complejos y que buscan ser resueltosmediante métodos y técnicas que ban surgiendo conformese ban sacando ideas nuevas, es por eso que con estetrabajo podemos darnos cuenta que el aprendizajeprofundo será una rama bastante amplia para estudiosfuturos de nuevas formas de aplicaciones.

25

Page 27: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Bibliografía

A.M, R., S, C., & J, W. (2015). A Neural attention model for abstractive sentence

summarization . arXiv preprint arXiv:1509.00685.

Aone, C., Okurowski, M., Gorlinsky, J., & Lansen , B. (1999). A trainable summarizer

with Knowledge acquired from robust nlp techniques in mani, l Mani, l and Maybury.

Advances in Automatic Text summatization, 18.

Collobert, R., Weston, j., Bottou, L., Karlen, M., Kavukcuoglu, K., & Kuksa, P. (2011).

Natural language processing (almost) from scratch. Journal of Machine Learning

Reserverch, vol.12,no.Aug, 2493-2537.

Deep Learning: El siguiente paso en el Procesado de Lenguaje natural. (27 de junio

de 2016). Obtenido de https://www.gradiant.org/noticia/deep-learning-

procesamiento-lenguaje-natural/

G, P., & K, D. (2014). An approach for text summarization using Deep Learning

algotithm. j.of Computer Sciencie, 10.

26

Page 28: INSTITUTO TECNOLOGICO SUPERIOR de los RIOSrios.tecnm.mx/cdistribuido/recursos/ArchivosEriberto/... · 2020-04-02 · Resumen de texto abstractivo utilizando rnns secuencia a secuencia

Mahmood, Y. (93). Azar and Len Hamey. Text Summarization using unsupervised

Deep Learning. Expert Syst, 2017.

Melgar, j. (06 de febrero de 2018). 4 aplicaciones del Deep Learning en la vida

cotidiana. Obtenido de https://ilifebelt.com/aplicaciones-del-deep-learning/2018/02/

Osborne, M. (2002). Using maximum entropy for sentence estraction. . In

Proceedings of the ACI02 Worksho9p on Automatic Summasrization, 18.

Pech May, F. (2018). Generación de resumen mediante seq2seq, modelo

atencional y generación de punteros.

Pech, F. (2017). Procesamiento de Lenguaje Natural con Deep Learning.

27