universidad de castilla-la mancha - tema 2a - agentes inteligentes v1.2.pdf · ya sea la...
TRANSCRIPT
Universidad de Castilla-La Mancha Inteligencia Artificial e Ingeniería del Conocimiento
Tema2: Introducción a los Agentes Inteligentes
Profesores:
Luis Jiménez Linares.
Luis Enrique Sánchez Crespo.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
2 de 52
Datos de la Asignatura Temarío
Introducción a la IA. (Cap. 1)
Introducción a los Agentes Inteligentes (Cap. 2)
Métodos de búsqueda de soluciones (Cap. 3-7)
– Espacio de estados.
– Búsqueda no informada.
– Búsqueda informada y heurística.
Sistemas basados en el conocimiento (Cap. 8-12)
– Mediante lógica de predicados.
– Mediante Sistemas de producción.
Tratamiento de la incertidumbre (Cap. 13-15)
– Redes Bayesianas.
– Razonamiento aproximado (lógica difusa).
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
3 de 52
Introd. a los Agentes Inteligentes
Agentes y su entorno.
Buen comportamiento: el concepto de
racionalidad.
La naturaleza del entorno.
Estructura de los agentes.
Resumen.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
4 de 52
Introd. a los Agentes Inteligentes
Agentes y su entorno
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
5 de 52
Introd. a los Agentes Inteligentes
Un agente Un agente es cualquier cosa capaz de
percibir su medioambiente con la ayuda de sensores y
actuar en ese medio utilizando actuadores.
Ejemplos:
– Labores diarias realizadas en internet.
– Comprar por internet (la tienda en casa).
– Sistema de diagnóstico médico
– Análisis de imágenes satelitales
– Robot ensamblador de partes
– Controlador de una refinería
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
6 de 52
Introd. a los Agentes Inteligentes
Comprensión/
intencionalidad
Comportamiento
Ve
Oye
Toca
Gusta
Huele
ENTRADAS Procesos INTERNOS
SALIDAS
Sensor del ambiente
Razona
Conoce
Un agente inteligente
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
7 de 52
Introd. a los Agentes Inteligentes
Tipificando a un agente inteligente
AMBIENTE
AGENTE
?
EFECTORES
SENSORES
PERCEPCIONES
ACCIONES
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
8 de 52
Introd. a los Agentes Inteligentes
Un agente es un sistema de computación capaz de actuar de
forma autónoma y flexible en un entorno, entendiendo por
flexible que sea:
– Reactivo: El agente es capaz de responder a cambios en el entorno
en que se encuentra situado.
– Pro-activo: El agente debe ser capaz de intentar cumplir sus
propios planes u objetivos.
– Social: Debe poder comunicarse con otros agentes mediante algún
tipo de lenguaje de comunicación de agentes.
Wooldridge 1995
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
9 de 52
Introd. a los Agentes Inteligentes
Buen comportamiento:
El concepto de racionalidad
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
10 de 52
Introd. a los Agentes Inteligentes ¿Qué es un agente inteligente?
Un agente inteligente es cualquier cosa que pueda
– percibir un mundo perceptual en que esté anidado (“ambiente”) mediante
SENSORES y
– actuar sobre ese mundo mediante EFECTORES (o actuadores)
• sinónimo de ambiente es “espacio de problema”
• sinónimo de agente inteligente es “operador que transforma un input
en output dentro del espacio de problema”
META de la IA Diseñar un agente inteligente/racional que opere o
actúe adecuadamente en sus ambientes.
– Discusión sobre “adecuadamente”
• Fijar alguna medida del buen éxito
• Tener en cuenta el PRR Principio de Racionalidad Restringida de
Herbert Simon
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
11 de 52
Introd. a los Agentes Inteligentes ¿Qué es un agente racional?
Pensante racionalmente
– Captura de un proceso racional correcto
– Proceso “ Irrefutable”
– Metodología
• Desarrollar un modelo formal - LÓGICA FORMAL - que siempre conduzca a la respuesta correcta
• Implementar ese modelo
– Cómo sabemos si lo hicimos bien
• cuando podemos probar que el razonamiento programado fue correcto
• la lógica de primer orden fue completa
Actuante racionalmente
– Actuar de forma de lograr las metas deseadas
– Imagine usted mismo como se hacen las decisiones correctas
• a veces pensando racionalmente (enfoque europeo)
• otras teniendo reflejos racionales (enfoque truqués)
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
12 de 52
Introd. a los Agentes Inteligentes ¿Qué es un agente racional?
El que actúa maximizando el valor esperado de la medida de buen
éxito (función de utilidad) en el logro de su meta
– esta no es la definición habitual de racionalidad ideal basada en la
lógica teórica
Racional no es omnisciente
Racional no es clarividente
Racional ideal en conflicto con el PRR (Principio de Racionalidad
Restringida).
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
13 de 52
Introd. a los Agentes Inteligentes Racionalidad
Satisfacción de restricciones
Depende de
– LA SECUENCIA DE PERCEPCIONES - TODO LO QUE EL
AGENTE HA PERCIBIDO HASTA AHORA (GESTIÓN DE LA
MEMORIA).
• No se puede criticar a un agente por no saber lo que nunca
supo
– LA MEDIDA DE BUEN ÉXITO ELEGIDA
• función de utilidad
– CUÁNTO CONOCE EL AGENTE DEL AMBIENTE EN QUE
OPERA
• Lista de hipótesis de cómo es el mundo
– LAS ACCIONES QUE EL AGENTE ESTÉ EN CONDICIONES
DE REALIZAR
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
14 de 52
Introd. a los Agentes Inteligentes Agente Inteligente Ideal
El agente inteligente ideal es el que, para cualquier
secuencia arbitraria de percepciones, logre con su ACCION
maximizar la medida de su buen éxito.
Para ello usa
– su conocimiento internalizado
– su secuencia de percepciones
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
15 de 52
Introd. a los Agentes Inteligentes
Mapeo ideal
percepciones acciones El diseño o mapeo ideal especifica qué acciones debe encarar el
agente ideal en respuesta a cualquier secuencia arbitraria de
percepciones
Se concreta con una tabla real o virtual
Ejercicio de la racionalidad
– Sandwich
– Percepciones Razonamiento Acciones
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
16 de 52
Introd. a los Agentes Inteligentes Programa con tabla y ejemplo
– Table (Percept Sequence,Action)
– Action := Function(Percept Sequence)
– If (Percept Sequence) then do Action
– Ejemplo - Glóbulos vivos finitos predictores - de Dewdney -
ingresar iterativamente 010011010011010011
– Contrajemplo : ingresar 011000010110
Cita bibliogr. - Inv y Ciencia, ene 1986, p94
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
17 de 52
Introd. a los Agentes Inteligentes
Programa con tabla y ejemplo
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
18 de 52
Introd. a los Agentes Inteligentes
PRR (Herbert Simon)
El Principio de la Racionalidad Restringida alega que la racionalidad
óptima ideal NO es el buen éxito perfecto.
Ningun ser humano apela a una mayor racionalidad que la justo
necesaria para sus fines prácticos.
Las limitaciones de un agente
• con los SENSORES que tiene
• con los EFECTORES que tiene y
• con la POTENCIA COMPUTACIONAL
– disponible y
– (en algunos casos) óptima económica
– conducen a que la racionalidad ideal sea
• imposible e
• impráctica.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
19 de 52
Introd. a los Agentes Inteligentes Algo más (Herbert Simon)
La razón es solamente un instrumento porque no nos
puede predecir hacia donde ir - no nos propone
metas a lo sumo nos ayuda a decidirnos cómo
llegar a una meta
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
20 de 52
Introd. a los Agentes Inteligentes Algo más (Randall Beer)
Los navegantes europeos aplican la planificación a su derrotero
lo trazan en el mapa y se sujetan a él, corrigiendo los
desvíos.
Los navegantes truqueses aplican toda su atención a todos los
detalles de las olas, los vientos, las aves y las corrientes de
cada momento y llegan a su destino de una manera práctica.
A la hora de explicar por qué hicimos lo que hicimos, ¿no
seremos truqueses disfrazados de europeos?
– Los agentes racionales suelen mostrar inteligencia académica,
– pero hay otra inteligencia mucho más adaptiva, mostrada por los
agentes autónomos, que los ayuda en la meta de sobrevivir.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
21 de 52
Introd. a los Agentes Inteligentes Agentes Autonomos
La “parábola” de los navegantes Europeos y los Truqueses
– Unos aplican su inteligencia a planear por adelantado toda su
conducta futura y corregir cualquier defecto en el rumbo planeado
– En el otro caso, aplican su inteligencia a PERCIBIR atentamente
todo lo que está pasando y aplicarla a tender hacia la meta
adaptándola a las contingencias cuidadosamente correlacionadas.
– De nuevo ¿seremos truqueses que nos disfrazamos de europeos a
la hora de dar explicaciones de nuestra conducta?
Son agentes autónomos los que no se guían por reglamento externo
impuesto alguno.
Dos tipos
– Conducta determinada por su propia experiencia.
– Conducta autoorganizada a partir de su red neural.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
22 de 52
Introd. a los Agentes Inteligentes Teoría de la completitud NP
La completitud NP se refiere a algoritmos polinómicos no
determinísticos.
Algunos problemas, como quizás el clásico del viajante de comercio, es
probable que sean imposibles de resolver en cualquier computadora
arbitraria
De ello se deduce que
– ya sea la inteligencia natural
– o la inteligencia artificial
NO son ilimitadas en sus capacidades.
De ello se vuelve a deducir que la racionalidad práctica resulta estar
restringida.
Nadie debe esmerarse por aplicar la racionalidad más allá de sus
necesidades prácticas. PRR
– Caso límite el termóstato con sus dos reglas - Alto nivel de
conocimiento.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
23 de 52
Introd. a los Agentes Inteligentes
Grado de Racionalidad - Nivel
de Conocimiento - Newell
Grado de racionalidad grado con el cual el agente pensante y
actuante maximiza la medida de buen éxito para lograr su meta,
sujeta a su disponibilidad de
– sensores, efectores, potencia de cómputo y conocimiento
internalizado.
– Allen Newell define el nivel de conocimiento por el número de
reglas usadas respecto de su disponibilidad total de reglas. Ningún
SoftBots es responsable por no usar reglas que no conoce.
– …a un termostato le han dado dos reglas y las usa…
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
24 de 52
Introd. a los Agentes Inteligentes
La naturaleza del entorno
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
25 de 52
Introd. a los Agentes Inteligentes Cometido de la IA
El cometido de la IA es el diseño de un Programa de Agente: una función que permita implantar el
mapeo del agente para pasar por el “sandwich” de percepciones a acciones. Este programa se
ejecutará en algún tipo de dispositivo de cómputo, al que se denominará arquitectura (puede ser una
computadora sencilla o hardware especial). En algunos ámbitos se utilizan agentes de software (o
robots de software o softbots).
Agente = arquitectura + programa
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
26 de 52
Introd. a los Agentes Inteligentes Funciones y programas de agentes El agente queda completamente especificado con la función del agente que mapea lo que describe la ecuación
– a = f (P,M,A)
• sobre todo el componente principal a = f (P)
• en principio uno puede suministrar cualquier secuencia perceptual posible para ver qué sucede - una tabla que resuma esa información podría ser inmensa
– donde la función del agente es “f”
El programa de agente trata de implementar la función de agente en forma concisa
Un programa de agente toma una percepción singular como input y mantiene el estado interno
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
27 de 52
Introd. a los Agentes Inteligentes REAS
Para definir el entorno de trabajo de un agente se utiliza el acronimo REAS = Rendimiento, Entorno, Actuadores, Sensores.
En el diseño de un agente inteligente la primera tarea es ubicarnos en el panorama a = f(datos)
a = f(P,M,A)
Ejemplo – Descripción REAS del entorno de trabajo de un taxista automático.
• Medidas de Rendimiento ??
• Entorno ??
• Actuadores ??
• Sensores ??
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
28 de 52
Introd. a los Agentes Inteligentes REAS - Ejemplos
Ejemplo – Descripción REAS del entorno de trabajo de un
taxista automático.
• Medidas de Rendimiento
• Entorno
• Actuadores
• Sensores
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
29 de 52
Introd. a los Agentes Inteligentes
Tachero new agepiloto automático Percepciones
– video
– acelerómetro, instrumental del tablero
– sensores del motor
– teclado
Acciones
– gestión del volante
– acelerar y frenar
– bocina
– hablar/graficar
Metas
– seguridad, llegar a destino, maximizar ganancias, obedecer las leyes,
satisfacción del cliente
Ambiente
– calles urbanas, avenidas, tráfico, peatones, clima, tipo de cliente
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
30 de 52
Introd. a los Agentes Inteligentes REAS – Otros Ejemplos
Para identificar a un agente debemos analizar su REAS:
Ejemplos de
descripciones
REAS de un dado
agente típico
P-percepción
a-acción
M-meta
A-ambiente
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
31 de 52
Introd. a los Agentes Inteligentes Análisis REAS
El análisis REAS es un ejemplo de – la estrategia general de la ingeniería de “dividir para conquistar”
• R+E+A+S cada sumando es más fácil que la suma ponderada.
– la aplicación del ANÁLISIS DE REQUISITOS, que resuelve un problema analizando qué es obtenible como input y qué es deseado como output.
Otro Ejemplo: al analizar un sistema de imágenes satelitales, – percepciones: pixels de intensidad y longitud de onda variables
– acciones: mover la cámara, cambiar el filtro, imprimir letreros como ”tanque82"
– metas: identificación cercana a la realidad de todos los objetos de la imagen
– ambiente: imágenes distorsionadas provenientes de una cámara satelital
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
32 de 52
Introd. a los Agentes Inteligentes Propiedades de los entornos de trabajo
Accesible/Inaccesible – Si los sensores proporcionan todo lo que hay que saber sobre el estado
completo del ambiente - necesario para elegir una acción - entonces el ambiente es accesible al agente. Esos ambiente resultan convenientes, ya que liberan al agente de la tarea de mantener actualizado su inventario del mundo.
Determinístico/No-determinístico (estocástico) – Si el estado siguiente del ambiente está determinado plenamente por el estado
presente del mismo, y por la acción del agente - se trata de un ambiente determinístico. Así el agente escapa de la incertidumbre.
Episódico/No-episódico – Un ambiente episódico implica que los episodios siguientes no dependen de las
acciones que ocurrían en episodios previos (como en las clásicas cadenas de Markov). Esto le autoriza al agente que no se deba preocupar por la planificación de lo que puede ocurrir.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
33 de 52
Introd. a los Agentes Inteligentes Propiedades de los entornos de trabajo
Estático/Dinámico
– Será estático todo ambiente que no cambie mientras el agente está pensando. No
tiene importancia el tiempo que se usa en pensar y no necesita monitorear el
mundo mientras piensa. El tiempo carece de valor mientras se computa una buena
estrategia. En el otro caso será dinámico.
Discreto/Continuo
– Discreto - con escaso número de percepciones y acciones en el ambiente.
– Continuo - el otro caso.
Sin adversario/con adversarios racionales
– Sin adversario - ausencia de otros agentes racionales adversarios: la consecuencia
es que el agente se libera de la preocupación de la estrategia de dichos adversarios
en el mismo juego.
– Los ambientes ingenieriles suelen ser sin adversario.
– Los ambientes sociales y económicos aumentan en su complejidad por la presencia
de interacciones entre uno o más adversarios (por ejemplo en la Bolsa).
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
34 de 52
Introd. a los Agentes Inteligentes Ejemplos de los entornos de trabajo
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
35 de 52
Introd. a los Agentes Inteligentes Ejemplos de los entornos en Internet
e_mail
Grupos de noticias
WWW
FTP
Juegos en línea
Foros
Buscadores con diversos agentes
Ambiente apto para minería de datos
Bibliotecas virtuales (p.ej., de IA)
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
36 de 52
Introd. a los Agentes Inteligentes
Estructura de los Agentes
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
37 de 52
Introd. a los Agentes Inteligentes Programa básico para el entorno
procedure Run-Environment(state, Update-Fn, agents, termination)
input: state, the initial state of the environment
Update-Fn, function to modify the environment
agents, a set of agents
termination, a predicate to test when we are done
repeat
for each agent in agents do
Percept[agent] Get-Percept(agent, state)
end
for each agent in agents do
Action[agent] Program[agent](Percept[agent])
end
state Update-Fn(actions, agents, state)
until termination(state)
Programa básico simulador ambiental
– proporciona las percepciones a los agentes anidados en ese ambiente
– absorbe una acción de cada agente en la unidad de tiempo
– actualiza el ambiente para cada unidad de tiempo
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
38 de 52
Introd. a los Agentes Inteligentes Simulación de entorno
function Run-Eval-Environment(state, Update-Fn, agents,
termination, Performance-Fn) returns scores
local : scores, a vector the same size as agents, initially all 0
repeat
for each agent in agents do
Percept[agent] ¬ Get-Percept(agent, state)
end
for each agent in agents do
Action[agent] ¬ Program[agent](Percept[agent])
end
state ¬ Update-Fn(actions, agents, state)
scores ¬ Performance-Fn(scores, agents, state)
until termination(state)
return scores
Casi siempre, los agentes se han diseñado para satisfacer una cierta clase de ambiente
– medición de buen éxito en ese ambiente, definido por un estado inicial singular y una función de actualización particular.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
39 de 52
Introd. a los Agentes Inteligentes Estructura de un agente inteligente Como todos los agentes tienen una estructura básica o mínima o
esquelética igual, se puede investigar cuál es ella.
Resulta así un AGENTE ESQUELÉTICO:
– Desde un punto de vista estricto, no es necesario que el agente
guarde en su memoria las percepciones entrantes depende del
dominio. Un dominio es un fragmento del mundo acerca del que
deseamos adquirir conocimiento.
– El agente esquelético no incorpora la medida de buen éxito en su
meta se entiende que ella está siendo aplicada externamente.
function Skeleton-Agent(percept) returns action
static: memory, the agent's memory of the world
memory Update-Memory(memory, percept)
action Choose-Best-Action(memory)
memory Update-Memory(memory, action)
return action
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
40 de 52
Introd. a los Agentes Inteligentes Ideal: Disponer de una tabla
Lo básico de un agente tabla-intensivo:
¿Por qué fracasa el ideal de disponer de una tabla de consulta?
– Esta arquitectura adolece de
• tamaño excesivo (no factible)
• falta de adaptación.
– ¿Qué tamaño tendría que tener la tabla? (Caso límite, el termóstato)
– El agente ¿podría aprender de sus errores?
– ¿De dónde podría provenir dicha tabla en primera instancia?
function Table-Driven-Agent(percept) returns action
static: percepts, a sequence, initially empty
table, a table indexed by percept sequences, initially fully specified
append percept to the end of percepts
action LookUp(percepts, table)
return action
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
41 de 52
Introd. a los Agentes Inteligentes Tipos de Agentes
Tabla-intensivos
– para encontrar la acción siguiente usar una tabla en memoria del tipo “secuencia
de percepciones”/acción. Se trata de una tabla bastante voluminosa para repetir la
acción ya experimentada antes.
Agentes reflejos con un único estado (simples)
– se basan en reglas condición/acción y se implementan con un sistema de
PRODUCCIÓN. Carecen de memoria referente a estados pasados del mundo.
Bien informados de lo que pasa
Agentes con memoria
– con un estado interno usado para seguirle la pista a los estados pasados del mundo.
Agentes meta-intensivos
– además de disponer de información sobre el estado, tienen una clase de información
sobre la meta que describe situaciones deseables. Agentes de este tipo tienen bajo
consideración eventos del futuro.
Utilidad-intensivos
– basan su decisión en la teoría axiomática clásica de la utilidad para actuar
racionalmente.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
42 de 52
Introd. a los Agentes Inteligentes Agente reactivo simple
function Simple-Reflex-Agent(percept) returns action
static: rules, a set of condition-action rules
state Interpret-Input(percept)
rule Rule-Match(state, rules)
action Rule-Action[rule]
return action
Las reglas condición-acción
permiten establecer la
conexión entre percepción y
acción.
A la derecha del agente se
indica el estado interno, único
en un momento dado del
proceso decisional.
A la derecha está la base de
conocimiento en forma de
reglas de producción.
El sencillo programa del
agente aparece más abajo
Interpret-input genera una
descripción abstracta del
estado mostrado por la
percepción
Rule-match produce una regla
del conjunto que satisface la
percepción
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
43 de 52
Introd. a los Agentes Inteligentes Agentes reactivos basados en modelos
function Reflex-Agent-With-State(percept) returns action
static: rules, a set of condition-action rules
state, a description of the current world
state ¬ Update-State(state, percept)
rule ¬ Rule-Match(state, rules)
action ¬ Rule-Action[rule]
state ¬ Update-State(state, action)
return action
La actualización del estado
interno requiere dos tipos de
conocimiento codificado
– conocimiento acerca de la
forma como el mundo cambia
- independiente de las
acciones del agente.
– conocimiento acerca de la
forma en que el mundo cambia
con motivo de la acción del
agente
Pero el conocimiento del estado
interno no siempre es suficiente
– para elegir entre rutas
decisionales alternativas(en
una intersección ¿doblar o no
doblar el volante del coche?)
– pues se requiere conocer la
meta a lograr
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
44 de 52
Introd. a los Agentes Inteligentes Agentes basados en objetivos
Razonando acerca de acciones
– un agente reflejo solo actúa basado en conocimientos precomputados (reglas)
– la búsqueda y la planificación ayudan a razonar acerca de cuál acción logra la
meta
– el agente es menos eficiente pero más adaptativo y flexible
Qué argumentar acerca de acciones alternativas que llegan a la meta
– hay que maximizar la utilidad de las acciones, esto es, elegir aquélla que logra la
meta mejor que otras.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
45 de 52
Introd. a los Agentes Inteligentes Agentes basados en objetivos (Arquitectura)
Los agentes simples no tienen acceso a su medida de buen éxito
– En ese caso el diseñador elige la meta y la incorpora por diseño a su agente
Similarmente, los agentes tontos no pueden formular su propio problema
– en cuyo caso dicha formulación también se debe incorporar al diseño
El bucle “while” (mientras) - ver arriba - es la fase de ejecución de la conducta
de este tipo de agentes
– Nótese que en esta arquitectura se sobreentiende que para la fase de ejecución no
importa monitorear el ambiente.
Input percept
state Update-State(state, percept)
goal Formulate-Goal(state, perf-measure)
search-space Formulate-Problem (state, goal)
plan Search(search-space , goal)
while (plan not empty) do
action Recommendation(plan, state)
plan Remainder(plan, state)
output action
end
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
46 de 52
Introd. a los Agentes Inteligentes Agentes basados en utilidad
Función Utilidad
– es un mapeo de estados bajo la forma de números reales
– lleva a decisiones racionales en dos tipos de situaciones
• evaluación de trueques entre metas en conflicto
• evaluación de metas en conflicto
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
47 de 52
Introd. a los Agentes Inteligentes
Agentes basados en utilidad Las metas no bastan para generar una conducta de alta calidad.
Las metas permiten establecer una distinción entre estados “felices”
e “infelices”.
Si se prefiere un estado en lugar de otro, se dice que ese estado
ofrece mayor “utilidad” al agente.
Utilidad
Función que caracteriza el grado de satisfacción.
En temas venideros se mencionará frecuentemente el PRINCIPIO
DE MAXIMA UTILIDAD ESPERADA
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
48 de 52
Introd. a los Agentes Inteligentes Agentes que aprenden
Med
io A
mb
ien
te
Elemento de
aprendizaje
Elemento
de actuación
cambios
conocimiento
Nivel de actuación
Critica
Retroali-
mentación
Actuadores
Sensor
Generador de
problema
Objetivos a
aprender
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
49 de 52
Introd. a los Agentes Inteligentes
Agentes que aprenden En la gráfica previa se estudia un modelo general de agente aprendiz, modelo novedoso
con respecto a lo ya estudiado.
Comparado con los tres diagramas del capítulo 2 de r&n (Agentes inteligentes), este
cuarto diagrama tiene diferencias.
Aparece una entrada adicional (en rojo) ajeno al agente, que es el “estándar de
desempeño” que está marcado aparte por el diseñador si se trata de un agente aprendiz
autónomo o no supervisado, o bien corresponde a un “maestro” en el aprendizaje
supevisado. El “error” debe irse corrigiendo.
La zona de conexión directa entre sensores y efectores está regulada por un elemento de
procesamiento del desempeño en el futuro inmediato, influible por maquinaria auxiliar
de aprendizaje, maquinaria corregida por el “error” detectado.
Las metas del aprendiz pueden tener distintos significados.
Estudiaremos algunos de estos módulos en detalle.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
50 de 52
Introd. a los Agentes Inteligentes
Resumen
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
51 de 52
Introd. a los Agentes Inteligentes Resumen
Las principales preocupaciones de este capitulo:
Un agente percibe y actúa en un cierto ambiente, posee una dada arquitectura y
está implementado a través de un programa de agente.
Un agente ideal (omnisciente) siempre elige aquella acción mediante la cual se
maximiza su logro esperado, sujeta a la secuencia de percepciones recibida
hasta ese momento.
Un agente autónomo usa su experiencia propia en lugar de usar conocimiento
incorporado por su diseñador referente al ambiente.
Un programa de agente mapea la ruta entre percepción y acción y actualiza el
estado interno de dicho agente.
Un agente reflejo (o reactivo) responde de inmediato a las percepciones.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
52 de 52
Introd. a los Agentes Inteligentes Resumen
Otras preocupaciones:
Un agente meta-intensivo (o basado en metas) actúa de tal manera de obtener
el logro de su meta internalizada.
Un agente utilidad – intensivo (o basado en utilidad) maximiza su propia
función de utilidad.
Poder representar el conocimiento (y a veces lograr que ese conocimiento
pueda ser legible por el humano) es importante para que el diseño tenga éxito.
Los ambientes cambian y se presentan como dramaticamente más difíciles
para unos agentes que para otros. Los más difíciles son los ambientes
inaccesibles, no-determinísticos, no-episódicos, dinámicos y continuos. Un
ambiente fácil es el representado por un robot encargado de hacer tostadas.
Luis Enrique
Sánchez Crespo
UCLM-ESI Inte
lig
en
cia
Art
ific
ial
e In
gen
ieri
a d
el C
on
ocim
ien
to
53 de 52
Introd. a los Agentes Inteligentes Conclusiones
La inteligencia artificial se ha presentado como la tecnología de la construcción de agentes inteligentes, con lo cual se unifican temas que no tenían relación con otros enfoques (caso de la robótica y la visión).
Quedó evidente que el hilo conductor es el de ir complicando gradualmente los programas de agente, las funciones de agente y los programas de ambiente.
El futuro estará en los agentes que se comunican, que abarcan numerosos ejemplos de los siete presentados en la serie de diapositivas.
Obviamente la noción de agente aglutina en una meta clara a toda la inteligencia artificial, la cual, sin embargo, al estar enlazada con los ambientes, pierde toda posibilidad de ser una disciplina auto-contenida, pasando a tener condición de multi-disciplinaria.
Universidad de Castilla-La Mancha
Luis Jiménez Linares
Luis Enrique Sánchez Crespo