IA: agentes y entornos

Un sistema de IA está compuesto por un agente y su entorno. Los agentes actúan en su entorno. El medio ambiente puede contener otros agentes.

¿Qué son el agente y el entorno?

Un agent es cualquier cosa que pueda percibir su entorno a través sensors y actúa sobre ese entorno a través de effectors.

  • UNA human agent tiene órganos sensoriales como ojos, oídos, nariz, lengua y piel paralelos a los sensores, y otros órganos como manos, piernas, boca, para efectores.

  • UNA robotic agent reemplaza cámaras y telémetros infrarrojos para los sensores, y varios motores y actuadores para los efectores.

  • UNA software agent tiene cadenas de bits codificadas como sus programas y acciones.

Terminología del agente

  • Performance Measure of Agent - Es el criterio, que determina el éxito de un agente.

  • Behavior of Agent - Es la acción que realiza el agente después de una determinada secuencia de percepciones.

  • Percept - Son las entradas perceptivas del agente en una instancia determinada.

  • Percept Sequence - Es el historial de todo lo que un agente ha percibido hasta la fecha.

  • Agent Function - Es un mapa de la secuencia de precepto a una acción.

Racionalidad

La racionalidad no es más que el estado de ser razonable, sensato y tener buen sentido del juicio.

La racionalidad se ocupa de las acciones y los resultados esperados en función de lo que haya percibido el agente. Realizar acciones con el objetivo de obtener información útil es parte importante de la racionalidad.

¿Qué es Ideal Rational Agent?

Un agente racional ideal es aquel que es capaz de realizar las acciones esperadas para maximizar su medida de desempeño, sobre la base de:

  • Su secuencia de percepción
  • Su base de conocimientos incorporada

La racionalidad de un agente depende de lo siguiente:

  • los performance measures, que determinan el grado de éxito.

  • Del agente Percept Sequence hasta ahora.

  • El agente prior knowledge about the environment.

  • los actions que el agente puede realizar.

Un agente racional siempre realiza la acción correcta, donde la acción correcta significa la acción que hace que el agente tenga más éxito en la secuencia de percepción dada. El problema que resuelve el agente se caracteriza por la Medida de rendimiento, el entorno, los actuadores y los sensores (PEAS).

La estructura de los agentes inteligentes

La estructura del agente se puede ver como:

  • Agente = Arquitectura + Programa de agente
  • Arquitectura = la maquinaria sobre la que se ejecuta un agente.
  • Programa de agente = una implementación de una función de agente.

Agentes reflejos simples

  • Eligen acciones solo en función de la percepción actual.
  • Son racionales solo si se toma una decisión correcta solo sobre la base del precepto actual.
  • Su entorno es completamente observable.

Condition-Action Rule - Es una regla que asigna un estado (condición) a una acción.

Agentes reflejos basados ​​en modelos

Usan un modelo del mundo para elegir sus acciones. Mantienen un estado interno.

Model - conocimiento sobre “cómo suceden las cosas en el mundo”.

Internal State - Es una representación de aspectos no observados del estado actual dependiendo del historial de percepción.

Updating the state requires the information about −

  • Cómo evoluciona el mundo.
  • Cómo las acciones del agente afectan al mundo.

Agentes basados ​​en objetivos

Eligen sus acciones para alcanzar sus metas. El enfoque basado en objetivos es más flexible que el agente reflejo, ya que el conocimiento que respalda una decisión se modela explícitamente, lo que permite modificaciones.

Goal - Es la descripción de situaciones deseables.

Agentes basados ​​en servicios públicos

Eligen acciones basadas en una preferencia (utilidad) para cada estado.

Los objetivos son inadecuados cuando:

  • Hay objetivos en conflicto, de los cuales solo se pueden lograr unos pocos.

  • Los objetivos tienen cierta incertidumbre de alcanzarse y es necesario sopesar la probabilidad de éxito con la importancia de un objetivo.

La naturaleza de los entornos

Algunos programas operan en el artificial environment confinado a la entrada de teclado, base de datos, sistemas de archivos de computadora y salida de caracteres en una pantalla.

Por el contrario, algunos agentes de software (robots de software o softbots) existen en dominios ricos e ilimitados de softbots. El simulador tiene unvery detailed, complex environment. El agente de software debe elegir entre una amplia gama de acciones en tiempo real. Un softbot diseñado para escanear las preferencias en línea del cliente y mostrar elementos interesantes al cliente funciona en elreal así como un artificial ambiente.

El más famoso artificial environment es el Turing Test environment, en el que uno real y otros agentes artificiales se prueban en igualdad de condiciones. Este es un entorno muy desafiante, ya que es muy difícil para un agente de software funcionar tan bien como un humano.

Prueba de Turing

El éxito de un comportamiento inteligente de un sistema se puede medir con la prueba de Turing.

En la prueba participan dos personas y una máquina a evaluar. De las dos personas, una desempeña el papel de evaluador. Cada uno de ellos se sienta en diferentes habitaciones. El evaluador desconoce quién es una máquina y quién es un ser humano. Interroga las preguntas mecanografiando y enviándolas a ambas inteligencias, a las que recibe respuestas mecanografiadas.

Esta prueba tiene como objetivo engañar al evaluador. Si el probador no logra determinar la respuesta de la máquina a partir de la respuesta humana, se dice que la máquina es inteligente.

Propiedades del medio ambiente

El medio ambiente tiene múltiples propiedades:

  • Discrete / Continuous- Si hay un número limitado de estados del entorno distintos y claramente definidos, el entorno es discreto (por ejemplo, ajedrez); de lo contrario, es continuo (por ejemplo, conducción).

  • Observable / Partially Observable- Si es posible determinar el estado completo del medio ambiente en cada momento a partir de las percepciones, es observable; de lo contrario, es sólo parcialmente observable.

  • Static / Dynamic- Si el entorno no cambia mientras un agente está actuando, entonces es estático; de lo contrario, es dinámico.

  • Single agent / Multiple agents - El medio ambiente puede contener otros agentes que pueden ser del mismo tipo o de un tipo diferente al del agente.

  • Accessible / Inaccessible - Si el aparato sensorial del agente puede tener acceso al estado completo del medio ambiente, entonces el medio ambiente es accesible para ese agente.

  • Deterministic / Non-deterministic- Si el siguiente estado del entorno está completamente determinado por el estado actual y las acciones del agente, entonces el entorno es determinista; de lo contrario, no es determinista.

  • Episodic / Non-episodic- En un entorno episódico, cada episodio consiste en que el agente percibe y luego actúa. La calidad de su acción depende solo del episodio en sí. Los episodios posteriores no dependen de las acciones de los episodios anteriores. Los entornos episódicos son mucho más simples porque el agente no necesita pensar en el futuro.