代理可以根据其感知智能和能力的程度分为五类。所有这些代理都可以改善其性能并在一段时间内产生更好的行动。这些如下:
- 简单的反射代理
- 基于模型的反射代理
- 基于目标的代理商
- 基于效用的代理
- 学习代理
1. 简单的反射代理
- 简单反射代理是最简单的代理。这些代理人根据当前的感知来做出决定,并忽略其余的感知历史。
- 这些代理只能在完全可观察的环境中取得成功。
- 简单反射代理在决策和行动过程中不考虑感知历史的任何部分。
- 简单反射代理适用于Condition-action规则,它将当前状态映射到操作。如房间清洁剂,只有在房间有污垢时才有效。
- 简单反射代理设计方法的问题:
- 它们的智力非常有限。
- 它们不了解当前状态的非感知部分。
- 通常太大而无法生成和存储。
- 不适应环境的变化。
2. 基于模型的反射代理
- 基于模型的代理可以在部分可观察的环境中工作,并跟踪情况。
- 基于模型的代理有两个重要因素:
- 模型:它是关于“世界上的事情如何发生”的知识,因此它被称为基于模型的代理。
- 内部状态:它是基于感知历史的当前状态的表示。
- 这些代理人拥有“对世界的了解”的模型,并根据他们执行操作的模型。
- 更新代理状态需要以下信息:
- 世界如何演变
- 代理人的行为如何影响世界。
3. 基于目标的代理
- 当前状态环境的知识并不总是足以决定代理做什么。
- 代理人需要知道描述理想情况的目标。
- 基于目标的代理通过获取“目标”信息来扩展基于模型的代理的功能。
- 选择一个动作,以便它们能够实现目标。
- 在决定是否实现目标之前,这些代理可能必须考虑一系列可能的动作。对不同场景的这种考虑称为搜索和计划,这使得代理主动。
4. 基于效用的代理
- 这些代理与基于目标的代理类似,但提供了效用度量的额外组成部分,通过在给定状态下提供成功度量,使它们不同。
- 基于效用的代理不仅基于目标而且基于实现目标的最佳方式。
- 当存在多个可能的替代方案时,基于实用程序的代理程序非常有用,并且代理程序必须选择以执行最佳操作。
- 效用函数将每个状态映射到实数,以检查每个操作实现目标的效率。
5. 学习代理
- AI中的学习代理是可以从过去的经验中学习或具有学习能力的代理类型。
- 它开始以基本知识行动,然后能够通过学习自动行动和适应。
- 学习代理主要有四个概念组件,它们是:
- 学习要素:它通过学习环境来改进。
- 评论家:学习元素从评论家那里获得反馈,这些反馈描述了代理人在固定绩效标准方面的表现。
- 绩效要素:负责选择外部行动。
- 问题生成器:该组件负责建议可以带来新的信息体验的操作。
- 因此,学习代理能够学习,分析性能,并寻找提高性能的新方法。