Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Планирование поведения агентов на основе приобретенных знаний
Аннотация:
Abstract:
| Авторы: Виноградов Г.П. (wgp272ng@mail.ru) - Тверской государственный технический университет (профессор), Тверь, Россия, доктор технических наук, Лазырин М.Б. () - | |
| Ключевое слово: |
|
| Ключевое слово: |
|
| Количество просмотров: 14219 |
Версия для печати Выпуск в формате PDF (1.11Мб) |
Планирование поведения агентов на основе приобретенных знаний
Статья опубликована в выпуске журнала № 3 за 2006 год.
При практической реализации агентных систем, а особенно систем с использованием интеллектуальных агентов, основной задачей является обеспечение их интеллектуального поведения. Поведение агентов основывается на механизмах принятия решений, в свою очередь, принятие решений может происходить рефлекторно и описываться программой или на основе логического вывода при помощи некоторых данных [2]. Наиболее близко к интеллектуальному адаптивное поведение, реализованное на основе накопленных знаний. В работе предлагается модификация метода планирования поведения агентов. В основу обучающейся планирующей системы автономного агента взят метод планирования автономных агентов команды PSI [1] . Представим агента команды PSI как множество: Полное состояние агента может быть представлено как: Идея выработки планов [1] строится на понятиях расширенного плана и планирующей функции, а также на определении элементарного плана как четверки 1. 2. Если план 3. Если элементарные планы В [1] расширенный план определен как слово языка планов 1. 2. Если 3. Если 4. Если Планирующая функция в [1] определена как отображение: Правила работы планирующей функции [1]: 1. Если 2. Если 3. 4. Во всех остальных случаях Очевидно, что модель обучающегося агента будет отличаться от модели агента Представим обучающегося агента как множество: Обучение агента производится за счет изменения нечетких показателей отношения Обучение агента происходит в соответствии со следующими правилами. 1. Если 2. Если 3. Если Предварительная настройка системы ложится на разработчиков, в частности назначение первоначальных значений нечетких показателей отношений прерываемости и приоритетов в базе знаний агента, но предлагаемый подход предполагает их подстройку в процессе функционирования. Дальнейшим развитием системы может являться динамическое расширение семейств частичных приоритетов за счет представления их как Список литературы 1. Кожушкин А.Н. Метод планирования автономных агентов команды PSI // Тр. Междунар. конф.: Интеллектуальное управление: новые интеллектуальные технологии в задачах управления (ICIT'99) (декабрь 1999, Переславль-Залесский). – www.raai.org. 2. Клышинский Э.С. Одна модель построения агента // Там же. 3. Поспелов Д.А. Многоагентные системы – настоящее и будущее // Информационные технологии и вычислительные системы. – 1998. – № 1. – С.14 – 21. 4. Чекинов Г.П., Чекинов С.Г. Применение технологии многоагентных систем для интеллектуальной поддержки принятия решения (ИППР) //Сетевой электрон. науч. журн. "Системотехника". – 2003. – № 1. |
| Постоянный адрес статьи: http://www.swsys.ru/index.php?page=article&id=462 |
Версия для печати Выпуск в формате PDF (1.11Мб) |
| Статья опубликована в выпуске журнала № 3 за 2006 год. |
Статья опубликована в выпуске журнала № 3 за 2006 год.
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Программное обеспечение интеллектуально-механических мобильных роботов
- Программное обеспечение банков данных (прагматический подход)
- Методы и средства моделирования wormhole сетей передачи данных
- Паспорт стандартного процесса
- Информационно-аналитическая система научных исследований АСНИ-АГРинформ
Назад, к списку статей


, где
– полное состояние агента;
– множество элементарных действий, которые способен выполнять агент;
– исполнитель плана;
– множество планов агента;
– планирующая функция;
– рабочая база данных агента.
, где
– дискретное множество моментов времени;
– множество входных состояний, определяемое всеми возможными значениями входных данных;
– множество внутренних состояний агента.
, где
и
соответственно условия начала и продолжения плана
;
и
– некоторые отображения. Расширенный план строится в соответствии со следующими правилами [1].
, где
– множество элементарных планов;
– его расширение.
, то существует план
, который является завершающей частью плана
и
, то и элементарный план
, где
,
. Это правило позволяет уточнить умение
, если оно прервало умение
в алфавите
(для краткости символ
обозначается как
);
.
, где
– последовательность символов без «
, то
. Это правило позволяет добавлять основное умение, когда исходная последовательность умений исчерпана или расширенный план пуст.
, где
, то
. Это правило дает возможность преобразовать расширенный план в соответствии с условиями
,
.
, где
и существует
, то
где
– бинарное отношение прерываемости, определенное на
и удовлетворяющее условию
, где
– семейство множеств;
, где
– число уровней иерархии, такое что
и
для
. Это правило обеспечивает временное прерывание выполнения
, где
– множество всех конечных слов в алфавите.
и существует наибольший элемент
по отношению Prior1, то
, где
,
,
, Prior – отношения частичного приоритета, определенные на каждом
.
, где
,
, и для всех
, где
, и
– наибольший элемент множества
по отношению
, где
, тогда если существует наибольший элемент
, то

,
(
), такой что для любого
и
– наибольший элемент множества
и такой, что для любого
найдется
, для которого
или
. Если же такого
не существует, то
.
.
за счет дополнительных составляющих, необходимых для реализации механизма адаптации.
, где
– рабочая база знаний агента, главным ее отличием от базы данных
,
– отношения состояния агента;
и
– функции модификации рабочей базы знаний агента.
. Изменение отношений прерывания
и
, то
,
и
, где
по отношению к моменту времени
происходит ослабление отношений прерываемости
и
,
и
, где
, то
. При увеличении размера буфера элементарных планов до заданного значения происходит его очистка.
, где
,
,
,
, и задания нечетким показателям Prior нейтральных значений. Возможно также развитие системы за счет подстройки параметра
, например в зависимости от временных или ресурсных ограничений на выработку плана поведения агента. Кроме того, в качестве обучающегося механизма возможно использование искусственных нейронных сетей.