Типы сред в искусственном интеллекте
Среда в искусственном интеллекте — это окружение агента. Агент получает входные данные из окружающей среды с помощью датчиков и передает выходные данные в окружающую среду с помощью исполнительных механизмов. Существует несколько типов окружающей среды:
- Полностью наблюдаемая и частично наблюдаемая
- Детерминированная и стохастическая
- Конкуренция и сотрудничество
- Одноагентная и многоагентная
- Статическая и динамическая
- Дискретная и непрерывная
- Эпизодическая и последовательная
- Известная и неизвестная
1. Полностью наблюдаемая и частично наблюдаемая
- Если датчик агента способен воспринимать или получать доступ к полному состоянию агента в каждый момент времени, то такая среда называется полностью наблюдаемой, в противном случае — частично наблюдаемой.
- Поддерживать полностью наблюдаемую среду легко, поскольку нет необходимости отслеживать историю изменений в окружающей среде.
- Среда называется ненаблюдаемой , если у агента нет датчиков во всех средах.
- Примеры:
- Шахматы — доска полностью наблюдаема, как и ходы противника.
- Вождение - окружающая среда частично наблюдаема, поскольку неизвестно, что находится за поворотом.
2. Детерминированная и стохастическая среда
- Если уникальность текущего состояния агента полностью определяет его следующее состояние, то среда считается детерминированной.
- Стохастическая среда носит случайный характер, она не уникальна и не может быть полностью определена агентом.
- Примеры:
- Шахматы -в текущей позиции у шахматной фигуры есть всего несколько возможных ходов, и эти ходы можно просчитать.
- Беспилотные автомобили -действия беспилотного автомобиля не уникальны и время от времени меняются.
3. Конкуренция или сотрудничество
- Говорят, что агент находится в конкурентной среде, если он соревнуется с другим агентом за лучший результат.
- В шахматах агенты соревнуются друг с другом за победу в игре, которая и является результатом.
- Говорят, что агент находится в среде сотрудничества, когда несколько агентов взаимодействуют друг с другом для достижения желаемого результата.
- Когда на дорогах появляется несколько беспилотных автомобилей, они взаимодействуют друг с другом, чтобы избежать столкновений и добраться до пункта назначения, который и является желаемым результатом.
4. Одноагентная и многоагентная среды
- Среда, состоящая только из одного агента, называется одноагентной.
- Человек, оказавшийся один в лабиринте, — пример одноагентной системы.
- Среда, в которой участвует более одного агента, называется многоагентной.
- Игра в футбол — многоагентная среда, поскольку в каждой команде по 11 игроков.
5. Динамическая и статическая среды
- Среда, которая постоянно меняется, когда агент совершает какое-либо действие, называется динамической.
- Американские горки — это динамичный аттракцион, поскольку он приводится в движение и окружающая обстановка постоянно меняется.
- Неподвижная обстановка, в которой ничего не меняется, называется статичной.
- Пустой дом статичен, поскольку при входе в него обстановка не меняется.
6. Дискретные и непрерывные величины
- Если среда состоит из конечного числа действий, которые можно совершить в этой среде для получения результата, то такая среда называется дискретной.
- Игра в шахматы — дискретная среда, поскольку в ней есть только конечное число ходов. Количество ходов может меняться в каждой партии, но оно всегда конечно.
- Среда, в которой действия не поддаются нумерации, то есть не является дискретной, называется непрерывной.
- Самоуправляемые автомобили являются примером непрерывной среды, поскольку их действиями являются вождение, парковка и т.д. которые нельзя пронумеровать.
7. Эпизодический против последовательного
- В среде с эпизодическими задачами каждое действие агента делится на атомарные инциденты или эпизоды. Между текущими и предыдущими инцидентами нет никакой зависимости. В каждом инциденте агент получает входные данные от среды, а затем выполняет соответствующее действие.
- Пример: Рассмотрим пример робота Pick and Place, который используется для обнаружения бракованных деталей на конвейерных лентах. Здесь каждый раз робот (агент) принимает решение по текущему вопросу, то есть между текущими и предыдущими решениями нет зависимости.
- В последовательной среде предыдущие решения могут влиять на все последующие. Следующее действие агента зависит от того, какое действие он предпринял ранее и какое действие ему предстоит предпринять в будущем.
- Пример:
- Шашки- где предыдущий ход может повлиять на все последующие.
8. Известная и неизвестная среда
- В известной среде результат всех возможных действий известен. Очевидно, что в случае с неизвестной средой для принятия решения агент должен получить информацию о том, как работает эта среда.