profile
Дмитрий Антонычев
  • 3 недели назад
  • ·
  • Опубликовано на веб-форуме
Типы сред в искусственном интеллекте

Среда в искусственном интеллекте — это окружение агента. Агент получает входные данные из окружающей среды с помощью датчиков и передает выходные данные в окружающую среду с помощью исполнительных механизмов. Существует несколько типов окружающей среды:
  • Полностью наблюдаемая и частично наблюдаемая
  • Детерминированная и стохастическая
  • Конкуренция и сотрудничество
  • Одноагентная и многоагентная
  • Статическая и динамическая
  • Дискретная и непрерывная
  • Эпизодическая и последовательная
  • Известная и неизвестная
1. Полностью наблюдаемая и частично наблюдаемая
  • Если датчик агента способен воспринимать или получать доступ к полному состоянию агента в каждый момент времени, то такая среда называется полностью наблюдаемой, в противном случае — частично наблюдаемой.
  • Поддерживать полностью наблюдаемую среду легко, поскольку нет необходимости отслеживать историю изменений в окружающей среде.
  • Среда называется ненаблюдаемой , если у агента нет датчиков во всех средах.
  • Примеры:
  • Шахматы — доска полностью наблюдаема, как и ходы противника.
  • Вождение - окружающая среда частично наблюдаема, поскольку неизвестно, что находится за поворотом.
2. Детерминированная и стохастическая среда
  • Если уникальность текущего состояния агента полностью определяет его следующее состояние, то среда считается детерминированной.
  • Стохастическая среда носит случайный характер, она не уникальна и не может быть полностью определена агентом.
  • Примеры:
  • Шахматы -в текущей позиции у шахматной фигуры есть всего несколько возможных ходов, и эти ходы можно просчитать.
  • Беспилотные автомобили -действия беспилотного автомобиля не уникальны и время от времени меняются.
3. Конкуренция или сотрудничество
  • Говорят, что агент находится в конкурентной среде, если он соревнуется с другим агентом за лучший результат.
  • В шахматах агенты соревнуются друг с другом за победу в игре, которая и является результатом.
  • Говорят, что агент находится в среде сотрудничества, когда несколько агентов взаимодействуют друг с другом для достижения желаемого результата.
  • Когда на дорогах появляется несколько беспилотных автомобилей, они взаимодействуют друг с другом, чтобы избежать столкновений и добраться до пункта назначения, который и является желаемым результатом.
4. Одноагентная и многоагентная среды
  • Среда, состоящая только из одного агента, называется одноагентной.
  • Человек, оказавшийся один в лабиринте, — пример одноагентной системы.
  • Среда, в которой участвует более одного агента, называется многоагентной.
  • Игра в футбол — многоагентная среда, поскольку в каждой команде по 11 игроков.
5. Динамическая и статическая среды
  • Среда, которая постоянно меняется, когда агент совершает какое-либо действие, называется динамической.
  • Американские горки — это динамичный аттракцион, поскольку он приводится в движение и окружающая обстановка постоянно меняется.
  • Неподвижная обстановка, в которой ничего не меняется, называется статичной.
  • Пустой дом статичен, поскольку при входе в него обстановка не меняется.
6. Дискретные и непрерывные величины
  • Если среда состоит из конечного числа действий, которые можно совершить в этой среде для получения результата, то такая среда называется дискретной.
  • Игра в шахматы — дискретная среда, поскольку в ней есть только конечное число ходов. Количество ходов может меняться в каждой партии, но оно всегда конечно.
  • Среда, в которой действия не поддаются нумерации, то есть не является дискретной, называется непрерывной.
  • Самоуправляемые автомобили являются примером непрерывной среды, поскольку их действиями являются вождение, парковка и т.д. которые нельзя пронумеровать.
7. Эпизодический против последовательного
  • В среде с эпизодическими задачами каждое действие агента делится на атомарные инциденты или эпизоды. Между текущими и предыдущими инцидентами нет никакой зависимости. В каждом инциденте агент получает входные данные от среды, а затем выполняет соответствующее действие.
  • Пример: Рассмотрим пример робота Pick and Place, который используется для обнаружения бракованных деталей на конвейерных лентах. Здесь каждый раз робот (агент) принимает решение по текущему вопросу, то есть между текущими и предыдущими решениями нет зависимости.
  • В последовательной среде предыдущие решения могут влиять на все последующие. Следующее действие агента зависит от того, какое действие он предпринял ранее и какое действие ему предстоит предпринять в будущем.
  • Пример:
  • Шашки- где предыдущий ход может повлиять на все последующие.
8. Известная и неизвестная среда
  • В известной среде результат всех возможных действий известен. Очевидно, что в случае с неизвестной средой для принятия решения агент должен получить информацию о том, как работает эта среда.

Комментарии (555)
profile Войдите в систему, чтобы опубликовать свой комментарий
Profile
Присоединился
Был
Посты
0
Голоса "За"
0
Голоса "Против"
0

Мы можем использовать файлы cookie или любые другие технологии отслеживания, когда вы посещаете наш веб-сайт, включая любые другие медиа-формы, мобильные веб-сайты или мобильные приложения, связанные с Сайтом или подключенные к нему, чтобы помочь настроить Сайт и улучшить ваш опыт. Узнать больше

Разрешить