NOY Space - Topic Detail

Дмитрий Антонычев

3 недели назад
·
Опубликовано на веб-форуме

Типы сред в искусственном интеллекте

Среда в искусственном интеллекте — это окружение агента. Агент получает входные данные из окружающей среды с помощью датчиков и передает выходные данные в окружающую среду с помощью исполнительных механизмов. Существует несколько типов окружающей среды:

Полностью наблюдаемая и частично наблюдаемая
Детерминированная и стохастическая
Конкуренция и сотрудничество
Одноагентная и многоагентная
Статическая и динамическая
Дискретная и непрерывная
Эпизодическая и последовательная
Известная и неизвестная

1. Полностью наблюдаемая и частично наблюдаемая

Если датчик агента способен воспринимать или получать доступ к полному состоянию агента в каждый момент времени, то такая среда называется полностью наблюдаемой, в противном случае — частично наблюдаемой.
Поддерживать полностью наблюдаемую среду легко, поскольку нет необходимости отслеживать историю изменений в окружающей среде.
Среда называется ненаблюдаемой , если у агента нет датчиков во всех средах.
Примеры:
Шахматы — доска полностью наблюдаема, как и ходы противника.
Вождение - окружающая среда частично наблюдаема, поскольку неизвестно, что находится за поворотом.

2. Детерминированная и стохастическая среда

Если уникальность текущего состояния агента полностью определяет его следующее состояние, то среда считается детерминированной.
Стохастическая среда носит случайный характер, она не уникальна и не может быть полностью определена агентом.
Примеры:
Шахматы -в текущей позиции у шахматной фигуры есть всего несколько возможных ходов, и эти ходы можно просчитать.
Беспилотные автомобили -действия беспилотного автомобиля не уникальны и время от времени меняются.

3. Конкуренция или сотрудничество

Говорят, что агент находится в конкурентной среде, если он соревнуется с другим агентом за лучший результат.
В шахматах агенты соревнуются друг с другом за победу в игре, которая и является результатом.
Говорят, что агент находится в среде сотрудничества, когда несколько агентов взаимодействуют друг с другом для достижения желаемого результата.
Когда на дорогах появляется несколько беспилотных автомобилей, они взаимодействуют друг с другом, чтобы избежать столкновений и добраться до пункта назначения, который и является желаемым результатом.

4. Одноагентная и многоагентная среды

Среда, состоящая только из одного агента, называется одноагентной.
Человек, оказавшийся один в лабиринте, — пример одноагентной системы.
Среда, в которой участвует более одного агента, называется многоагентной.
Игра в футбол — многоагентная среда, поскольку в каждой команде по 11 игроков.

5. Динамическая и статическая среды

Среда, которая постоянно меняется, когда агент совершает какое-либо действие, называется динамической.
Американские горки — это динамичный аттракцион, поскольку он приводится в движение и окружающая обстановка постоянно меняется.
Неподвижная обстановка, в которой ничего не меняется, называется статичной.
Пустой дом статичен, поскольку при входе в него обстановка не меняется.

6. Дискретные и непрерывные величины

Если среда состоит из конечного числа действий, которые можно совершить в этой среде для получения результата, то такая среда называется дискретной.
Игра в шахматы — дискретная среда, поскольку в ней есть только конечное число ходов. Количество ходов может меняться в каждой партии, но оно всегда конечно.
Среда, в которой действия не поддаются нумерации, то есть не является дискретной, называется непрерывной.
Самоуправляемые автомобили являются примером непрерывной среды, поскольку их действиями являются вождение, парковка и т.д. которые нельзя пронумеровать.

7. Эпизодический против последовательного

В среде с эпизодическими задачами каждое действие агента делится на атомарные инциденты или эпизоды. Между текущими и предыдущими инцидентами нет никакой зависимости. В каждом инциденте агент получает входные данные от среды, а затем выполняет соответствующее действие.
Пример: Рассмотрим пример робота Pick and Place, который используется для обнаружения бракованных деталей на конвейерных лентах. Здесь каждый раз робот (агент) принимает решение по текущему вопросу, то есть между текущими и предыдущими решениями нет зависимости.
В последовательной среде предыдущие решения могут влиять на все последующие. Следующее действие агента зависит от того, какое действие он предпринял ранее и какое действие ему предстоит предпринять в будущем.
Пример:
Шашки- где предыдущий ход может повлиять на все последующие.

8. Известная и неизвестная среда

В известной среде результат всех возможных действий известен. Очевидно, что в случае с неизвестной средой для принятия решения агент должен получить информацию о том, как работает эта среда.

Комментарии ⁽⁵⁵⁵⁾

Войдите в систему, чтобы опубликовать свой комментарий

Общайтесь, делитесь информацией и участвуйте в жизни сообщества, выстраивайте отношения. Пожалуйста, войдите в систему, если вы уже зарегистрированы, или создайте учетную запись.

Присоединяйтесь к сообществу Уже являетесь участником?

8
Форум
7
Категория
15
Подкатегория
48
Тема

Дмитрий Антонычев

Типы сред в искусственном интеллекте

Теги:

Комментарии ⁽⁵⁵⁵⁾

Добрый день 👋

📊 Статистика

8

7

15

48

🌟 Участники

0

0

0

Дмитрий Антонычев

Типы сред в искусственном интеллекте

Теги:

Комментарии (555)

Добрый день 👋

📊 Статистика

8

7

15

48

🌟 Участники

0

0

0

Комментарии ⁽⁵⁵⁵⁾