Публикации по теме 'agent-based-modeling'


Начало работы с обучением с подкреплением - крестики-нолики
Реализация простой модели обучения с подкреплением с двумя агентами Представьте, что вы пытаетесь максимизировать свою повседневную продуктивность, выбирая набор занятий (учеба, переедание, мечтания). Здесь вы - агент , пытающийся максимизировать вознаграждение (т. Е. Продуктивность), выбирая подмножество вероятных действий. Каждое действие, которое вы выберете, приведет вас в новое состояние (например, если вы выберете разгул, а не тренировку своей модели RL, это повлияет на ваше..