Сириус.Курсы запустили новый курс по искусственному интеллекту «Обучение с подкреплением»

Обучение с подкреплением — раздел искусственного интеллекта, в котором модель машинного обучения (агент) учится решать задачи, взаимодействуя с окружающей средой и получая за это награды. Именно так роботы обучаются ходить и переносить вещи, программа AlphaZero — играть в шахматы и го, а современные языковые модели — лучше понимать, что от них нужно людям. «Важно, что в обучении с подкреплением агент не использует заранее заготовленный набор данных. Например, ему нет смысла учиться играть в шахматы, анализируя старые партии гроссмейстеров. Так агент никогда не будет лучше, чем...
Copyright information of photo and video materials was taken from the website «Образовательный центр "Сириус"» , more details in our Terms of Service