ИИ-модель-провокатор эффективно отучает чат-боты генерировать опасный контент

ИИ-модель-провокатор эффективно отучает чат-боты генерировать опасный контент https://hightech.plus/2024/04/11/ii-model-provokator-effektivno-otuchaet-chat-boti-generirovat-opasnii-kontent Екатерина Смирнова Thu, 11 Apr 2024 09:47:46 +0000 ИИ-модель-провокатор эффективно отучает чат-боты генерировать опасный контент разработали метод, который учит чат-бота «красной команды» генерировать более разнообразные провокационные запросы. Это позволяет выявить и устранить больше потенциальных проблем безопасности. Так, модель выдала 196 запросов, которые вызвали «токсичные» ответы у чат-бота,...