Может навредить по ошибке: найдены уязвимости ИИ после 1,5 млн атак

Крупный red-teaming турнир, проведённый с марта по апрель 2025 года, выявил серьёзные проблемы с безопасностью у современных искусственных интеллектов (ИИ) — все тестируемые ИИ-агенты провалили хотя бы один из 44 сценариев проверки.

Руководитель научной группы «Доверенные и безопасные интеллектуальные системы» в Институте искусственного интеллекта AIRI Олег Рогов и эксперты Центра искусственного интеллекта МТС MWS AI рассказали о сути проблемы и возможных путях её решения. .

навредить ошибке найдены уязвимости атак

2025-8-8 16:53