Новости ML, AI и technical safety

13 марта 2026 г.

20:00 - 22:00

Москва, ЦДО Моноид

Это регулярные встречи дискуссионной группы по ML, AI и technical safety. Мы ищем статьи, которые что-то значат для области, чтобы их обсудить и попытаться понять и их смысл, и их роль.

На этой неделе читаем:

Categorizing Variants of Goodhart's Law - попытка более формального взгляда на многоликий закон Гудхарта, который мы поминали не раз и не два.
Intent Laundering: AI Safety Datasets Are Not What They Seem - чем мы меряем то, что называем "безопасность модели" и насколько это число отражает безопасность модели? Как выяснили авторы статьи, самый мягкий ответ на второй вопрос - "не очень хорошо".

Чтобы поучаствовать во встрече, нужно:

️прочитать статью,
️прийти и обсудить прочитанное.

📍Адрес: Ломоносовский проспект, 25к3, по вопросам прохода на территорию пишите @MonoidAdmin