Лекция: Проблема Гудхарта. Метрики, ведущие от цели
Что можно увидеть, если взглянуть на проблему Гудхарта сквозь призму причинных моделей Дж. Перла? Эта лекция — не о «плохих KPI» или «странном ИИ». Это взгляд на фундаментальный принцип: что происходит, когда мы ставим цели и определяем критерии успеха?
Когда мы рассматриваем разные формулировки закона Гудхарта как взаимозаменяемые, не упускаем ли мы чего-то важного? 🤔
-
«Любая наблюдаемая статистическая закономерность имеет тенденцию разрушаться, если на неё оказывается давление с целью контроля».
-
«Когда мера становится целью, она перестаёт быть хорошей мерой».
Что в программе:
-
Поговорим о законе Гудхарта как о причине коллапса систем, будь то KPI, разрушающие жизнеспособные компании, или алгоритмы ИИ, увлечённые specification gaming.
-
Попробуем взглянуть на те же процессы с другой стороны: почему беспилотные автомобили успешно следуют траектории, и при чём здесь закон Гудхарта?
-
Разберёмся, как выглядит динамика поведения системы вокруг "закона Гудхарта" в широком смысле.
-
Поглядим, что можно увидеть, если взглянуть на проблему Гудхарта сквозь призму причинных моделей Дж. Пирла.
Какой мы стремимся сделать эту лекцию:
-
Схемы, которые настолько просты и очевидны, что вы будете недоумевать, почему не додумались до этого сами (спойлер: каузальные модели — ваш новый лучший друг).
-
Медленный, вдумчивый разговор о сложных идеях с вопросами, иронией и возможностью сказать: «Погодите, я что-то не понял».
-
Примеры, которые актуальны для собравшихся — от машинного обучения до реальной жизни.
Для кого:
-
Если вы хотя бы раз слышали о "законе Гудхарта", вы уже готовы.
-
Базовые знания о каузальных диаграммах Дж. Пирла — приветствуются, но не обязательны.
О чём это всё?
📚 Эта лекция — не о «плохих KPI» или «странном ИИ». Это взгляд на фундаментальный принцип: что происходит, когда мы ставим цели и определяем критерии успеха?
Спикер
Олег Лариков