Откуда у ИИ берётся характер

⏱️ Примерное время: ~12 минут · 🎯 Урок 3 курса «Возможности и ограничения ИИ» · 🎬 видео

Что вы узнаете

Примерное время: 25 минут

К концу этого урока вы сможете:

Простыми словами объяснить двухэтапный процесс обучения генеративного ИИ (предобучение и дообучение).
Распознавать поведенческие «отпечатки», которые оставляет каждый этап: угодливость, многословность, чрезмерную осторожность и слабую калибровку уверенности.
Применять это понимание, чтобы интерпретировать поведение, которое вы наблюдаете в собственных взаимодействиях с ИИ.

Откуда у ИИ берётся характер

(5 минут)

Вежливость, готовность помочь и осторожность ИИ — это не возникающее само по себе волшебство. Они закладываются в процессе обучения, слой за слоем, и каждый этап обучения оставляет на том, как система взаимодействует с вами, конкретные и предсказуемые отпечатки.

Предобучение, дообучение и отпечатки, которые они оставляют

Два этапа обучения превращают сырое предсказание в того полезного ассистента, с которым вы общаетесь, — и каждый этап оставляет отпечатки на его поведении.

Модель прочитывает огромные объёмы текста и учится одному: предсказывать, что идёт дальше. Она становится мощным «дописывателем» документов — но не имеет никакого понятия о том, чтобы помогать вам.

Человеческие предпочтения превращают этого «дописывателя» документов в ассистента — такого, который воспринимает ваш ввод как запрос, помогает в ответе и отклоняет вредоносные просьбы.

Ключевые выводы

Предобучение создаёт «дописывателя» документов, предсказывая «что идёт дальше» на огромных объёмах данных. После этого этапа у модели нет никакого понятия о том, чтобы помогать вам.
Дообучение надстраивает поверх этого поведение ассистента: воспринимать ваш ввод как запрос, отвечать по делу, а не растекаться мыслью, и отклонять вредоносные просьбы.
Дообучение использует человеческие суждения о том, какие ответы хороши, и эти суждения оставляют отпечатки: тяготение к угодливости, склонность к многословности по умолчанию, периодическую чрезмерную осторожность и слабую калибровку между заявленной уверенностью и реальной надёжностью.

Упражнения

Практика: отпечатки на вашей собственной работе

Зачем? Угодливость, многословность, чрезмерная осторожность и слабая калибровка уверенности проявляются в каждой модели ИИ. Вопрос в том, способны ли вы заметить их, когда они влияют на работу, которая вам действительно важна.

Выберите одну задачу из списка, который вы составили на Уроке 1. Что-то, что вы уже реально прогоняли через ИИ и о чём имеете чёткое представление, как выглядит хороший результат. Вы прогоните эту задачу три раза с небольшими вариациями и понаблюдаете, что меняется.

Прогон 1: Напрямую. Сформулируйте задачу так, как вы обычно это делаете. Сохраните результат.
Прогон 2: Тест на угодливость. Запустите ту же задачу, но на этот раз предварите её ошибочным допущением. Например, если вы просите обратную связь по стратегии, начните с фразы «Я считаю, что эта стратегия неуязвима». Посмотрите, подтвердит ли ИИ вашу установку или возразит. Затем попробуйте ещё раз с явным приглашением: «Я хочу, чтобы ты искренне со мной не согласился, если считаешь, что я неправ». Сравните два ответа.
Прогон 3: Тест на многословность. Задайте ИИ связанный с вашей задачей вопрос, ответ на который укладывается в одно предложение. Отметьте, сколько текста вы получите. Затем переспросите с уточнением «Ответь одним предложением». Сравните длину. Разрыв между двумя ответами — это и есть многословность по умолчанию в действии.
Дополнительно: Тест на осторожность. Если в вашей области есть какие-либо «серые зоны» (а они есть почти везде), спросите что-то на грани того, что, по вашим ожиданиям, должно быть нормальным: взаимодействие лекарств, юридический нюанс, слегка нестандартный творческий запрос. Отметьте, ощущается ли осторожность соразмерной реальному риску — или она рефлекторная.

Теперь сделайте шаг назад. Какой отпечаток проявился на вашей работе наиболее отчётливо? Изменило ли то, что вы назвали его заранее, ваше восприятие этого поведения?

Размышление над уроком

Где в вашей собственной работе угодливость с наибольшей вероятностью вам навредит? (Подсказка: везде, где вы надеетесь на честную обратную связь.)
Где с наибольшей вероятностью навредит многословность? (Подсказка: везде, где вам нужна краткость в условиях нехватки времени.)

Что дальше

Теперь мы переходим к самим четырём свойствам, начиная с того, которое объясняет в поведении ИИ больше, чем любое другое: предсказание следующего токена. Откуда на самом деле берутся ответы ИИ?

Обратная связь

По мере прохождения курса нам будет очень интересно услышать от вас, как вы применяете концепции из курса в своей работе, а также любые ваши отзывы. Поделитесь обратной связью здесь.

Благодарности и лицензия

Copyright 2026 Anthropic. Оригинальная работа основана на фреймворке AI Fluency, разработанном проф. Риком Дэйканом (Ringling College of Art and Design) и проф. Джозефом Феллером (University College Cork). Выпущено под лицензией CC BY-NC-SA 4.0.