Практическое руководство по промпт-инжинирингу: работа с GPT-5.2 и Claude 4.6

С выходом последних флагманских моделей от OpenAI и Anthropic фокус в работе с ИИ сместился с написания простых запросов на управление агентными системами — сложными ИИ-системами, которые самостоятельно планируют шаги, используют инструменты и сохраняют состояние в длинных циклах. Для эффективной работы с ними специалистам необходимо освоить новые методы управления интеллектуальными ресурсами моделей.

Архитектура промпта: XML, роли и иерархия

Обе модели — GPT-5.2 и Claude 4.6 — лучше всего работают со структурированным вводом.

XML-теги: Обертывание инструкций, примеров и данных в теги (например, <instructions>, <context>, <example>) помогает модели однозначно разделять компоненты запроса.
Назначение роли: Роль в системном промпте фокусирует тон и глубину анализа.
Расположение данных (для Claude 4.6): При работе с контекстом более 20к токенов данные и документы следует размещать в начале промпта, а конкретные инструкции и вопросы — в конце. Это может повысить качество ответов на 30%.
Цитирование: При анализе длинных документов требуйте от модели сначала привести цитаты (<quotes>), а затем давать ответ — это минимизирует риск потери информации.

GPT-5.2: Корпоративная дисциплина и сжатие

GPT-5.2 разработана для задач, где важны точность и следование регламентам.

reasoning_effort: Параметр управления глубиной размышлений (none, low, medium, high). Для GPT-5.2 значение по умолчанию — none, что обеспечивает максимальную скорость.
Compaction (Компактизация): Для длинных сессий используйте эндпоинт /responses/compact. Он выполняет сжатие истории с сохранением смысла, позволяя модели продолжать работу за пределами стандартного окна контекста.
Структурированное извлечение: При работе с PDF и таблицами всегда предоставляйте JSON-схему и требуйте «полноты извлечения» (extraction completeness). Результаты по разным документам следует сериализовать отдельно с указанием стабильного ID (например, имени файла).

Claude 4.6: Адаптивное мышление и визуальный анализ

Claude 4.6 отличается высокой проактивностью и улучшенным «зрением».

Адаптивное мышление (Adaptive Thinking, параметр effort): Модель сама решает, сколько ресурсов потратить на размышления.
- Low: Для простых чатов и классификаций.
- Medium: Стандарт для кодинга и бизнес-задач.
- High: Для автономных агентов и глубоких исследований.
- Важно: При использовании medium или high рекомендуется устанавливать лимит max_tokens на уровне 64k, чтобы у модели было место для вывода цепочки рассуждений.
Борьба с «AI slop» в дизайне: Чтобы избежать шаблонных фронтенд-интерфейсов, явно требуйте использования нестандартных паттернов и интерактивности. Используйте навык crop tool (обрезка): модель лучше анализирует пользовательский интерфейс, если может «зумить» отдельные части скриншотов.

Построение агентных систем и использование инструментов

Агенты теперь могут выполнять действия параллельно, что требует новых подходов к контролю.

Параллельные вызовы: Явно разрешайте модели сканировать кодовые базы или выполнять поиск в нескольких источниках одновременно для ускорения работы.
Глубокое отслеживание состояния (State Tracking):
- JSON — для структурированных данных и результатов тестов.
- Git-логи — для хронологии действий агента.
- Progress.txt — для неструктурированных заметок о прогрессе.
Безопасность: Для необратимых действий (удаление файлов, push в репозиторий) вводите обязательное подтверждение человеком.
Исследовательская планка: В задачах поиска (Web Search) задавайте предел исследования: например, «продолжай поиск до тех пор, пока ценность новой информации не начнет падать».

Методология миграции и оптимизация

При переходе на новые модели ваши старые промпты могут стать избыточными.

Базовый тест: Смените модель в API, сохранив промпт идентичным.
Отказ от предзаполнений и анти-лени: Claude 4.6 больше не поддерживает предзаполнение ответа ассистента (prefills). Также уберите агрессивные инструкции против лени (вроде «CRITICAL: YOU MUST…» или «ТЫ ОБЯЗАН использовать инструмент») — новые модели стали инициативнее и старые «пинки» могут привести к перегрузке лишними действиями (overtriggering).
Итерация через тестирование: Повышайте уровень усилий (effort) только если базовые тесты (evals) показывают регрессию.

Заключение

Современный промпт-инжиниринг — это не поиск «волшебных слов», а архитектурное управление рамками и усилиями ИИ.

Ключ к успеху сегодня:

Доверие логике: Не навязывайте модели пошаговый план, если она способна продумать его сама через адаптивное мышление (Adaptive Thinking).
Структурный контроль: Используйте XML для входящих данных и JSON для выходных.
Ресурсная эффективность: Настраивайте параметры усилий и используйте компактизацию для экономии контекста.

Социальные сети проекта:

Подпишись, чтобы ничего не пропустить!

Архитектура промпта: XML, роли и иерархия#

GPT-5.2: Корпоративная дисциплина и сжатие#

Claude 4.6: Адаптивное мышление и визуальный анализ#

Построение агентных систем и использование инструментов#

Методология миграции и оптимизация#

Заключение#