С выходом последних флагманских моделей от OpenAI и Anthropic фокус в работе с ИИ сместился с написания простых запросов на управление агентными системами — сложными ИИ-системами, которые самостоятельно планируют шаги, используют инструменты и сохраняют состояние в длинных циклах. Для эффективной работы с ними специалистам необходимо освоить новые методы управления интеллектуальными ресурсами моделей.
Архитектура промпта: XML, роли и иерархия
Обе модели — GPT-5.2 и Claude 4.6 — лучше всего работают со структурированным вводом.
- XML-теги: Обертывание инструкций, примеров и данных в теги (например,
<instructions>,<context>,<example>) помогает модели однозначно разделять компоненты запроса. - Назначение роли: Роль в системном промпте фокусирует тон и глубину анализа.
- Расположение данных (для Claude 4.6): При работе с контекстом более 20к токенов данные и документы следует размещать в начале промпта, а конкретные инструкции и вопросы — в конце. Это может повысить качество ответов на 30%.
- Цитирование: При анализе длинных документов требуйте от модели сначала привести цитаты (
<quotes>), а затем давать ответ — это минимизирует риск потери информации.
GPT-5.2: Корпоративная дисциплина и сжатие
GPT-5.2 разработана для задач, где важны точность и следование регламентам.
- reasoning_effort: Параметр управления глубиной размышлений (
none,low,medium,high). Для GPT-5.2 значение по умолчанию —none, что обеспечивает максимальную скорость. - Compaction (Компактизация): Для длинных сессий используйте эндпоинт
/responses/compact. Он выполняет сжатие истории с сохранением смысла, позволяя модели продолжать работу за пределами стандартного окна контекста. - Структурированное извлечение: При работе с PDF и таблицами всегда предоставляйте JSON-схему и требуйте «полноты извлечения» (extraction completeness). Результаты по разным документам следует сериализовать отдельно с указанием стабильного ID (например, имени файла).
Claude 4.6: Адаптивное мышление и визуальный анализ
Claude 4.6 отличается высокой проактивностью и улучшенным «зрением».
- Адаптивное мышление (Adaptive Thinking, параметр
effort): Модель сама решает, сколько ресурсов потратить на размышления.- Low: Для простых чатов и классификаций.
- Medium: Стандарт для кодинга и бизнес-задач.
- High: Для автономных агентов и глубоких исследований.
- Важно: При использовании
mediumилиhighрекомендуется устанавливать лимитmax_tokensна уровне 64k, чтобы у модели было место для вывода цепочки рассуждений.
- Борьба с «AI slop» в дизайне: Чтобы избежать шаблонных фронтенд-интерфейсов, явно требуйте использования нестандартных паттернов и интерактивности. Используйте навык crop tool (обрезка): модель лучше анализирует пользовательский интерфейс, если может «зумить» отдельные части скриншотов.
Построение агентных систем и использование инструментов
Агенты теперь могут выполнять действия параллельно, что требует новых подходов к контролю.
- Параллельные вызовы: Явно разрешайте модели сканировать кодовые базы или выполнять поиск в нескольких источниках одновременно для ускорения работы.
- Глубокое отслеживание состояния (State Tracking):
- JSON — для структурированных данных и результатов тестов.
- Git-логи — для хронологии действий агента.
- Progress.txt — для неструктурированных заметок о прогрессе.
- Безопасность: Для необратимых действий (удаление файлов, push в репозиторий) вводите обязательное подтверждение человеком.
- Исследовательская планка: В задачах поиска (Web Search) задавайте предел исследования: например, «продолжай поиск до тех пор, пока ценность новой информации не начнет падать».
Методология миграции и оптимизация
При переходе на новые модели ваши старые промпты могут стать избыточными.
- Базовый тест: Смените модель в API, сохранив промпт идентичным.
- Отказ от предзаполнений и анти-лени: Claude 4.6 больше не поддерживает предзаполнение ответа ассистента (
prefills). Также уберите агрессивные инструкции против лени (вроде «CRITICAL: YOU MUST…» или «ТЫ ОБЯЗАН использовать инструмент») — новые модели стали инициативнее и старые «пинки» могут привести к перегрузке лишними действиями (overtriggering). - Итерация через тестирование: Повышайте уровень усилий (
effort) только если базовые тесты (evals) показывают регрессию.
Заключение
Современный промпт-инжиниринг — это не поиск «волшебных слов», а архитектурное управление рамками и усилиями ИИ.
Ключ к успеху сегодня:
- Доверие логике: Не навязывайте модели пошаговый план, если она способна продумать его сама через адаптивное мышление (Adaptive Thinking).
- Структурный контроль: Используйте XML для входящих данных и JSON для выходных.
- Ресурсная эффективность: Настраивайте параметры усилий и используйте компактизацию для экономии контекста.
