С выходом последних флагманских моделей от OpenAI и Anthropic фокус в работе с ИИ сместился с простых чат-ботов на агентные системы (agentic workloads) — автономные или полуавтономные решения, способные выполнять сложные многошаговые задачи, использовать инструменты и сохранять контекст в долгих сессиях.
В этой статье мы разберем ключевые изменения в поведении моделей GPT-5.2 и Claude 4.6, а также дадим практические рекомендации по их настройке и миграции.
Фундаментальные принципы новой эпохи
Несмотря на различия в архитектурах, обе компании подчеркивают несколько общих правил эффективного взаимодействия.
Четкость и структурирование через XML
Использование XML-тегов (например, <instructions>, <context>, <example>) стало де-факто стандартом. Это помогает модели однозначно разделять ваши инструкции, примеры и входные данные, что критически важно для предотвращения путаницы в сложных запросах.
Ролевые модели
Присвоение модели конкретной роли в системном промпте (System Prompt) — это не просто украшение, а способ сфокусировать поведение и тон ответов для конкретной задачи.
Особенности работы с GPT-5.2
GPT-5.2 позиционируется как флагманская модель для корпоративных задач, где приоритетом являются точность, надежность и дисциплинированное выполнение инструкций.
Ключевые отличия и управление
- Сниженная многословность: Модель стала более лаконичной и ориентированной на задачу по умолчанию.
- Контроль галлюцинаций: При неоднозначных запросах GPT-5.2 лучше справляется с определением границ своих знаний. Чтобы минимизировать риски, рекомендуется использовать инструкции на уточнение вместо прямых вопросов.
- Предотвращение отклонений (Scope Drift): В задачах по разработке модель может предлагать избыточные функции. Для контроля необходимо явно прописывать запреты: «никаких дополнительных фич» или использование только конкретных дизайн-систем.
Параметр reasoning_effort
OpenAI использует параметр reasoning_effort (уровни: none, low, medium, high), который позволяет регулировать глубину размышлений модели. Это прямой обмен между скоростью/стоимостью и качеством логических выводов. Для GPT-5.2 значение по умолчанию — none.
Компактизация (Compaction)
Для сверхдлинных диалогов GPT-5.2 поддерживает метод /responses/compact. Это «сжатие» истории переписки с сохранением важных данных, что позволяет модели продолжать работу даже после исчерпания стандартного лимита контекста.
Особенности работы с Claude 4.6
Claude 4.6 демонстрирует значительный прогресс в визуальном восприятии и «адаптивном мышлении».
Адаптивное мышление (Adaptive Thinking)
Claude 4.6 самостоятельно решает, сколько ресурсов потратить на размышления, основываясь на параметре effort и сложности задачи.
- Low: Для простых чатов и классификации.
- Medium: Рекомендуется для большинства приложений и кодинга.
- High: Для глубоких исследований и автономных агентов.
Инструменты и параллелизм
Claude 4.6 эффективно выполняет параллельные вызовы инструментов (например, одновременный поиск в нескольких файлах). При этом важно избегать слишком агрессивных формулировок («ТЫ ОБЯЗАН использовать инструмент»), так как новые модели стали инициативнее и могут начать использовать инструменты там, где это избыточно.
Видение (Vision) и фронтенд
Модель значительно лучше понимает UI и изображения. Для повышения точности рекомендуется предоставлять модели инструмент «зума» (crop tool), чтобы она могла детально изучать фрагменты скриншотов.
Построение агентных систем
Агентные системы — это сценарии, где модель работает в цикле, используя внешние инструменты.
- Отслеживание состояния (State Tracking): Используйте структурированные форматы (JSON) для ведения логов прогресса и списков задач.
- Безопасность: Включайте в промпты требования обязательного подтверждения человеком рискованных действий (удаление файлов, финансовые операции).
- Инкрементальный прогресс: Наставляйте модель двигаться мелкими шагами, фиксируя промежуточные результаты.
Гайд по миграции на новые модели
При переходе на GPT-5.2 или Claude 4.6 придерживайтесь системного подхода:
- Шаг 1: Смените модель, не меняя промпт. Зафиксируйте базовую производительность.
- Шаг 2: Настройте уровни «усилий» (
reasoning_effort/effort). Помните, что высокие настройки повышают латентность. - Шаг 3: Откажитесь от предзаполнения ответов (prefills) для Claude 4.6 — эта функция устарела, так как модель теперь лучше следует инструкциям напрямую.
- Шаг 4: Запустите тесты (evals). Проверьте, не привели ли инструкции против «лени» из старых промптов к избыточной работе модели.
Заключение
Переход к моделям уровня GPT-5.2 и Claude 4.6 требует смены парадигмы: от попыток «заставить модель работать» к точному управлению её интеллектуальными ресурсами.
Главный вывод для эффективной работы сегодня: доверяйте внутренней логике моделей, но жестко ограничивайте рамки их действий. Новые системы стали достаточно умными, чтобы самостоятельно строить планы решения задач (через “Adaptive Thinking” или “deliberate scaffolding”), поэтому избыточный микроменеджмент в промптах часто идет во вред. Вместо написания бесконечных инструкций «как думать», сфокусируйтесь на архитектуре проверок (evals), структурировании данных (XML/JSON) и балансе между качеством и затратами через параметры усилий.