Coding-agent harnesses — сравнение

domain: harness · grid · 2026-06-04 · confidence: medium

О чём это. Девять реальных кодовых harness'ов 2025–2026 как обвязки вокруг LLM. Каждый — это Model + Harness; именно архитектура обвязки (контекст-менеджмент, edit-format, топология, права) определяет, насколько близко к потолку модели дотягивается агент. Концептуальная рамка — в отчёте «Харнес для LLM».
CLI / terminal-native IDE-centric Autonomous / cloud

Девять harness'ов

CLI · closed

Claude Code

Claude (Opus / Sonnet / Haiku) · модель и harness одной командой

CLI+cloud · OSS (Rust)

OpenAI Codex CLI

GPT-5.x-Codex

IDE · closed

Cursor (Composer)

своя Composer (MoE, RL) + Claude / GPT / Gemini

IDE (VS Code) · OSS Apache-2.0

Cline / Roo Code

model-agnostic (GPT-5, Claude 4.x, Gemini, local)

CLI · OSS

Aider

model-agnostic (GPT-5, Claude, Gemini, DeepSeek, Ollama)

CLI · OSS

Gemini CLI

Gemini 3 (1M контекст)

CLI+IDE · closed

Amp (Sourcegraph)

Claude Opus/Sonnet, GPT-5 series

Autonomous cloud · closed

Devin (Cognition)

проприетарный backend

Autonomous · OSS self-host

OpenHands

multi-backend (любые LLM)

Сравнение по осям

Harness Тип Модель OSS Edit-формат Контекст MCP Топология
Claude Code CLI / terminal Claude (co-design) нет string-replace многослойная компакция + sub-agents да в осн. single + sub-agents
Codex CLI CLI + cloud GPT-5.x-Codex да (Rust) patch нативная компакция в модели да single (теряет цепочку 3–4)
Cursor IDE своя Composer + внешние нет модельно-зависимый agent-centric, своя да multi (worktrees, best-of-N)
Cline / Roo IDE (VS Code) agnostic да (Apache-2.0) diff (Roo) / whole (Cline) зависит от модели да (Cline маркет / Roo ручной) single + персоны (Roo)
Aider CLI agnostic да whole / diff / search-replace repo-map + git нет (v0.86.x) Architect/Editor (2 шага)
Gemini CLI CLI Gemini 3 (1M) да built-in tools 1M окно → меньше компакции да single
Amp CLI + IDE Claude / GPT-5 нет модельно-зависимый per-model routing да single + Deep mode
Devin autonomous cloud проприетарный нет внутренний sandbox проприетарный закрыт single-threaded (принципиально)
OpenHands autonomous multi-backend да (self-host) CodeAct (код как действие) Docker + Jupyter + Browser да гибко (single / multi)
Что в этой таблице на самом деле сравнивается. Это сравнение обвязок, не моделей. Один и тот же Opus даёт 93% в Cursor и 77% в Claude Code на Terminal-Bench 2.0 — то есть колонки «edit-формат / контекст / топология» объясняют разброс результата не хуже, чем выбор модели. Цифры — из practitioner-источников (confidence medium).

Когда что выбирать

Сквозной вывод. «Лучшего» harness'а нет — есть совпадение архетипа обвязки с задачей и моделью. Тренд 2026 — «тонкий harness»: способности (планирование, компакция) мигрируют из обвязки в модель, и harness'ы, co-designed с конкретной моделью (Claude Code, Cursor+Composer), выигрывают за счёт совпадения «wire format».