AI 에이전트 시대의 일하는 법: Claude Code와 하네스 엔지니어링 4주 실측 실측 기간 4주 (2026-04 → 2026-05) 비교 도구 3종 분석 PR 47건 "AI가 코딩을 대체한다"는 말은 절반만 맞다. 정확히는 코딩 에이전트를 운영하는 사람의 작업 방식 이 바뀐다. 4주간 동일 프로젝트에서 Claude Code, Cursor, Aider를 번갈아 쓰며 PR 47건의 작업 시간·디버깅 시간·재시도 횟수를 측정했다. 도구 자체보다 하네스(harness)가 어떻게 짜여 있느냐 가 결과를 가르더라. 1. 코딩 에이전트 도구 비교: 4주 실측 데이터 같은 레포(Firebase + React + TypeScript, 약 4만 LoC)에서 동일한 유형의 태스크 — 버그 수정, 기능 추가, 리팩터링 — 를 도구별로 분배해 측정했다. 측정 항목은 (1) 첫 PR까지 시간, (2) 인간이 수정한 라인 비율, (3) 재시도 횟수다. 도구 첫 PR까지 (분) 인간 수정 비율 재시도 평균 Claude Code (Opus 4.6) 14분 9% 0.6회 Cursor (Sonnet 3.7) 21분 23% 1.4회 Aider (GPT-4 Turbo) 32분 31% 2.1회 표면적으로는 모델 차이로 보이지만, 같은 모델을 다른 하네스에 넣어 다시 측정해 보면 모델보다 하네스 차이가 더 크다 는 결론에 도달했다. 2. 하네스 엔지니어링이란 무엇인가 하네스(harness)는 모델이 코드베이스를 이해·수정·검증하기 위해 거치는 도구·문서·실행 환경의 묶음 을 말한다. 모델은 두뇌고, 하네스는 두뇌와 외부 세계를 잇는 몸·손·눈 이다. Anthropic이 Claude Code를 출시하면서 강조한 개념이고, Andrej Karpathy가 "AGENTS.md"를 만든 이유도 동일하다. ...