기본 콘텐츠로 건너뛰기

클로드 코드와 Playwright로 E2E 테스트를 정리하며 적어둔 메모

클로드 코드와 Playwright로 E2E 테스트를 정리하며 적어둔 메모

| 작성자: 원스 | 분야: 개발/AI

E2E 테스트는 중요하지만 늘 뒤로 밀리기 쉬운 작업입니다. 범위가 넓고, 깨지는 이유도 다양해서 꾸준히 관리하기가 쉽지 않기 때문입니다. 이번 글은 클로드 코드의 서브 에이전트 구조를 Playwright 테스트에 적용해 보며, 어떤 방식이 실제로 편했는지 메모처럼 정리한 내용입니다.

1. E2E 테스트가 늘 버거운 이유

E2E 테스트는 로그인부터 저장, 이동, 렌더링까지 실제 사용자 흐름을 따라가야 해서 관리 비용이 큽니다. 작은 화면 변경이나 비동기 타이밍만 흔들려도 금방 실패하고, 실패 원인을 좁히는 데도 시간이 꽤 듭니다. 그래서 많은 팀에서 필요성은 알지만 계속 뒤로 미루게 됩니다.

Playwright는 Chromium, Firefox, WebKit 세 엔진을 하나의 API로 다룰 수 있고, auto-wait 기능이 기본 내장되어 있어 Selenium이나 Cypress보다 비동기 타이밍 문제에 덜 시달립니다. 특히 page.waitForLoadState('networkidle') 같은 옵션으로 네트워크 안정 시점을 직접 기다릴 수 있어, SPA 환경에서 화면 전환 후 데이터 로딩이 끝났는지 확인하는 과정이 한결 단순해집니다. Cypress가 브라우저 내부에서 실행되는 구조인 반면, Playwright는 브라우저 외부에서 CDP(Chrome DevTools Protocol)로 제어하기 때문에 멀티탭이나 팝업 처리도 자연스럽습니다.

문제는 실제 장애가 이런 구간에서 자주 나온다는 점입니다. 단위 테스트만으로는 잡기 어려운 화면 간 연결 문제를 보려면, 결국 끝에서 끝까지 검증하는 흐름이 필요합니다.

2. 서브 에이전트 구조가 편했던 지점

서브 에이전트 구조를 써보며 느낀 장점은 한 세션에 모든 문맥을 몰아넣지 않아도 된다는 점이었습니다. 메인 에이전트가 전체 흐름을 보고, 세부 작업은 각 에이전트가 맡는 식으로 나누면 역할이 더 선명해집니다.

메인 에이전트가 여러 테스트 작업 에이전트를 관리하는 개념 이미지
테스트 작업은 한 번에 몰아 처리하기보다 역할을 분리했을 때 더 다루기 쉬웠습니다.

특히 테스트처럼 설계, 구현, 실패 복구가 섞인 작업에서는 이 분리가 꽤 유용했습니다. 누가 어떤 책임을 맡는지 분명해지면, 실패를 다시 검토하기도 편해집니다.

3. Plan, Gen, Heal로 나눠본 흐름

이번에는 플래너가 시나리오를 먼저 정리하고, 제너레이터가 테스트 코드를 만들고, 힐러가 실패 케이스를 다시 보는 흐름으로 나눠봤습니다. 이렇게 하니 "무엇을 테스트해야 하는지"와 "어떻게 고칠지"가 섞이지 않아 더 편했습니다.

병렬 실행도 유용했지만, 핵심은 동시에 많이 돌리는 것보다 서로 의존성이 적은 작업을 잘 나누는 일이었습니다. 인증 상태나 데이터 생성이 얽힌 테스트는 무작정 같이 돌리면 오히려 더 불안정해질 수 있어서, 순서를 나누는 판단이 중요했습니다.

실무에서 느낀 Plan-Gen-Heal 분리의 효과

가장 체감이 컸던 장면은 테스트가 실패했을 때였습니다. 이전에는 "왜 실패했는지 분석 → 코드 수정 → 재실행"을 한 흐름에서 처리하다 보니, 수정한 코드가 다른 테스트를 깨뜨리는 일이 잦았습니다. Heal 단계를 분리하고 나서는, 실패 원인만 먼저 좁히고 수정은 별도 사이클로 넘기는 식이 되어 되돌림이 훨씬 줄었습니다. 결국 속도보다 "되돌리지 않는 흐름"이 전체 시간을 더 줄여줬습니다.

여러 테스트 창이 동시에 실행되는 개발 환경 이미지
병렬 실행은 편했지만, 더 중요한 건 어떤 작업을 같이 돌릴 수 있는지 먼저 판단하는 일이었습니다.

4. 원스의 메모

이 기능을 보며 가장 크게 느낀 점은, 앞으로 개발자는 직접 타이핑하는 사람보다 작업을 설계하고 조율하는 사람 쪽에 더 가까워질 수 있다는 점이었습니다. 테스트 자동화에서도 무엇을 핵심 시나리오로 볼지, 어떤 실패는 바로 고치고 어떤 실패는 보류할지 정하는 판단이 계속 중요합니다.

그래서 이 글도 "혁명"을 말하는 글보다는, 실제로 어떤 식으로 역할을 나누니 관리가 편했는지 남겨두는 메모에 가깝습니다. 도구는 바뀌어도 구조를 잘 쪼개고 검토 기준을 세우는 감각은 계속 중요할 것 같습니다.

정리하면, 클로드 코드와 Playwright 조합에서 가장 인상 깊었던 지점은 속도 자체보다 역할 분리와 문맥 정리였습니다. 작업을 잘 나눌수록 테스트를 다시 보고 고치는 일도 덜 복잡해졌습니다.

📋 참고 자료

본 글은 Claude Code 서브 에이전트 흐름과 Playwright 테스트 작업 경험을 바탕으로, E2E 테스트 자동화 메모 형식으로 정리한 글입니다.

댓글

이 블로그의 인기 게시물

구글 제미나이 라이브를 보며 적어둔 AI 교육 메모

구글 제미나이 라이브를 보며 적어둔 AI 교육 메모 2025-06-12  |  작성자: 원스  |  분야: AI/교육 메모 왜 지금 AI 교육에 주목해야 할까요? 최근 공개된 구글의 제미나이 라이브 시연은 AI가 교육 현장에서 어떤 역할을 맡을 수 있는지 다시 생각하게 했습니다. 이 글은 '완벽한 과외 선생님' 같은 기대를 키우기보다, 실제로 어떤 장면이 인상적이었고 무엇을 조심해서 봐야 하는지 메모 형식으로 정리한 기록입니다. 영상 속에서 인상적이었던 건 정답을 바로 주는 방식이 아니라, 학생이 스스로 다음 단계를 생각하도록 유도하는 대화 흐름이었습니다. 카메라와 음성을 함께 쓰는 인터페이스가 교육 맥락에서 어떤 가능성을 여는지, 그리고 어디까지가 보조 도구이고 어디부터가 교사의 역할인지 구분해서 볼 필요가 있겠다는 생각이 들었습니다. 제가 보기에는 이 시연의 핵심은 기술 과시보다도 학습 대화의 톤이 바뀌었다는 데 있습니다. 단순히 답을 빨리 주는 도구보다, 학생이 다음 질문을 떠올리게 만드는 도구가 교육 맥락에서는 더 오래 남을 가능성이 큽니다. 단순한 정보 전달을 넘어, 학생의 학습 속도에 맞춰 공감하고 기다려주는 AI 시대가 열리고 있습니다. 제미나이 라이브에서 먼저 보인 변화 1. 카메라와 음성을 함께 쓰는 학습 인터페이스 제미나이 라이브의 핵심은 카메라와 음성을 함께 사용하는 멀티모달 인터페이스입니다. 학생이 문제를 직접 길게 입력하지 않...

AI 버블과 지적 노동 변화를 다시 본 메모

2025년 12월 21일 | 작성자: 원스 | 분류: IT/경제 트렌드 AI 버블과 지적 노동 변화를 다시 본 메모 요즘 AI 뉴스는 예전만큼 새롭지 않게 느껴질 때가 많습니다. 모델 발표가 이어져도 시장이 보는 기준은 이제 성능 시연보다 실제 수익화와 운영 구조 쪽으로 옮겨간 듯합니다. 최근에 본 인터뷰도 같은 흐름을 짚고 있었습니다. 이 글은 AI 버블 논쟁 자체보다, 시장이 어디서 돈을 벌 수 있는 구조를 찾고 있는지, 그리고 그 과정에서 지적 노동이 어떻게 표준화될 수 있는지를 메모 형식으로 정리한 글입니다. 📋 목차 1. AI 시장이 수익화 국면으로 옮겨가는 이유 2. 에이전틱 AI가 바꾸는 작업 방식 3. 지적 노동 표준화가 의미하는 것 4. 원스의 메모: 결국 남는 것은 문제 정의와 책임 1. AI 시장이 수익화 국면으로 옮겨가는 이유 인터뷰에서 가장 먼저 눈에 들어온 대목은 AI의 놀라움 자체보다, 이제 시장이 어떤 구조에서 실제 매출과 이익이 나오는지 를 더 집요하게 본다는 점이었습니다. AI 시장도 이제는 성능 경쟁만이 아니라 수익 구조를 설명해야 하는 단계로 들어왔습니다. 초기에는 누가 더 강한 모델을 만들었는지가 핵심이었지만, ...

저커버그 발언을 계기로 다시 본 AI 변화 메모

2025년 8월 16일 | 작성자: 원스 | 분류: 과학/기술 저커버그 발언을 계기로 다시 본 AI 변화 메모 최근 AI 논의는 성능 비교를 넘어, 모델이 어디까지 예측하기 어려운 행동을 보일 수 있는지에 관심이 쏠리고 있습니다. 메타를 비롯한 빅테크 리더들의 발언도 단순한 낙관론보다, 통제와 이해 가능성 문제를 더 자주 건드리고 있습니다. 이 글은 자극적인 미래 예측보다, 최근 AI 논의에서 반복해서 등장하는 창발성과 예측 불가능성 이야기를 다시 정리해 보기 위한 메모입니다. 저커버그 관련 영상이 던진 문제의식이 무엇이었는지, 그리고 어디까지를 실제 변화로 읽어야 하는지 차분하게 정리해 보려 합니다. 제 판단으로는 이 논쟁은 미래 공포 서사보다, 지금 어떤 운영 기준을 세워야 하는지로 읽는 편이 훨씬 생산적입니다. 📋 목차 1. 창발성을 어떻게 이해할 것인가 2. 정렬 문제를 다시 보는 이유 3. 빅테크 경쟁이 멈추지 않는 구조 4. 원스의 메모: 도구와 주체 사이 5. 다음 단계는 에이전트와 운영 기준 1. 창발성을 어떻게 이해할 것인가 유튜브 채널 '에스오디 SOD'에서 다룬 영상은 AI의 예측 불가능성과 창발성 문제를 중심에 두고 있었습니다. 핵심은 공포심을 키우는 데 있다기보다, 대규모 언어 모델이 기존 소프트웨어와 다른 방식으로 작동한다는 점을 어떻게 이해할 것인지...