Claude와 몇 달간 씨름한 뒤 Codex는 바이브 코더의 꿈처럼 느껴짐
6 hours ago
5
- 3개월간 Claude/Anthropic으로 코딩했지만 repo 규모 작업에서 신뢰성이 낮아져 별도 감시 워크플로가 필요해짐
- 4.7 시기에는 실제 구현이 약 40%인데 완료됐다고 환각하거나 stub/placeholder 주변에서 과도한 자신감을 보임
- Max x20 비용에도 생산성보다 토큰 소비와 감독 부담이 더 커졌고, 5월 12일 GPT-5.5 + Codex로 전환함
- Codex는 과도한 프롬프트 없이 인접 코드를 더 잘 이해하고 회귀를 잡아 lint/test 루프와 대규모 리팩터링이 관리 가능해짐
- 마이그레이션은 CLAUDE.md→AGENTS.md 이동과 hooks 유지 정도로 끝났고, 해당 워크플로에서는 되돌아갈 생각이 없음
Claude에서 Codex로 전환한 뒤 달라진 개발 흐름
- 지난 3개월 동안 주로 Claude/Anthropic으로 코딩했으며, Opus 4.6 출시 당시에는 아키텍처 이해, 큰 컨텍스트 처리, 빠른 기능 구현이 강점으로 다가옴
- 시간이 지나며 repo 규모 작업에서 신뢰성이 낮아졌고, 모델을 감시하기 위한 별도 워크플로가 필요해짐
- 인접 파일 회귀를 확인하는 여러 에이전트
- 주요 커밋마다 붙는 “senior reviewer” 에이전트
- 구현 드리프트와 미완성 구현을 확인하는 지속 검증
- 모델이 완료됐다고 자신 있게 말한 작업을 잡아내는 lint/test 파이프라인
- 4.7 시기에는 개인 워크플로에서 문제가 더 커짐
- 실제 구현은 약 40% 수준인데 기능이 완료됐다고 환각함
- stub/placeholder 주변에서 근거 없는 자신감을 보임
- 현실적으로 가능한 변경에도 “별도 세션이 필요하다”거나 과도한 일정을 추정하는 회피 행동이 나타남
- Max x20 비용을 내고 있었지만 생산성 향상보다 토큰 소비 증가와 감독 부담 증가가 더 크게 다가옴
- 결국 5월 12일에 GPT-5.5 + Codex로 전환했고, AI 코딩이 몇 달 만에 스트레스보다 편안함에 가까워짐
GPT-5.5 + Codex에서 체감한 장점
- Codex는 과도한 프롬프트 없이도 인접 코드를 잘 이해하고, 회귀를 더 잘 잡아냄
- lint/test 피드백 루프가 더 빡빡하게 작동하고, 대규모 리팩터링도 실제로 관리 가능해짐
- 인프라 결정과 아키텍처 변경이 조각난 느낌보다 일관된 방향으로 이어지고, 완료된 척하기보다 실제로 작업을 끝내는 쪽에 가까움
- /fast는 주간 사용량을 빠르게 소진할 것 같아 대부분 피하지만, high/xhigh만으로도 생산성 향상이 컸음
- 전체 저장소 zip을 GPT-5.5 Pro extended thinking에 넣으면 다른 모델들이 반복해서 실패한 문제를 해결하는 데 도움이 됨
- 마이그레이션도 큰 마찰이 없었음
- 모두가 즉시 옮겨야 한다는 뜻은 아니지만, 해당 워크플로에서는 당분간 되돌아갈 생각이 없음
-
Homepage
-
Tech blog
- Claude와 몇 달간 씨름한 뒤 Codex는 바이브 코더의 꿈처럼 느껴짐