🔥 Codex가 코딩만 하던 시절은 끝났다

#openai#codex#ai-coding#computer-use#developer-tools

990자

13분

강의 목차

내 Mac을 백그라운드에서 쓰는 에이전트
111개 플러그인, 그리고 잠들지 않는 메모리
300만 주간 사용자와 $100 Pro 플랜
코딩 도구 전쟁의 새 국면
참고 자료

AI 코딩 에이전트가 코드를 넘어 컴퓨터 전체를 제어하는 개념도

어젯밤에 OpenAI 블로그를 열었다가 제목에서 멈췄다. "Codex for (almost) everything." 괄호 안의 almost가 묘하게 거슬렸다. 저 괄호가 빠지는 건 시간문제라는 선언 같았으니까.

Codex는 원래 코딩 에이전트였다. 코드 쓰고, 버그 잡고, PR 올려주는 도구. 그런데 4월 16일에 나온 이 업데이트는 Codex를 완전히 다른 방향으로 밀어붙인다. 내 컴퓨터를 직접 조작하고, 브라우저를 열고, 이미지를 만들고, 심지어 내가 퇴근한 뒤에도 혼자 일을 이어간다. 코딩 도구라고 부르기엔 범위가 너무 넓어졌다.

내 Mac을 백그라운드에서 쓰는 에이전트

이번 업데이트에서 가장 시선을 끈 건 '백그라운드 컴퓨터 유즈'다. Codex가 macOS 위에서 앱을 직접 보고, 클릭하고, 타이핑한다. 그것도 내 커서와는 별개의 커서로.

여러 에이전트가 내 Mac에서 동시에 돌아간다. 내가 VS Code에서 코딩하는 동안 한쪽에선 Codex가 시뮬레이터를 돌리고, 다른 쪽에선 JIRA 티켓을 정리하고 있을 수 있다는 뜻이다. OpenAI의 Ari Weinstein은 "에이전트가 백그라운드에서 내 앱을 쓰면서도 내가 컴퓨터를 동시에 쓸 수 있는 느낌은 마법 같다"고 표현했다.

솔직히 이 말을 듣고 처음 든 생각은 "무섭다"였다. 내 화면 뒤에서 AI가 마우스를 움직이고 있다니. 하지만 개발자 입장에서 생각하면, API가 없는 GUI 앱을 자동화하거나 프론트엔드 결과물을 직접 확인하는 데는 꽤 실용적인 방법이긴 하다.

여기에 인앱 브라우저도 들어왔다. OpenAI가 자체 개발한 Atlas 브라우저 기술을 Codex 안에 집어넣은 건데, 웹 페이지 위에 직접 코멘트를 달아서 에이전트에게 지시할 수 있다. "이 버튼 색 바꿔줘"를 스크린샷 찍어서 설명하는 대신, 페이지 위에서 바로 짚어주는 식이다. 프론트엔드 개발이나 게임 개발할 때 반복 작업을 상당히 줄여줄 수 있겠다.

이미지 생성도 추가됐다. gpt-image-1.5를 통해 목업, 디자인 컨셉, 게임 에셋까지 같은 워크플로우 안에서 만들 수 있게 됐다. 2025년 12월에 공개된 이 모델은 GPT-5 아키텍처에 내장돼 있어서 텍스트와 이미지를 같은 신경망에서 처리한다. 코드 짜다가 "이런 느낌의 UI 이미지 하나"라고 던지면 바로 나온다는 소리다.

111개 플러그인, 그리고 잠들지 않는 메모리

두 번째로 눈에 띄는 건 플러그인 확장이다. OpenAI 공식 발표에서는 "90개 이상의 신규 플러그인"이라고 했고, 9to5Mac 보도에서는 실제 숫자를 111개로 집계했다. 스킬, 앱 연동, MCP 서버를 하나의 설치 가능한 번들로 묶은 것들이다.

이름만 나열해도 범위가 짐작된다. Atlassian Rovo로 JIRA 관리, CircleCI로 CI/CD 연동, CodeRabbit으로 코드 리뷰, GitLab Issues, Microsoft Suite 문서 작업, Neon 데이터베이스, Remotion으로 영상 생성, Render에 배포까지. 이전엔 MCP 서버와 커스텀 인스트럭션을 따로따로 엮어야 했던 걸, 이제 하나의 플러그인으로 설치해서 팀 전체가 표준화할 수 있다.

그런데 나한테 더 와닿은 건 메모리 기능이다. 아직 프리뷰 단계지만, Codex가 이전 세션에서 쌓은 맥락을 기억한다. 내가 선호하는 코딩 스타일, 과거에 수정했던 패턴, 시간을 들여 모아둔 정보 같은 것들. 매번 새 세션마다 "나는 이런 걸 좋아하고 이런 건 싫어"라고 반복해야 하는 건 AI 코딩 도구의 가장 큰 불만 중 하나였는데, 그 고리를 끊으려는 시도다.

자동화도 한 단계 올라갔다. 기존 대화 스레드를 재사용하면서 컨텍스트를 유지한 채 작업을 이어갈 수 있고, Codex가 스스로 미래 작업을 예약해서 자동으로 깨어난다. 며칠, 심지어 몇 주에 걸친 장기 작업도 처리한다고 한다. 팀들이 이미 이 기능으로 열려 있는 PR을 머지하고, Slack·Gmail·Notion 대화를 모니터링하고 있다고 OpenAI는 밝혔다.

하나 더. Codex가 이제 먼저 "이거 해볼까요?"라고 제안한다. 프로젝트 컨텍스트, 연결된 플러그인, 메모리를 종합해서 하루를 어떻게 시작할지, 어제 중단한 작업을 어디서 이어갈지 알려준다. Google Docs에 남은 미처리 코멘트를 찾아내고, Slack과 Notion에서 관련 맥락을 끌어와서, 우선순위를 매긴 액션 리스트를 던져주는 식이다.

300만 주간 사용자와 $100 Pro 플랜

숫자부터 보자. Codex는 2025년 5월에 리서치 프리뷰로 출발했다. 당시 모델은 o3 기반의 codex-1. 2026년 2월에 macOS 데스크탑 앱이 나왔고, 모델도 GPT-5.3-Codex로 바뀌었다. 일주일 뒤엔 실시간 코딩용 저지연 버전인 GPT-5.3-Codex-Spark가 뒤따랐다. 3월에는 보안 취약점 분석 에이전트 Codex Security가 나왔고, 모델은 GPT-5.4로 올라갔다.

성장 속도가 눈에 띈다. 3개월 만에 주간 활성 사용자가 5배 증가했고, 토큰 사용량은 매달 70%씩 늘었다. 4월 8일에 Sam Altman이 직접 300만 주간 사용자 돌파를 발표하면서, 축하 겸 사용량 한도를 리셋해줬다. 1,000만에 도달할 때까지 100만 명 추가될 때마다 리셋하겠다는 약속도 덧붙였다.

가격표도 움직였다. 4월 9일에 $100짜리 Pro 플랜이 기존 Plus($20)와 최상위 Pro($200) 사이에 끼어 들어왔다. Codex 사용량이 Plus 대비 5배이고, 5월 31일까지는 프로모션으로 10배까지 올라간다. Plus 쪽은 대신 일일 사용량이 고르게 분산되는 쪽으로 재조정됐다. $200 플랜에서만 쓸 수 있던 GPT-5.4 Pro 모델도 $100 플랜에서 동일하게 제공된다.

경쟁사 가격을 놓고 보면, Anthropic의 Claude Max가 월 $100~$200, Cursor Business가 월 $40이다. OpenAI는 $100 선에서 "Pro급 모델 접근 + 넉넉한 Codex 사용량"이라는 조합으로 정면승부를 걸었다.

코딩 도구 전쟁의 새 국면

이 업데이트를 두고 The Decoder는 "Anthropic의 Claude Code에 직접 조준한 것"이라고 분석했다. 틀린 말은 아닌데, 전체 그림은 좀 더 복잡하다.

지금 AI 코딩 도구 시장은 세 가지 철학이 부딪히고 있다.

Claude Code는 터미널에서 시작한다. 1M 토큰 컨텍스트로 대규모 코드베이스를 통째로 파악하고, Agent Teams로 병렬 작업을 돌린다. SWE-bench Verified에서 80.9%를 찍으며 코드 이해력과 수정 품질에서는 현재 최고 수준이다.

Cursor는 VS Code를 감싼 IDE 형태다. Supermaven 자동 완성, Composer 멀티파일 편집, 비주얼 디프로 매일 쓰는 에디터로서의 완성도가 높다.

Codex는 처음부터 비동기 에이전트였다. 작업을 던지면 샌드박스 VM에서 알아서 처리하고 PR을 올려준다. 그런데 이번 업데이트로 그 위에 컴퓨터 유즈, 브라우저, 이미지 생성, 메모리를 쌓았다. 코딩 에이전트가 아니라 개발자용 슈퍼앱을 만들겠다는 선언에 가깝다.

OpenAI가 ChatGPT·Codex·Atlas 브라우저를 하나의 데스크탑 앱으로 합치는 '슈퍼앱' 전략을 추진 중이라는 보도는 3월부터 나왔다. 이번 업데이트는 그 퍼즐의 핵심 조각이 맞춰진 셈이다. 코딩에서 시작해서 프로젝트 관리, 디자인, 커뮤니케이션까지 하나의 에이전트가 커버하려는 야심.

다만, "다 하는 도구"가 "잘 하는 도구"를 이기는 건 쉽지 않다. Claude Code는 여전히 대규모 리팩토링과 아키텍처 이해에서 강점이 뚜렷하고, Cursor는 에디터 안에서의 매끄러운 경험을 쉽게 내주지 않을 거다. 각자의 영역이 있다.

그래도 방향 자체는 부정하기 어렵다. 개발이라는 행위가 "코드를 타이핑하는 것"에서 "시스템을 조율하는 것"으로 무게 중심이 옮겨가고 있고, 그 변화의 한가운데서 Codex가 가장 공격적으로 판을 키우고 있다. 주 300만 사용자가 이 방향에 베팅하고 있다는 사실은, 그 자체로 하나의 신호다.

내가 쓰는 Claude Code를 당장 바꿀 생각은 없다. 하지만 Codex가 내 Mac을 백그라운드에서 조작하면서 스스로 깨어나 일을 이어가는 모습은, 한번 직접 겪어보고 싶다. 무섭기도 하고 궁금하기도 하다. 이런 감정이 드는 건, 아마 뭔가가 진짜 바뀌고 있다는 뜻이겠지.