🔥 Meta의 HyperAgents, 에이전트가 자기 인프라를 직접 만들기 시작했다

#AI#에이전트#Meta#HyperAgents#하네스 엔지니어링

933자

14분

강의 목차

에이전트가 자기 하네스를 만들었다
괴델 머신에서 하이퍼에이전트로
스스로 발명한 것들
숫자가 말해주는 것
이건 수렴인가, 모방인가
개발자는 어디로 가는가

content image

에이전트 하네스를 직접 설계하고 있던 참이었다. 도구 등록, 메모리 관리, 재시도 로직, 컨텍스트 조립. 개발자라면 익숙한 이 반복 작업을 고민하던 중, Meta의 새 논문 제목이 눈에 들어왔다. HyperAgents. 에이전트가 이 구성요소들을 스스로 만들어냈다는 내용이었다.

잠깐, 뭐라고?

에이전트가 자기 하네스를 만들었다

2026년 3월, Meta와 UBC 연구진이 "Hyperagents"라는 논문을 발표했다(arXiv: 2603.19461). 저자는 Jenny Zhang, Bingchen Zhao, Wannan Yang 등 8명. Meta FAIR, Meta Superintelligence Labs, UBC, Vector Institute, 에든버러 대학, NYU 등이 참여한 대형 공동 연구다.

주장은 이렇다. 에이전트에게 자기 개선을 맡겨두면, 결국 개발자가 수작업으로 만들어온 프로덕션 하네스 구성요소를 스스로 재발명한다.

하네스(Harness)가 뭔지 짧게 짚고 넘어가자. AI 에이전트의 운영 방식을 관장하는 소프트웨어 시스템이다. 도구 호출, 메모리, 재시도, 컨텍스트 엔지니어링, 검증을 관리해서 모델이 추론에만 집중할 수 있게 해준다. 2026년 들어 "하네스 엔지니어링"이라는 개념이 빠르게 퍼지고 있는데, OpenAI Codex 팀이 하네스 설계만으로 엔지니어 3명이 코드를 직접 타이핑하지 않고 약 100만 줄 규모의 프로덕션 앱을 만들어냈다는 사례 덕분이다.

HyperAgents 논문은 이 하네스를 에이전트 자신이 만들어냈다고 말한다.

content image

괴델 머신에서 하이퍼에이전트로

이 논문을 이해하려면 전작부터 봐야 한다.

2025년, 같은 제1저자 Jenny Zhang이 발표한 Darwin Gödel Machine(DGM)이 있다. 에이전트가 자기 코드를 수정하면서 성능을 끌어올리는 시스템이다. SWE-bench에서 20%→50%, Polyglot 벤치마크에서 14.2%→30.7%. 숫자만 보면 꽤 그럴듯하다.

그런데 DGM에는 치명적인 한계가 있었다. 에이전트 코드를 수정하는 "메타 메커니즘" 자체가 사람이 설계한 고정 로직이었다. 코딩 도메인에서는 잘 돌아갔지만, 논문 리뷰나 로보틱스 같은 다른 도메인으로 가면 메타 메커니즘을 사람이 다시 짜야 했다. 범용성이 없었다.

HyperAgents(DGM-H)는 이 문제를 정면으로 뚫는다.

아이디어 자체는 간결하다. "메타 에이전트도 편집 가능하게 만들자." DGM-H에서는 Task Agent(작업 수행)와 Meta Agent(개선 생성)가 하나의 편집 가능한 프로그램 안에 통합된다. Meta Agent가 Task Agent의 코드를 수정할 뿐 아니라, 자기 자신의 코드도 수정할 수 있다. 논문은 이걸 "메타인지적 자기수정(metacognitive self-modification)"이라 부른다.

작동 방식은 진화 루프다.

기본 에이전트에서 시작한다
Meta Agent가 에이전트 코드를 읽고, 과거 성능을 분석해서 수정 버전을 만든다
수정 버전을 평가한다. 더 나으면 아카이브에 넣는다
아카이브에서 골라서 반복한다

수백 회 반복하면 에이전트는 작업에 더 능숙해진다. 그런데 더 중요한 건, "개선하는 능력" 자체가 함께 좋아진다는 것이다. DGM과의 결정적 차이가 여기에 있다.

스스로 발명한 것들

content image

여기서부터 진짜 재미있다.

연구진은 코딩, 논문 리뷰, 로보틱스 보상 설계, 올림피아드 수학 채점이라는 네 가지 전혀 다른 도메인에서 DGM-H를 돌렸다. 수백 회 자기 개선 반복 후, 에이전트가 독립적으로 발명한 것들을 보자.

영속 메모리(Persistent Memory). 아무도 시키지 않았다. 에이전트가 자체적으로 메모리 시스템을 만들어냈다. 과거 결과를 기억하고 성능 추세를 추적하는 에이전트가, 그렇지 못한 에이전트를 이겼기 때문이다. 단순한 캐시가 아니었다. 인과 가설을 저장하고, 어느 세대의 성능이 가장 좋았는지 식별하고, 과잉 수정을 진단하는 수준.

성능 추적(Performance Tracking). 에이전트가 자체 관측 가능성(observability) 시스템을 구축했다. 이동 평균, 세대별 통계, 도메인별 점수 이력. 개발자가 하네스에 수작업으로 넣는 토큰 추적이나 감사 로깅과 같은 기능이다.

다단계 평가 파이프라인(Multi-stage Evaluation). 논문 리뷰 도메인에서 에이전트는 처음에 출력 포맷 파싱조차 못 해서 정확도 0%였다. 그런데 자기 개선을 반복하더니, 체크리스트와 의사결정 규칙, 명확한 기준을 갖춘 다단계 평가 파이프라인을 스스로 만들어냈다. 검증기(verifier)를 직접 구축한 거다.

임계값 기반 의사결정 프로토콜. 수락/거부 비율, 점수 임계값, 신뢰도 수준 같은 명시적 의사결정 경계가 나타났다. 하네스 검증기가 구현하는 규칙 기반 체크 그 자체.

도메인 지식 베이스. 로보틱스 보상 설계에서 에이전트가 환경 제약 조건, 유효 상태 변수, 보상 스케일링 휴리스틱의 내부 지식 베이스를 점진적으로 구축했다. 자기 자신을 위한 컨텍스트 엔지니어링을 배운 것이다.

재시도와 자기 교정. 수정이 성능을 오히려 떨어뜨리면, 후속 세대가 회귀를 진단하고 교정했다. 피드백을 주입한 재시도 루프. 하네스의 기본 패턴 그대로다.

이 목록을 보면서 소름이 돋았다. 프로덕션 하네스의 6가지 구성 요소—도구 통합, 메모리/상태, 컨텍스트 엔지니어링, 계획, 검증, 모듈성—중 대부분을 에이전트가 독립적으로 재발명한 것이다.

숫자가 말해주는 것

논문에서 눈이 번쩍 뜨이는 실험은 도메인 간 전이(transfer) 테스트다.

논문 리뷰와 로보틱스에서 학습한 DGM-H의 메타 메커니즘을 동결(freeze)시킨 뒤, 한 번도 본 적 없는 올림피아드 수학 채점(IMO-GradingBench)에 적용했다. 사람이 설계한 DGM의 메타 메커니즘은 50번의 수정을 거쳐도 improvement@50 = 0.0. 전혀 개선하지 못했다. DGM-H의 자기참조적 메타 메커니즘은 improvement@50 = 0.630을 찍었다. 전혀 다른 도메인인데도 "개선하는 법"이 전이된 것이다.

단순한 성능 향상 이야기가 아니다. 개선 능력 자체의 범용성을 보여준 실험이다.

이건 수렴인가, 모방인가

GeekNews 댓글에서 날카로운 질문이 나왔다. "웹 검색 등으로 이미 선행 사례를 충분히 발견할 수 있어서 그걸 따라한 결과가 아닐까?"

솔직히 타당한 의문이다. LLM의 학습 데이터에는 에이전트 아키텍처에 관한 수많은 글과 코드가 이미 들어있다. 에이전트가 "독립적으로 발명했다"는 표현이 과연 정확한가.

다만 나는 이 논문의 포인트가 약간 다른 곳에 있다고 본다. 에이전트가 이런 구성요소를 인류 최초로 발명했다는 게 아니다. 자기 개선 압력(selection pressure) 아래에서 이 구성요소들이 반복적으로 출현한다는 사실이 중요한 것이다. 학습 데이터에서 패턴을 가져왔든, 순수하게 추론해냈든, "이 구조가 필요하다"는 결론에 수렴한다는 점은 달라지지 않는다.

하네스 엔지니어링이 개발 편의가 아니라 에이전틱 시스템의 수렴적 아키텍처라는 주장. 이게 이 논문의 진짜 메시지다.

개발자는 어디로 가는가

논문은 개발자의 역할이 사라지는 게 아니라 전환 중이라고 강조한다. 인간 감독은 여전히 필수다. 자기 수정 시스템의 안전성 문제—코드 실행 리스크, 메타 수준 오염, 평가 과적합—를 생각하면 더더욱.

하지만 무게중심이 움직이고 있는 건 분명하다. 하네스를 직접 구축하는 일에서, 에이전트가 효과적인 하네스를 진화시킬 수 있는 초기 조건을 설계하는 방향으로. Cobus Greyling의 표현을 빌리면, 에이전트가 "인프라의 소비자에서 생산자로" 이동하고 있다.

나도 이 흐름을 조금씩 체감한다. 에이전트에게 도구를 주고 작업을 시키면, 점점 복잡한 자체 워크플로를 만들어내는 모습이 보인다. 아직 논문처럼 자기 코드를 수정하는 수준은 아니지만, 방향은 같다.

DGM-H의 코드는 GitHub(facebookresearch/HyperAgents)에 CC BY-NC-SA 4.0 라이선스로 공개돼 있다. OpenAI, Anthropic, Gemini 등 여러 LLM 백엔드를 지원한다. 직접 돌려보고 싶은 마음은 굴뚝같지만, 프로덕션에 쓰기엔 아직 이르다. 자기 수정 루프가 통제 가능한 범위에서만 돌아간다는 보장이 없으니까.

그래도 한 가지는 확실해졌다. 내가 손으로 짜고 있는 하네스 구성요소들이 우연의 산물이 아니라는 것. 에이전트가 스스로 진화해도 같은 구조에 도달한다면, 이 아키텍처는 뭔가 본질적인 걸 반영하고 있다. 다음에 메모리 매니저를 설계할 때, 조금 더 확신을 갖고 키보드를 두드릴 수 있겠다.