🔥 Anthropic의 10개 금융 에이전트 템플릿이 말해 준 것

#anthropic#claude#finance-ai#agent-templates#managed-agents

2169자

28분

강의 목차

풀린 묶음의 분량
5월 4일과 5월 5일 사이
모델은 금융 작업에 쓸 만한가
도메인 모델이 아니라 일반 모델과 템플릿
JPMorgan의 길과 중견 시장의 공백
다음 도메인은 무엇인가
참고 자료

5월 4일 조인트벤처와 5월 5일 금융 에이전트 발표가 같은 묶음을 가리키는 두 패널 — 왼쪽은 Anthropic·Blackstone·Hellman & Friedman·Goldman Sachs가 손잡은 AI 서비스 회사, 오른쪽은 열 개 에이전트 템플릿과 Microsoft 365 통합 묶음

5월 4일 월요일에 Anthropic은 Blackstone, Hellman & Friedman, Goldman Sachs와 새 기업용 AI 서비스 회사를 함께 세운다고 발표했다. 외부 보도가 약 15억 달러 규모로 적었다. 다음 날 화요일에는 금융 서비스용 에이전트 발표가 나왔다. 나는 처음 제목만 봤을 때 새 데모 몇 개를 더 얹은 소식이라고 생각했다. 그런데 본문을 읽고 나니 그렇게 볼 수 없었다. 하루 차이로 나온 두 발표가 같은 상품 묶음을 가리키고 있었기 때문이다.

풀린 묶음의 분량

리서치·고객 대응 5종(Pitch builder·Meeting preparer·Earnings reviewer·Model builder·Market researcher)과 재무·운영 5종(Valuation reviewer·General ledger reconciler·Month-end closer·Statement auditor·KYC screener) 두 묶음으로 정리된 Anthropic 금융 에이전트 템플릿 열 개

5월 5일에 나온 것은 에이전트 한두 개가 아니라 금융 업무 묶음 전체에 가까운 분량이다. Anthropic은 리서치와 고객 대응 쪽 다섯 개, 재무와 운영 쪽 다섯 개를 합쳐 템플릿 열 개를 한 번에 내놨다. 피치북 작성, 미팅 준비, 실적 검토, 모델 작성, 시장 조사에서 끝나지 않았다. 밸류에이션 검토, 총계정원장 대사, 월말 마감, 재무제표 점검, KYC 스크리닝까지 같이 들어왔다.

이 분량이 중요한 이유는 범위가 넓어서가 아니라 금융 조직의 실제 손동작을 거의 그대로 덮기 때문이다. 앞쪽 다섯 개는 투자은행, 자산운용, 리서치 조직이 매일 하는 문서와 모델 업무를 겨냥했다. 뒤쪽 다섯 개는 회계, 재무통제, 컴플라이언스 조직이 반복해서 처리하는 점검 업무를 겨냥했다. 한 부서만 시험 삼아 쓰는 도구가 아니라, 금융회사 안의 여러 팀이 같은 모델을 각자 다른 방식으로 쓰게 하려는 구성이었다.

배포 방식도 가볍지 않았다. 템플릿은 Claude Managed Agents용 쿡북으로도 나오고, Claude Cowork와 Claude Code 안에서 바로 켤 수 있는 플러그인으로도 나온다. 옆에서 같이 쓰는 방식과 야간 작업처럼 길게 돌리는 방식을 한꺼번에 깔아 놓았다. 그래서 이 발표는 실험용 쇼케이스보다 실제 배치 쪽에 훨씬 더 가깝다.

템플릿만 있는 것도 아니었다. Anthropic은 금융 서비스 마켓플레이스 레포와 함께 새 커넥터 여덟 개와 Moody's MCP 앱도 묶어서 내놨다. Dun & Bradstreet, Fiscal AI, Financial Modeling Prep, Guidepoint, IBISWorld, SS&C Intralinks, Third Bridge, Verisk가 새로 붙었다. 이미 있던 FactSet, S&P Capital IQ, PitchBook, Morningstar, LSEG 같은 연결도 같이 놓여 있다. Anthropic은 템플릿이 일을 나누고 커넥터가 데이터를 넣는 구조를 처음부터 완성형에 가깝게 짰다.

이 구성을 더 눈여겨볼 이유는 데이터 공급자의 성격이 한쪽으로 치우치지 않았기 때문이다. 기업 식별, 시장 데이터, 산업 보고서, 전문가 인터뷰, 보험 데이터, 가상 데이터룸이 한 묶음 안에 같이 들어왔다. 금융팀이 실제로 판단할 때 쓰는 재료가 원래 여러 갈래라는 점을 그대로 반영한 셈이다. 커넥터 숫자보다, 업무 종류가 달라져도 필요한 자료를 대체로 공급할 수 있다는 점이 더 크다.

Microsoft 365 추가 기능도 같은 발표의 핵심 구성 요소였다. 5월 5일 발표 시점 기준으로 Excel, PowerPoint, Word용 Claude 추가 기능은 일반 출시 상태고 Outlook은 출시 예정이라고 밝혔다. 중요한 점은 Claude가 금융팀이 이미 쓰는 작업 화면 안으로 바로 들어온다는 데 있다. 숫자를 읽고 모델을 손보고 문서를 고치고 발표 자료를 업데이트하는 흐름이 새 도구로 따로 옮겨 가지 않는다. 템플릿과 데이터 연결만이 아니라 작업 앱 통합까지 함께 내놨다는 점이 이 발표를 실험보다 실제 배치에 더 가깝게 만든다.

5월 4일과 5월 5일 사이

5월 4일 기업용 AI 서비스 합작 발표와 5월 5일 금융 에이전트 템플릿 출시를 하루 차이로 잇는 타임라인 — 합작이 채널을 정하고 다음 날 그 채널로 들어갈 상품이 풀린 흐름

이 발표를 고립된 뉴스로 읽으면 하루 전 소식이 설명되지 않는다. 5월 4일 Anthropic은 기업용 AI 서비스 조인트벤처를 발표했고, 대상 고객을 여러 업종의 중견 기업으로 분명하게 적었다. 의료, 제조, 금융 서비스, 리테일, 부동산 같은 업종이 후보로 함께 들어왔다. 그다음 날 금융 템플릿 묶음이 나왔으니, 둘을 따로 떼어 읽는 편이 오히려 이상하다.

이 조인트벤처의 문장을 그대로 따라가면 그 그림이 더 또렷하다. 발표는 많은 회사가 자기 에이전트 스택을 직접 짤 인력과 시간이 부족하다고 적었다. Anthropic 엔지니어가 안으로 들어가고, 투자사들이 포트폴리오 회사로 수요를 모으고, 그 위에 실제 업무 묶음을 얹는 구조다. 그러니 5월 5일 템플릿은 기술 데모가 아니라 바로 판매 가능한 상품군이다.

The Next Web도 이 순서를 같은 식으로 읽었다. 대형 합작 발표 다음 날에, 그 합작이 현장에서 팔 물건이 나왔다는 뜻으로 해석했다. 나도 같은 판단을 한다. 조인트벤처가 먼저 나오고 템플릿이 뒤따랐다는 시간 차가 우연처럼 보이지 않는다.

이 점에서 5월 5일 발표의 핵심은 성능 자랑이 아니다. 중견 금융회사가 직접 만들기 어려운 묶음을 누가 대신 조달하고 조립해 주는가가 더 중요하다. 모델 하나만 사서는 끝나지 않는 문제를, 템플릿과 데이터 연결과 작업 앱 통합으로 묶어서 판다는 뜻이기 때문이다. 금융 AI가 제품 카탈로그의 언어로 들어왔다는 인상을 이 발표가 분명하게 만든다.

그래서 나는 5월 4일과 5월 5일을 하나의 문장으로 읽는다. 하루 전 발표가 고객과 유통 경로를 정했다. 하루 뒤 발표가 그 경로로 들어갈 첫 묶음을 내놨다. 이 순서가 맞다면, 앞으로 비슷한 조인트벤처나 파트너십이 먼저 나오고 그 직후 업종별 템플릿 묶음이 붙는 장면을 더 자주 보게 될 가능성이 크다.

조인트벤처 발표와 템플릿 발표 사이에 Office 추가 기능이 함께 놓인 점도 그냥 지나가기 어렵다. 서비스 회사가 현장에 들어가 에이전트를 굴리려면, 사용자가 낯선 화면으로 옮겨 가지 않아도 되는 통로가 필요하다. Excel과 PowerPoint는 금융팀이 이미 하루 종일 붙잡고 있는 앱이다. 템플릿 발표가 그 앱 안쪽까지 같이 들어왔다는 사실은 도입 장벽을 처음부터 낮추겠다는 뜻이다.

모델은 금융 작업에 쓸 만한가

Vals AI Finance Agent 벤치마크 상위 5개 모델 — Claude Opus 4.7 64.37%, Claude Sonnet 4.6 63.33%, Muse Spark 60.59%, DeepSeek V4 60.39%, Claude Opus 4.6 Thinking 60.05%

이 묶음이 설득력을 가지려면 모델 자체가 금융 리서치 업무를 버텨야 한다. 여기서 Anthropic이 앞세운 근거는 Vals AI Finance Agent 벤치마크였다. 2026년 5월 초 기준으로 Opus 4.7이 64.37%로 가장 높았고, Sonnet 4.6이 63.33%로 그다음이었다. 점수 차는 크지 않지만 두 모델이 맨 위를 차지한 사실은 분명하다.

다만 이 숫자를 곧바로 금융 전반의 절대 점수로 읽으면 과하다. 이 벤치마크는 2026년 5월 4일 업데이트 기준으로 SEC 공시 자료 리서치 537문항을 다룬다. 주식 리서치, 신용 분석, 실사 업무의 바닥 공사에 가까운 문제들이지만, 금융의 모든 업무를 대표한다고 말할 수는 없다. 이 숫자는 금융 전반의 최종 판정이라기보다 공시 기반 분석에서 모델이 어디까지 왔는지 보여 주는 강한 신호에 가깝다.

그래도 이 벤치마크에서 더 중요한 사실은 점수표 아래에 있었다. Vals는 상위권 모델일수록 도구 호출 횟수가 높다고 짚었다. 상위 모델이 머릿속 지식만으로 답을 꾸며 낸 것이 아니라, 필요한 자료를 불러오고 계산을 거치고 다시 확인하는 과정에서 앞섰다는 뜻이다. 금융 업무에서 이 패턴은 점수 하나보다 더 실무적이다.

금융 현장의 반복 업무는 원래 정적 지식만으로 끝나지 않는다. 공시를 읽고, 수치를 끌어오고, 연결된 워크북을 확인하고, 컴플라이언스 문서를 대조하고, 수정된 숫자를 발표 자료에 다시 넣어야 한다. 템플릿 열 개가 겨냥한 일도 거의 전부 그렇다. 그러니 모델의 가치는 답변 문장 한 줄보다 도구를 얼마나 안정적으로 다루는가가 더 분명하게 결정한다.

이 점에서 Opus 4.7과 Sonnet 4.6의 상위권 등장은 템플릿 발표와 자연스럽게 짝을 이룬다. Anthropic은 금융 AI를 전용 모델 하나의 승부로 밀지 않았다. 강한 일반 모델이 도구를 많이 쓰는 쪽으로 진화하고 있다는 신호를 먼저 잡고, 그 위에 템플릿과 커넥터를 더했다. 나는 이 조합이 지금 금융 조직이 실제로 돈을 낼 조건에 더 가깝다고 본다.

여기에 Managed Agents의 운영 성격도 잘 맞는다. 공개 문서는 길게 이어지는 세션, 도구 실행, 인증 정보 관리, 감사 로그를 플랫폼이 맡는다고 설명한다. 월말 마감이나 대규모 딜 검토처럼 몇 분 안에 끝나지 않는 업무는 이런 운영 장치가 빠지면 실제 배치가 어렵다. 금융에서 모델 점수와 함께 운영 장치를 같이 묶는 이유가 분명해지는 대목이다.

도메인 모델이 아니라 일반 모델과 템플릿

도메인 지식의 위치 변화 — 왼쪽 2023년에는 BloombergGPT 50B처럼 모델 안쪽에 금융 코퍼스를 넣는 길이 답이었고, 오른쪽 2026년에는 일반 frontier 모델 위에 에이전트 템플릿·거버넌스 커넥터·Microsoft 365 추가 기능을 얹는 묶음으로 옮겨 갔다

금융 AI의 성패는 전용 모델보다 일반 모델 위에 템플릿을 얹는 쪽으로 기울고 있다. BloombergGPT는 그 비교점이 된다. BloombergGPT는 2023년에 500억 파라미터 규모로 나왔고, 금융 코퍼스를 미리 학습한 대표 사례였다. 당시에는 이런 전용 모델이 금융 AI의 정답처럼 보였다.

하지만 이후 평가는 그 기대와 조금 다르게 굴렀다. 후속 학술 비교에 따르면 BloombergGPT는 일부 감성 분류와 헤드라인 분류 평가에서 GPT-4 같은 일반 최상위 모델보다 낮은 점수를 받았다. 모든 금융 과제에 걸친 일반화는 조심스럽지만 방향 자체는 꽤 분명했다. 금융 말뭉치를 더 얹는 일만으로는 일반 모델의 넓은 추론 능력을 넘기 어려웠다.

이 차이는 금융 업무가 언어 이해 한 가지만으로 끝나지 않을수록 더 커진다. 공시를 읽는 일도 숫자를 계산하고 표를 옮기고 워크북을 대조하고 다른 데이터 공급자의 값을 다시 확인하는 단계가 함께 붙는다. 그러면 성패는 사전학습의 좁은 전문성보다 큰 규모의 일반 능력과 도구 접근이 결정한다. Anthropic이 템플릿과 커넥터를 먼저 내세운 이유도 여기에 있다.

결국 도메인 지식의 위치가 바뀌었다고 보는 편이 맞다. 예전에는 그 지식을 모델 안쪽에 더 많이 집어넣으려 했다. 지금은 일반 모델 위에 템플릿, 승인 절차, 데이터 연결, 회사별 규칙을 얹어서 같은 효과를 만든다. 금융 AI의 경쟁점이 모델 사전학습에서 업무 묶음 설계로 이동한 셈이다.

나는 이 이동이 꽤 오래 갈 가능성이 크다고 본다. 전용 모델은 만들고 고치고 검증하는 비용이 크다. 반면 일반 모델 위에 템플릿을 얹는 방식은 모델이 바뀌어도 업무 묶음을 다시 쓸 수 있다. 5월 5일 발표는 바로 그 재사용 가능한 묶음을 상품으로 내놓은 사건이었다.

JPMorgan의 길과 중견 시장의 공백

두 갈래 길 — 왼쪽은 JPMorgan처럼 23만 명 규모와 450개 활용 사례를 직접 짓는 사내 게이트웨이, 오른쪽은 중견 시장이 합작 벤처가 묶어 둔 에이전트 템플릿·커넥터·Microsoft 365 표면을 통째로 사 들이는 길

물론 대형 금융회사는 다른 길을 갈 수 있다. JPMorgan의 LLM Suite가 대표적이다. 공개된 보도를 따르면 이 은행은 외부 LLM 여러 곳을 함께 담는 내부 플랫폼을 만들었고, 데이터는 은행 안에 둔 채 직원들이 여러 생성형 AI 기능을 쓰게 했다. 직접 통제권을 쥐고 싶은 조직이라면 가장 자연스러운 선택이다.

숫자도 그 길의 성격을 잘 보여 준다. JPMorgan은 직원 23만 명이 넘는 조직이고, 이미 450개가 넘는 실제 활용 사례를 운영 중이라고 공식 자료에 적었다. 활용 사례를 빠르게 더 늘리겠다는 계획도 같이 적었고, 정확한 목표 수치는 자료마다 조금씩 다르다. 회사 자체 추산으로는 직원 한 명당 주당 약 4시간을 아낀다는 수치도 같이 붙었다. 이 정도면 모델 선택, 보안, 감사, 배포, 교육을 한 회사가 통째로 감당하는 내부 플랫폼 전략이다.

문제는 이 전략이 누구에게나 열려 있지 않다는 점이다. 자체 게이트웨이를 만들고 여러 모델을 붙이고 부서별 활용 사례를 수백 개로 늘리려면 조직 규모와 자본이 먼저 필요하다. 중견 금융회사나 포트폴리오 회사가 같은 길을 그대로 따라가기는 어렵다. 여기서 공백이 생긴다.

5월 4일의 조인트벤처가 겨냥한 대상은 바로 그 공백이다. Anthropic은 투자사들과 함께 자체 플랫폼을 감당하기 어려운 중견 시장에 서비스를 팔려 한다. 5월 5일의 템플릿 묶음은 그 계획을 설명하는 문서가 아니라 바로 투입할 상품 목록에 가깝다. 중견 시장에서는 자체 플랫폼보다 이런 완성형 묶음이 훨씬 빨리 퍼질 가능성이 높다.

그래서 JPMorgan의 사례는 반례가 아니라 오히려 기준점에 가깝다. 초대형 은행은 직접 만든다. 나머지 시장은 비슷한 기능을 외부 묶음으로 산다. 5월 4일과 5월 5일의 발표를 이어 읽으면, Anthropic이 지금 어디에 서 있는지 선명하게 보인다.

이 대비는 제품 설계에도 그대로 따라간다. 초대형 은행은 게이트웨이, 권한 체계, 감사 체계, 데이터 커넥터까지 자기 규칙에 맞게 전부 안에서 짤 수 있다. 중견 시장은 그만한 내부 공사를 하기 어렵다. 그러니 외부에서 가져온 템플릿이 Excel, Word, 데이터 커넥터, 감사 로그까지 한 번에 갖추고 있어야 실제 구매가 일어난다.

다음 도메인은 무엇인가

이제 남은 질문은 금융에서 AI가 통하느냐가 아니다. 그 질문은 이미 지나갔다. 더 중요한 질문은 어떤 묶음이 표준이 되느냐다. 일반 모델, 업종별 템플릿, 통제 가능한 데이터 연결, 그리고 분석가가 이미 매일 여는 업무 앱이 함께 들어가는 묶음이 지금 금융에서 빠르게 굳어 가고 있다.

나는 이 패턴이 법률, 의료, 교육, 공공 영역으로 옮겨갈 가능성이 크다고 본다. 이유는 단순하다. 이 분야들도 문서가 많고 승인 절차가 길고, 외부에 쉽게 열 수 없는 깊은 데이터를 몇몇 기관이 오래 쥐고 있다. 금융에서 FactSet과 Moody's가 차지한 위치를, 다른 업종에서는 판례 데이터, 의료 기록 체계, 교육 행정 데이터, 정부 시스템이 차지할 수 있다.

여기서 먼저 봐야 할 신호는 새 모델 발표보다 새 커넥터 발표다. 업종 안쪽 데이터를 오래 쌓은 공급자가 자기 데이터를 안전하게 연결해 주기 시작하면, 그 시점부터 일반 모델은 그 업종의 실제 업무에 들어갈 발판을 얻는다. 그다음에는 Excel이나 Word에 해당하는 작업 앱 통합이 따라올 가능성이 높다. 금융에서 이미 나온 순서가 다른 업종에서도 반복될 공산이 크다.

금융이 먼저 나온 이유도 이 틀로 같이 설명할 수 있다. 숫자와 문서가 많고, 데이터 공급자 산업이 이미 크고, 실제 작업의 상당 부분이 Excel과 PowerPoint 같은 앱 안에서 돈다. 템플릿을 만들기에도 좋고 성과를 설명하기에도 좋다. 다른 업종도 비슷한 조건을 갖춘 곳부터 같은 묶음을 받아들일 가능성이 높다.

그래서 5월 5일 발표를 단순한 금융 특화 소식으로만 읽으면 절반만 읽은 셈이다. Anthropic이 내놓은 열 개의 템플릿은 금융 업무용 도구 묶음이면서, 동시에 다른 업종으로 복제할 판매 방식의 시제품이기도 하다. 모델 하나의 우열보다 어떤 데이터 공급자가 먼저 연결되고, 어떤 업무 앱까지 같이 붙는지를 보는 편이 훨씬 중요하다.

내가 다음에 확인할 것은 두 가지다. 각 업종의 깊은 데이터 보유자가 커넥터나 MCP 앱으로 들어오는지, 그리고 그 모델이 현장 실무자가 매일 여는 업무 앱 안으로 얼마나 자연스럽게 들어가는지다. 그 두 조건이 같이 맞는 순간, 금융에서 나온 이번 묶음은 다른 업종에서도 표준 후보가 된다.

참고 자료

Anthropic, Agents for financial services. 5월 5일 공식 발표문. 10개 에이전트 템플릿, 8개 새 데이터 커넥터, Moody's MCP 앱, Microsoft 365 추가 기능 라인업이 한 번에 모인 원문.
Anthropic, Building a new enterprise AI services company. 5월 4일 Anthropic + Blackstone + Hellman & Friedman + Goldman Sachs 공동 발표. 중견 기업 시장을 노린 새 AI 서비스 회사 설립의 원문.
Vals AI, Finance Agent benchmark. SEC 공시 자료 리서치 537문항으로 구성된 금융 에이전트 벤치마크. Opus 4.7 64.37%, Sonnet 4.6 63.33% 점수의 출처.
Anthropic, Claude Managed Agents overview. 길게 이어지는 세션, 도구 권한, 자격 증명 보관, 감사 로그 같은 운영 장치를 적은 공식 문서.
GitHub, anthropics/financial-services. 10개 에이전트 템플릿과 쿡북이 모인 Anthropic 공식 금융 서비스 마켓플레이스 레포지토리.
The Next Web, The day after the $1.5bn JV, Anthropic shipped what the JV will sell. 5월 4일 합작 발표와 5월 5일 템플릿 출시를 같은 흐름으로 읽은 외부 분석.
The Digital Banker, JPMorgan Chase's LLM Suite drives AI transformation across the enterprise. JPMorgan 사내 LLM Suite의 직원 23만 명 사용 규모와 450개 이상 활용 사례 운영 보도.