함께 하는 코딩! 즐거운 코딩!

CODINGMAX

개발의 즐거움을 나누는 공간입니다. 강좌, 튜토리얼, 실험실에서 다양한 기술을 탐험하세요.

최신 글

새로운 콘텐츠를 확인하세요

전체 보기
01
블로그5월 10일10

요약하지 않았는데 96.6%가 나왔다, 원문 메모리가 이긴다

AI 메모리는 먼저 요약해야 할까. MemPalace는 원문 그대로 저장하고 의미 검색만으로 LongMemEval R@5 96.6%를 냈다. 이 수치가 왜 중요한지, 어디까지 믿어야 하는지 짚는다.

02
블로그5월 10일18

12 patch 안에 두 디폴트가 옵트인으로 돌아왔다 — Claude Code 2.1.128~2.1.138

2.1.126에서 자동으로 켰던 게이트웨이 /v1/models discovery가 2.1.129에서 환경 변수 옵트인으로 돌아왔다. 2.1.128에서 로컬 HEAD로 바꿨던 EnterWorktree base도 2.1.133의 worktree.baseRef 설정으로 origin 디폴트가 다시 들어왔다. 같은 12 patch 안에 plan mode allow-rule 누수 fix와 settings.autoMode.hard_deny도 도착했다.

03
블로그5월 8일28

Anthropic의 10개 금융 에이전트 템플릿이 말해 준 것

5월 4일의 대형 조인트벤처와 5월 5일의 템플릿 출시는 따로 떨어진 뉴스가 아니었다. 금융 AI의 표준 묶음이 무엇인지 한 번에 드러난 사건이었다.

04
블로그5월 8일15

코딩 에이전트는 무엇을 빼야 작동하는가

Playwright MCP를 깔면 컨텍스트의 6.8%가 도구 정의로 사라진다. Mario Zechner는 그 흐름을 거꾸로 갔다. 그가 자기 코딩 에이전트 pi에서 빼기로 결정한 일곱 가지를 짚는다.

05
블로그5월 8일27

AutoSkill — 사용자 대화에서 자라는 자가진화 스킬

AutoSkill은 사용자 대화 trace에서 반복 의도를 뽑아 Anthropic Agent Skills 형식의 SKILL.md로 버전 관리한다. 모델 재학습 없이 SkillBank를 키우고 WildChat-1M에서 평생 개인화를 검증한 자가진화 시스템의 설계와 통계를 정리했다.

06
블로그5월 8일12

GPT-4.1에 스킬을 붙였더니 Gemini 3 Pro를 넘었다

다섯 에이전트의 셀프플레이로 자연어 스킬을 자동 진화시키는 Ctx2Skill 논문 리뷰. GPT-4.1+Ctx2Skill의 16.5%가 Gemini 3 Pro 단독 15.8%를 넘는 결과로, 모델 크기 대신 스킬이 capability cap을 미는 첫 측정이다.

07
블로그5월 8일18

OpenAI는 왜 Realtime 음성을 셋으로 나눴을까

OpenAI는 Realtime API에 추론, 번역, 전사 모델을 따로 넣었다. 이번 발표의 핵심은 성능 숫자보다 하나로 다 하던 음성 모델을 역할별로 분리한 제품 방향에 있다.

08
블로그5월 3일17

프로젝트 상태를 한 줄로 비울 수 있게 됐다 — Claude Code 2.1.126

claude project purge 서브커맨드가 transcripts, tasks, file history, config entry를 한 명령으로 묶는다. 같은 2.1.126에서 --dangerously-skip-permissions의 보호 영역이 줄고, /model 피커가 게이트웨이의 /v1/models 응답을 따라가고, OTel skill_activated 이벤트에 invocation_trigger 속성이 붙었다.