오늘의 흐름 한 줄 정리
지난 5월 19일 이후 본인이 본 AI 흐름은 두 축으로 수렴된다. 한 축은 OpenAI Codex가 2026 가트너 매직 쿼드런트에서 엔터프라이즈 AI 코딩 에이전트 리더로 등극하고 Virgin Atlantic·Ramp·KPMG 같은 대형 도입 사례가 동시에 공개되며 기업 표준 라인업이 한 단계 더 굳어졌다는 점이다. 다른 축은 같은 주에 Microsoft가 사내 Claude Code 라이선스를 취소했다는 보고가 나오고, Anthropic의 Project Glasswing이 한 달 만에 1만 건 넘는 취약점을 찾아냈지만 “이제 패치가 병목”이라고 자인했다는 점이다. 본인은 두 축이 한 지점에서 만난다고 본다 — 에이전트 쪽 생산 대역폭은 한 단 늘었지만 사람 쪽 검증·머지·패치 대역폭은 그대로다.
기업 채택 가속 — Codex의 가트너 리더, KPMG 27만 명 라인업
OpenAI는 2026 가트너 매직 쿼드런트의 엔터프라이즈 AI 코딩 에이전트 부문 리더로 호명됐다. 같은 주 Virgin Atlantic이 Codex로 모바일 앱 개편을 납기 안에 끝내고 P1 버그 0을 달성했다는 보고와 Ramp가 GPT-5.5 기반 Codex로 코드 리뷰 사이클을 시간 단위에서 분 단위로 압축했다는 보고가 차례로 올라왔다. Anthropic 쪽은 KPMG가 27.6만 명 임직원 전반에 Claude를 표준 도구로 도입한다는 발표로 응수했다. 세 발표가 한 주에 묶여 나온 것은 우연이 아니다. 분기 종료 직전 빅테크가 “엔터프라이즈 표준은 우리”라는 신호를 동시 송출하는 국면이고, 이번 라운드는 모델 벤치마크가 아니라 도입 명단으로 승부가 갈렸다.
큐레이션·스킬 표준화 — 보일러플레이트의 자리바꿈
같은 일주일에 GitHub 트렌딩 상위는 사실상 Claude Code 스킬·플러그인 모음집이 점령했다. multica-ai/andrej-karpathy-skills는 카르파티의 LLM 통찰을 단일 설정 파일로 묶어 CC 출력 품질을 끌어올린다며 15만 스타에 도달했고, garrytan/gstack은 CEO·디자이너·QA 워크플로 23종을 묶어 10만 스타를 넘겼다. Anthropic 자체도 claude-plugins-official, knowledge-work-plugins 같은 공식 저장소를 빠르게 채워가고 있다. 본인 해석은 단순하다 — 작년 “프롬프트 템플릿”이 차지하던 보일러플레이트 자리를 올해는 “스킬·플러그인 번들”이 받아내고 있다. 차이를 만드는 단위가 모델 → 하네스 → 스킬 묶음으로 한 단 내려왔다는 신호다.
비용과 슬롭의 반대 신호 — MS의 이탈, geohot의 6개월 보고
같은 주 Fortune이 보도한 Microsoft 내부 보고는 위쪽 신호와 정확히 반대다. Microsoft는 엔지니어 Claude Code 라이선스를 일괄 취소하고 Copilot CLI로 이전시켰고, 명분은 “AI 토큰 비용이 인건비보다 비싸지는 구간이 발생한다”였다. 같은 맥락에서 DeepSeek Reasonix가 hackernews 톱에 올라온 것도 우연이 아니다 — 캐시 적중률을 끌어올려 Claude Code/Codex 토큰 비용의 절반 미만을 노리는 저가형 대안 카테고리가 가시화되는 중이다.
품질 쪽에서는 geohot이 tinygrad 6개월 회고를 “The Eternal Sloptember” 제목으로 공개했다. 골자는 단순하다 — 에이전트가 PR을 빠르게 찍어내지만 미묘하게 잘못된 “슬롭”이 누적되며 팀 산출을 거꾸로 끌어내린다는 보고다. 같은 흐름에서 hardikpandya/stop-slop이 4천 스타를 넘었고, AI 보조 코딩 측정에서 틀리는 열두 가지 글이 geeknews 상위에 올랐다. “도입했다”에서 “측정·정정한다”로 담론이 한 칸 이동했다는 신호다.
Project Glasswing — 한 달, 1만 건, 그리고 패치 병목
이번 주 가장 무겁게 봐야 할 발표는 Anthropic의 Project Glasswing 1차 업데이트다. Claude Mythos 기반 자율 보안 에이전트가 한 달 동안 1만 건 넘는 치명적 취약점을 오픈소스·내부 코드 전반에서 찾아냈다는 보고이고, 더 무거운 한 줄은 “이제 발견이 아니라 패치가 병목”이라는 자인이다. 위쪽 채택 가속과 아래쪽 비용·슬롭 부담은 같은 원인을 공유한다 — 에이전트 출력 속도는 한 단 늘었지만 사람 쪽 머지·운영·패치 대역폭은 그대로다. Glasswing은 그 격차를 보안 영역에서 가장 정직하게 노출한 케이스다. 같은 주 Stainless 인수도 같은 맥락이다 — 클라이언트 SDK 품질이 결국 토큰 비용과 슬롭을 동시에 줄이는 가장 효율적인 레이어다.
한 줄 정리
본인은 “기업 표준은 OpenAI/Anthropic”이라는 위쪽 신호와 “비용·슬롭·패치 병목”이라는 아래쪽 신호를 분리해 보지 않는다. 둘은 같은 곡선의 위/아래일 뿐이고, 다음 한두 분기의 승부는 모델이 아니라 “스킬 묶음·SDK·검증 워크플로”라는 사람 쪽 레이어에서 갈릴 듯 싶다.
조회수: 1