하네스의 시대, 로컬 추론의 부활

지난 한 주의 AI 흐름은 두 축으로 모인다. 모델보다 모델 바깥(하네스)이 결과를 가른다는 인식이 굳어졌고, 10년 된 Xeon과 중고 V100으로 26B·27B 모델이 도는 저비용 로컬 추론이 같은 박자로 부각된 한 주를 정리한다.

공식 스킬과 회의의 평행 도착

Anthropic이 knowledge-work-plugins를 정식 오픈소스로 풀고 superpowers·taste-skill·stop-slop 같은 메타 스킬이 쏟아진 며칠, 같은 주 hackernews 상단에는 ‘AI와 대화하는 데 지쳤다’가 996점으로 함께 올랐다.

AI 코딩 도구의 양극화와 에이전트 비용 현실

OpenAI Codex가 가트너 매직 쿼드런트 리더로 호명된 주, Microsoft는 사내 Claude Code 라이선스를 취소하고 Copilot CLI로 이전했다. Anthropic Project Glasswing은 한 달 만에 1만 건의 취약점을 찾고도 패치 병목을 자인했다.

비용 폭발과 스테일 컨텍스트, 코딩 에이전트의 두 한계

Uber의 4개월 AI 코딩 예산 소진과 Anthropic Max 스로틀링 분쟁이 비용 한계를, MemTrace·Context Mode MCP·Specsmaxxing이 스테일 컨텍스트의 한계를 드러낸다. 모델 바깥의 라우팅과 하네스가 결과를 가르는 시점이다.

하네스 엔지니어링의 부상과 빅테크 모델 풀체인지

하네스 엔지니어링이 모델 성능을 가르는 시대가 본격화됐다. mattpocock의 스킬 파일이 GitHub 4만 스타를 넘긴 가운데, GPT-5.5·Gemini 3.1 Pro·Claude for Creative Work가 같은 주에 동시 도착했다.