출시 러시의 정점에서 오픈으로 기우는 무게 중심

오늘의 흐름 정리

지난 나흘의 AI 뉴스는 정반대로 보이는 두 힘이 같은 주에 맞물린 모습이다. 한쪽에서는 빅테크가 또 한 번 라인업을 통째로 갈아엎었다. OpenAI가 GPT-5.5 계열을 보안과 헬스케어로 밀어붙였고 다른 한쪽에서는 GLM-5.2와 Apertus 같은 오픈 웨이트 모델이 “이 정도면 굳이 폐쇄형을 안 써도 된다”는 정서를 빠르게 키우고 있다. 본인은 이 두 흐름이 모순이 아니라 한 지점에서 만난다고 본다. 출시 경쟁이 정점을 찍을수록, 정작 사용자 선택의 무게 중심은 “어느 폐쇄형 모델이냐”라는 질문에서 멀어지고 있다는 것이다.

프론티어는 다시 한 번 갈아엎혔다

이번 주 출시 밀도는 유난히 높았다. Anthropic은 코딩·에이전트·전문 업무 성능과 장시간 작업 일관성을 끌어올린 Opus 4.8을 내놓은 직후, 창작 라인업인 Fable 5와 Mythos 5까지 같은 호흡으로 공개했다. 한 분기에 한 번 나올 법한 발표가 며칠 안에 겹친 셈이다.

OpenAI는 모델 자체보다 응용으로 무게를 옮겼다. Codex Security와 GPT-5.5-Cyber로 취약점을 대규모로 탐지·패치하는 Daybreak를 발표했고, GPT-5.5 Instant 기반으로 ChatGPT의 건강 답변 품질을 개선했다. Anthropic도 DXC와 제휴해 은행·항공 같은 규제 산업의 기간 시스템에 Claude를 심기로 했다. 모델 경쟁의 전선이 벤치마크 점수에서 보안·의료·엔터프라이즈 같은 실제 업무로 옮겨가고 있다는 신호다.

무게 중심은 오픈·로컬로 새고 있다

흥미로운 건 이 화려한 출시 러시와 동시에, 수요의 바닥이 조용히 이동하고 있다는 점이다. MIT 라이선스 오픈 웨이트 모델 GLM-5.2는 Opus와 코딩·성능·가격을 정면 비교하는 자리에 올라섰고(해당 글은 HN에서 449포인트), 한 분석에서는 GPT-5.5의 환각률이 GLM-5.2의 3배라는 결과까지 제시됐다. 753B 파라미터에 약 40B만 활성화하는 오픈 모델이 정확성에서 프론티어를 앞선다는 사례는, 모델 크기가 곧 신뢰성은 아니라는 회의에 힘을 싣는다.

흐름은 벤치마크에만 머물지 않는다. 주권 AI를 표방한 오픈 파운데이션 모델 Apertus가 HN 515포인트로 주목받았고, opencodex는 OpenAI Codex에서 Claude·GLM-5.2 등 아무 LLM이나 쓰도록 스트리밍·툴 호출을 양방향 변환한다. 월 30달러 예산으로 Opus를 최대한 굴리는 비용 전략이 커뮤니티에서 진지하게 논의되고, geeknews에는 오픈 모델로 갈아탈 때의 단점이 크게 줄었다는 분석이 올라왔다. 폐쇄형에 묶여 있을 이유가 한 겹씩 벗겨지는 중이다.

그래서 결국 하네스가 남는다

두 축을 잇는 고리는 결국 “무엇으로 굴리느냐”다. ByteDance는 샌드박스·메모리·서브에이전트를 갖춘 장기 작업용 오픈소스 하네스 deer-flow를 공개했고, 한 실험에서는 같은 모델·같은 프롬프트로도 에이전트 프레임워크가 다르면 코드 결과가 달라졌다. 코딩 에이전트의 핵심은 128줄 파이썬이라는 해부 글이 화제가 된 것도 같은 맥락이다. 모델이 상품화될수록, 차이를 만드는 건 그 모델을 감싼 하네스로 넘어간다.

한 줄 정리

빅테크가 라인업을 다시 갈아엎은 바로 그 주에, 사용자의 질문은 “어느 폐쇄형 모델이냐”에서 “어떤 하네스로 어떤 모델을 굴리냐”로 옮겨가고 있다. 출시 러시의 정점은 동시에 오픈·로컬로 무게 중심이 기우는 변곡점이기도 하다.

오늘의 흐름 정리

프론티어는 다시 한 번 갈아엎혔다

무게 중심은 오픈·로컬로 새고 있다

그래서 결국 하네스가 남는다

한 줄 정리

댓글 남기기 응답 취소