도구는 깊어지고 모델은 작아진다

오늘의 흐름 정리

화요일 이후 이틀간의 흐름은 두 방향으로 갈린다. 하나는 에이전트를 떠받치는 도구 레이어가 더 깊어지면서 동시에 거친 부작용을 드러냈다는 점이고, 다른 하나는 모델의 무게중심이 작고 로컬한 쪽으로, 그리고 규제의 사정권 안으로 옮겨가고 있다는 점이다. 본인은 이 두 갈래가 결국 “모델보다 그 주변”이라는 같은 질문으로 수렴한다고 본다.

깊어지는 도구, 거칠어지는 부작용

마이크로소프트가 오픈소스로 공개한 FastContext는 코딩 에이전트의 저장소 탐색을 별도 서브에이전트로 떼어낸다. 메인 에이전트가 탐색과 문제 해결을 동시에 떠안는 대신, 병렬 read-only 호출(READ·GLOB·GREP)로 파일 경로와 라인 범위만 압축해 돌려주는 구조다. 하네스가 단일 모델에서 역할 분담 구조로 분화하고 있다는 신호다.

반대편에는 같은 도구 레이어의 거친 단면이 있다. Codex의 로컬 피드백 로그 버그가 한 사용자 환경에서 21일 만에 메인 SSD에 약 37TB를 기록한 사례가 보고됐다. 연 환산 약 640TB로, 일부 컨슈머 SSD의 보증 수명을 위협하는 수준이다. 도구가 빠르게 두꺼워질수록 이런 자원 부작용도 함께 커진다.

작아지는 모델, 좁아지는 규제 여백

모델 쪽 화제는 효율과 로컬이다. 3B 규모의 VibeThinker가 새로운 SFT+GRPO 조합으로 추론 벤치마크에서 Opus 4.5를 앞섰다는 주장이 올라왔고(아직 독립 검증은 필요하다), 6년 된 Xeon CPU에서 gemma-4-26B가 초당 64토큰을 내며 “에이전틱 코딩도 가능하다”는 보고도 나왔다. 거대 GPU 없이도 쓸 만한 추론이 가능하다는 흐름이다.

동시에 규제의 시계는 빨라진다. EU AI Act는 8월 2일부터 생성 텍스트를 기계가 판독 가능하도록 워터마킹·표시하라고 요구하며, 위반 시 거액의 과징금이 걸린다. 오픈소스 모델 제공자까지 사정권에 든다는 해석이 커뮤니티에서 확산됐다. 작고 자유로워지는 모델과, 그 출력을 추적 가능하게 묶으려는 규제가 정면으로 맞선다.

한 줄 정리

도구는 더 깊어지고 모델은 더 가벼워지지만, 그 사이를 규제와 자원 비용이 다시 조인다. 본인은 다음 화요일까지 FastContext류 분담형 하네스의 확산과 8월 규제 시행 준비가 핵심 관전 포인트라고 본다.

오늘의 흐름 정리

깊어지는 도구, 거칠어지는 부작용

작아지는 모델, 좁아지는 규제 여백

한 줄 정리

댓글 남기기 응답 취소