도구는 깊어지고 모델은 작아진다

오늘의 흐름 정리

화요일 이후 이틀간의 흐름은 두 방향으로 갈린다. 하나는 에이전트를 떠받치는 도구 레이어가 더 깊어지면서 동시에 거친 부작용을 드러냈다는 점이고, 다른 하나는 모델의 무게중심이 작고 로컬한 쪽으로, 그리고 규제의 사정권 안으로 옮겨가고 있다는 점이다. 본인은 이 두 갈래가 결국 “모델보다 그 주변”이라는 같은 질문으로 수렴한다고 본다.

깊어지는 도구, 거칠어지는 부작용

마이크로소프트가 오픈소스로 공개한 FastContext는 코딩 에이전트의 저장소 탐색을 별도 서브에이전트로 떼어낸다. 메인 에이전트가 탐색과 문제 해결을 동시에 떠안는 대신, 병렬 read-only 호출(READ·GLOB·GREP)로 파일 경로와 라인 범위만 압축해 돌려주는 구조다. 하네스가 단일 모델에서 역할 분담 구조로 분화하고 있다는 신호다.

반대편에는 같은 도구 레이어의 거친 단면이 있다. Codex의 로컬 피드백 로그 버그가 한 사용자 환경에서 21일 만에 메인 SSD에 약 37TB를 기록한 사례가 보고됐다. 연 환산 약 640TB로, 일부 컨슈머 SSD의 보증 수명을 위협하는 수준이다. 도구가 빠르게 두꺼워질수록 이런 자원 부작용도 함께 커진다.

작아지는 모델, 좁아지는 규제 여백

모델 쪽 화제는 효율과 로컬이다. 3B 규모의 VibeThinker가 새로운 SFT+GRPO 조합으로 추론 벤치마크에서 Opus 4.5를 앞섰다는 주장이 올라왔고(아직 독립 검증은 필요하다), 6년 된 Xeon CPU에서 gemma-4-26B가 초당 64토큰을 내며 “에이전틱 코딩도 가능하다”는 보고도 나왔다. 거대 GPU 없이도 쓸 만한 추론이 가능하다는 흐름이다.

동시에 규제의 시계는 빨라진다. EU AI Act는 8월 2일부터 생성 텍스트를 기계가 판독 가능하도록 워터마킹·표시하라고 요구하며, 위반 시 거액의 과징금이 걸린다. 오픈소스 모델 제공자까지 사정권에 든다는 해석이 커뮤니티에서 확산됐다. 작고 자유로워지는 모델과, 그 출력을 추적 가능하게 묶으려는 규제가 정면으로 맞선다.

한 줄 정리

도구는 더 깊어지고 모델은 더 가벼워지지만, 그 사이를 규제와 자원 비용이 다시 조인다. 본인은 다음 화요일까지 FastContext류 분담형 하네스의 확산과 8월 규제 시행 준비가 핵심 관전 포인트라고 본다.

조회수: 1

댓글 남기기