Claude Code를 쓰다 보면 토큰이 생각보다 빨리 소진됩니다. 특히 대형 코드베이스를 분석하거나, 반복적인 보일러플레이트 코드를 생성할 때 Claude API 비용이 눈에 띄게 올라갑니다.
이 글에서는 제가 직접 구축해서 사용 중인 **3-Tier LLM 라우팅 구조**를 소개합니다. 간단히 말하면, 모든 작업을 Claude에 맡기는 대신 작업의 성격에 따라 적합한 모델에 분산시키는 방식입니다.
---
## 3-Tier 구조란?
작업을 세 가지 등급으로 나눠서 각각 다른 모델에 라우팅합니다.
**T1 — Claude (Sonnet)**
복잡한 추론, 아키텍처 결정, 실제 코드 작성이 필요한 작업입니다. 비용이 가장 높지만 판단력이 필요한 작업에만 사용합니다.
**T2 — Gemini / Explore Agent**
대형 코드베이스 전체 분석, 파일 3개 이상 탐색, 의존성 맵 파악 등 컨텍스트 윈도우를 많이 쓰는 작업입니다. Gemini는 1M 토큰 컨텍스트를 무료로 제공하므로 Claude 토큰을 전혀 소비하지 않습니다.
**T3 — Local LLM (LM Studio)**
보일러플레이트 생성, 스니펫 변환, 커밋 메시지 작성 등 단순 반복 작업입니다. 로컬에서 실행되므로 API 비용이 0원입니다.
---
## 실제 작동 방식
### T2 — 코드베이스 분석
플랜을 짜기 전에 관련 파일 구조를 파악해야 할 때, Claude에게 직접 파일을 읽히는 대신 Explore agent에게 위임합니다.
Explore agent는 Claude Code 내장 기능으로, 별도 비용 없이 코드베이스를 빠르게 탐색합니다.
### T3 — 커밋 메시지 자동 생성
커밋할 때마다 Claude에게 메시지를 생성시키는 건 낭비입니다. staged diff를 로컬 LLM에 넘기면 됩니다.
실제로 이렇게 씁니다.
Claude 토큰 0 소비로 커밋 메시지가 생성됩니다.
### T3 — 보일러플레이트 생성
새 tRPC 라우터, Zod 스키마, 타입 정의 같은 반복 패턴은 로컬 LLM으로 충분합니다.
---
## Claude Code Hook으로 자동화
매번 수동으로 Tier를 선택하면 잊어버리기 쉽습니다. Claude Code의 `UserPromptSubmit` 훅을 활용하면 모든 요청 전에 자동으로 Tier 분류 알림이 뜹니다.
`~/.claude/settings.json`에 등록하면 됩니다.
#Claude #ClaudeCode #LLM #AI개발 #토큰절감 #Gemini #LocalLLM #LMStudio #AI자동화 #개발생산성 #AIAgent #프롬프트엔지니어링