Claude Code 토큰 40% 절감하는 3-Tier LLM 라우팅 구조

 



Claude Code를 쓰다 보면 토큰이 생각보다 빨리 소진됩니다. 특히 대형 코드베이스를 분석하거나, 반복적인 보일러플레이트 코드를 생성할 때 Claude API 비용이 눈에 띄게 올라갑니다.

이 글에서는 제가 직접 구축해서 사용 중인 **3-Tier LLM 라우팅 구조**를 소개합니다. 간단히 말하면, 모든 작업을 Claude에 맡기는 대신 작업의 성격에 따라 적합한 모델에 분산시키는 방식입니다.

---

## 3-Tier 구조란?

작업을 세 가지 등급으로 나눠서 각각 다른 모델에 라우팅합니다.

**T1 — Claude (Sonnet)**

복잡한 추론, 아키텍처 결정, 실제 코드 작성이 필요한 작업입니다. 비용이 가장 높지만 판단력이 필요한 작업에만 사용합니다.

**T2 — Gemini / Explore Agent**

대형 코드베이스 전체 분석, 파일 3개 이상 탐색, 의존성 맵 파악 등 컨텍스트 윈도우를 많이 쓰는 작업입니다. Gemini는 1M 토큰 컨텍스트를 무료로 제공하므로 Claude 토큰을 전혀 소비하지 않습니다.

**T3 — Local LLM (LM Studio)**

보일러플레이트 생성, 스니펫 변환, 커밋 메시지 작성 등 단순 반복 작업입니다. 로컬에서 실행되므로 API 비용이 0원입니다.

---

## 실제 작동 방식

### T2 — 코드베이스 분석

플랜을 짜기 전에 관련 파일 구조를 파악해야 할 때, Claude에게 직접 파일을 읽히는 대신 Explore agent에게 위임합니다.

T2 (Explore agent): 전체 레포 스캔, 관련 파일 목록 반환 → T1 (Claude): 탐색 결과 바탕으로 플랜 작성

Explore agent는 Claude Code 내장 기능으로, 별도 비용 없이 코드베이스를 빠르게 탐색합니다.

### T3 — 커밋 메시지 자동 생성

커밋할 때마다 Claude에게 메시지를 생성시키는 건 낭비입니다. staged diff를 로컬 LLM에 넘기면 됩니다.

bash # gen-commit-msg.sh git diff --staged | aloop-ask.sh

실제로 이렇게 씁니다.

bash git add server/products.ts client/src/pages/pay.tsx git diff --staged | gen-commit-msg.sh # 출력: "refactor(billing): mark unimplemented features as 예정" git commit -m "$(git diff --staged | gen-commit-msg.sh)"

Claude 토큰 0 소비로 커밋 메시지가 생성됩니다.

### T3 — 보일러플레이트 생성

새 tRPC 라우터, Zod 스키마, 타입 정의 같은 반복 패턴은 로컬 LLM으로 충분합니다.

bash aloop-ask.sh "drizzle orm mysql users 테이블 스키마, 컬럼: id, email, name, createdAt"

---

## Claude Code Hook으로 자동화

매번 수동으로 Tier를 선택하면 잊어버리기 쉽습니다. Claude Code의 `UserPromptSubmit` 훅을 활용하면 모든 요청 전에 자동으로 Tier 분류 알림이 뜹니다.

bash # ~/.claude/scripts/tier-check.sh # UserPromptSubmit 훅에 등록 echo "┌─ [3-Tier 분류] ─────────────────────────────────" echo "│ T1=Claude T2=Gemini/Explore T3=Local LLM" echo "│ 파일 3개+ → T2 | 보일러플레이트 → T3 | 나머지 → T1" echo "└──────────────────────────────────────────────────"

`~/.claude/settings.json`에 등록하면 됩니다.

json { "hooks": { "UserPromptSubmit": [ { "hooks": [ { "type": "command", "command": "/pa

#Claude #ClaudeCode #LLM #AI개발 #토큰절감 #Gemini #LocalLLM #LMStudio #AI자동화 #개발생산성 #AIAgent #프롬프트엔지니어링