테크 논문리뷰 오픈소스

Company.bites

AI 테크 & 논문 리뷰 / Deep dives into AI & tech research

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가

Company Bites — AI 테크 & 논문 리뷰
🧵 Threads

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가

2026년 4월, "원시인처럼 말하게 했더니 토큰이 75% 줄었다"는 게시글이 Reddit에서 하룻밤 만에 1만 업보트를 받았다. Caveman이다. 마케팅인지 진짜인지 뜯어봤다.

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - Company Bites 심층분석


2026년 4월 3일, Reddit r/ClaudeAI에 게시글 하나가 올라왔다.

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - caveman github
"Taught Claude to talk like a caveman to use 75% less tokens"

24시간 안에 업보트 1만 개를 넘겼다. 닷새 뒤, 작자인 Julius Brussee는 Claude Code 공식 스킬로 패키징했다. GitHub 스타는 48시간 만에 4,100개를 찍었다.

"원시인처럼 말해라." 이게 뭔 소리인지, 그리고 실제로 효과가 있는지 — 뜯어봤다.

GitHub: github.com/juliusbrussee/caveman | 라이선스: MIT | Stars: ~14K (2026년 4월)

만든 사람: 19살, 레이던 대학교 1학년

Julius Brussee는 네덜란드 레이던 대학교에서 데이터 사이언스·AI를 전공 중인 19살 개발자다. 아버지는 Jazz Jackrabbit을 만든 게임 개발자 Arjan Brussee다.

이미 창업 경험이 있다. RAG 플랫폼 Stacklink의 창업 엔지니어였고, 2025년 1월에는 AI 학습 앱 Revu Labs를 창업했다. Caveman은 그의 GitHub에 올라온 오픈소스 사이드 프로젝트다.

그가 Reddit에 올린 설명은 단순했다.

"Claude Code에 '원시인처럼 짧게 말해라'는 규칙을 주입했더니 출력 토큰이 75% 줄었다."

기술적으로 뭘 하는 건가

Caveman은 Claude 모델 자체를 바꾸지 않는다. 모델에 주입하는 시스템 컨텍스트(프롬프트)를 조작한다. 세 개의 훅(hook)으로 동작한다.

훅 1: SessionStart

세션이 시작될 때 Claude에게 아래 지시를 숨겨서 집어넣는다. 사용자 눈에는 안 보인다.

`

Terse like caveman. Technical substance exact. Only fluff die.

Drop: articles, filler (just/really/basically), pleasantries, hedging.

`

번역하면: "원시인처럼 짧게. 기술적 내용은 정확하게. 불필요한 말은 죽여라. 관사, 필러(just/really/basically), 인사말, 헤징은 없앤다."

훅 2: UserPromptSubmit

/caveman 명령어를 감지해서 강도를 전환한다. /caveman lite, /caveman full, /caveman ultra 세 단계다.

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - caveman levels
  • lite — 필러 단어만 제거. "I think this might work" → "This works."
  • full — 전보문 스타일. "Function returns null" / "Add error handler."
  • ultra — 최대 압축. 거의 암호 수준.
  • 文言文 — 보너스 레벨. 고전 한문 스타일("物出新參照,致重繪。useMemo Wrap之。")로 최극단 압축.

훅 3: Statusline

~/.claude/.caveman-active 플래그 파일로 현재 활성 상태를 표시한다.

실제로 어떻게 달라지는지는 아래 Before/After 비교가 가장 직관적이다.

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - caveman before after

같은 내용을 69토큰으로 설명하던 걸 19토큰으로 줄였다. 기술 정확도는 그대로다.

핵심: 무엇을 제거하는가

Caveman이 제거하는 것들:

  • 관사·조동사 — "a", "the", "can be", "would need to"
  • 헤징 — "I think", "might", "perhaps", "it seems like"
  • 인사말 — "Great question!", "I hope this helps", "Feel free to ask"
  • 요약 반복 — "So to summarize what I did...", "As I mentioned above..."
  • 트랜지션 필러 — "Moving on to the next part", "Now let's look at"

제거하지 않는 것: 코드 블록, URL, 날짜, 기술 용어, 숫자.


부록 기능: Caveman Compress

별도 도구인 Caveman Compress는 프로젝트의 CLAUDE.md 파일을 원시인 문체로 재작성한다.

매 세션마다 Claude가 읽어들이는 CLAUDE.md가 있다면, 이걸 압축하면 입력 토큰도 줄어든다. 주장하는 절감률은 약 46%. 원본은 CLAUDE.original.md로 백업된다. 코드·URL·기술 구문은 건드리지 않는다.


"75% 절감"의 실체

이게 마케팅인지 실제인지가 핵심이다.

조건이 있다. 75%는 "담화성 텍스트(discursive text)"에만 해당한다. 설명문, 요약, 인사말, 전환 문구처럼 순수 서술형 출력이 대상이다.

문제는 일반적인 Claude Code 세션에서 이런 텍스트가 차지하는 비중이 약 25%라는 점이다. 나머지 75%는 코드, 파일 경로, 명령어, 오류 메시지다. Caveman은 이 부분을 건드리지 못한다.

계산하면:

`

실제 절감 = 0.25 × 0.75 = 18.75%

(담화 비중) × (담화 내 절감률)

`

저자 본인이 1주일간 직접 측정한 결과도 출력 토큰 48% 감소였다. 75%가 아니다. 세션 전체 토큰으로 환산하면 4~10% 수준이다.

Brussee 자신도 HN 스레드에서 인정했다.

"This skill is not intended to reduce hidden reasoning/thinking tokens. The 75% claim needs proper benchmarking. It was intended as a joke, not rigorous research."

Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - token breakdown
Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - star growth

배경 논문: 정말로 짧게 말하면 정확도가 오를까

Caveman의 근거로 자주 인용되는 논문이 있다.

"Brevity Constraints Reverse Performance Hierarchies in Language Models"

Hakim et al., arXiv:2604.00025 (2026년 3월)

31개 LLM 모델, 1,485개 문제, 5개 벤치마크를 대상으로 테스트했다.

핵심 발견:

  • 대형 모델이 소형 모델보다 최대 28.4퍼센트포인트 낮은 정확도를 보이는 문제가 전체의 7.7%에 달했다
  • 이유: 대형 모델이 자발적으로 59% 더 긴 응답을 생성하는데, 이게 추론 향상이 아니라 오류 누적으로 이어졌다
  • 간결성 제약("50단어 이내로 답해라")을 추가하자 대형 모델 정확도가 +26.3퍼센트포인트 향상됐다
Claude Code 토큰을 75% 줄인다는 'Caveman' — 19살 개발자의 바이럴 툴, 진짜인가 - brevity research

다만 이 연구는 "원시인 문체"를 테스트한 게 아니다. 일반적인 "간결하게 답해라" 지시문이다. Caveman이 이 효과를 그대로 낸다는 증거는 아직 없다.


Hacker News 반응: 399포인트, 238개 댓글

HN 스레드(ID: 47647455)에서 개발자들의 반응은 두 갈래로 나뉘었다.

긍정 쪽

  • "토큰 소비량으로 성과를 평가받는 팀에서 실용적이다"
  • "AI 응답의 BS를 줄여주는 실질적 효과가 있다"
  • "불필요한 설명이 사라지니 오히려 내용이 더 잘 이해된다"

비판 쪽

1. 벤치마크 부재

SWE-bench나 HumanEval 같은 코딩 벤치마크 결과가 없다. 실제 코드 품질에 어떤 영향을 미치는지 검증된 수치가 전혀 없다.

2. 모델을 더 멍청하게 만든다는 주장

"필러 단어들도 모델이 추론할 때 쓰는 계산 경로다. 그걸 제거하면 성능이 내려간다." 이 주장에도 현재는 결정적 증거가 없다.

3. 스킬 자체가 컨텍스트를 잡아먹는다

Caveman 스킬 지시문 자체도 토큰을 소비한다. 세션이 짧으면 절감 효과가 스킬 로딩 비용보다 작을 수 있다.

4. "더 단순한 6줄로 같은 효과"

일부 개발자가 CLAUDE.md에 6줄짜리 직접 지시로 유사한 효과를 냈다고 보고했다.


실제로 써본 사람들의 후기

출시 직후 여러 개발자가 직접 측정한 결과를 공개했다. 마케팅 수치와 꽤 다르다.

실측 토큰 절감률

Laravel 마이그레이션 프로젝트에서 1주일간 직접 측정한 결과(pasqualepillitteri.it)를 정리하면 이렇다.

"75%는 마케팅이다. 실제 API 비용 절감은 코딩 세션 기준 15~25% 수준이었다."

48시간 에이전트 연속 테스트(dev.to)에서는 하루 토큰 소비가 180K → 108K으로 줄었다. 비용으로 환산하면 $0.54 → $0.32/일.

측정 상황 절감률
출력 토큰 (1주 코딩 세션) 48%
전체 세션 토큰 4~10%
Caveman Compress 병행 시 8~15%
에이전트↔에이전트 파일 전달 40%

예상 밖으로 좋았던 점

코드 품질이 오히려 나아진 경우가 있다. 48시간 테스트 저자는 이렇게 설명했다.

"토큰이 줄어드니 Claude가 잘못된 방향으로 말을 늘어놓다 스스로 꼬이는 현상이 줄었다. Less prose = less self-anchoring to a bad plan."

코드 리뷰 통과율도 일반 82% vs Caveman 84%로 거의 동일했다.

멀티에이전트 환경이 진짜 킬러 유즈케이스다. 에이전트 간 핸드오프 파일 크기가 40% 줄면서 다음 에이전트로 컨텍스트가 넘어갈 때 드리프트가 줄었다는 보고가 여럿 있었다. 인간이 Claude와 대화하는 것보다 에이전트끼리 주고받을 때 효과가 더 크다.

HN 댓글(trueno):

"seeing it laid out to you in caveman bulletpoints gives you this weird brevity that processes a little differently."

안 좋았던 점

가장 일관되게 나온 부정 후기는 학습·설명 목적에서다. 새 프레임워크를 배우거나 에러 원인을 이해해야 할 때, 설명이 잘려서 오히려 대화 횟수가 늘었다는 사례가 많았다.

HN 댓글(teekert, 직접 테스트 후):

"Idk I try talk like cavemen to claude. Claude seems answer less good."

HN 댓글(TeMPOraL):

"the more you force the model to be concise, the more difficult the task becomes for it."

초반 1~4시간은 출력이 툭툭 끊겨서 적응 시간이 필요했다는 후기도 공통적으로 나왔다. 결론을 앞에 올리는 방식으로 프롬프트 구조를 바꾸자 해결됐다는 경험담이 많았다.

Product Hunt 댓글에서는 스킬 파일 자체가 입력 토큰을 소비하기 때문에 세션이 짧으면 절감 효과보다 스킬 로딩 비용이 더 클 수 있다는 지적도 나왔다.


설치 방법

`bash

Claude Code CLI에서 실행

claude plugin marketplace add JuliusBrussee/caveman

claude plugin install caveman@caveman

`

설치 후 Claude Code 세션 안에서 /caveman으로 활성화한다.

또는 플러그인 없이 직접 CLAUDE.md에 아래를 추가해도 된다.

`markdown

응답 스타일

Terse like caveman. Technical substance exact. Only fluff die.

Drop: articles, filler, pleasantries, hedging. Keep: code, URLs, technical terms.

`


언제 쓰면 되고, 언제 피해야 하나

효과적인 상황

  • 대규모 코드베이스 탐색 — Claude가 파일을 읽고 요약할 때 불필요한 설명이 많이 붙는 환경
  • 반복 작업 — 같은 종류의 리팩터링이나 테스트를 대량으로 돌릴 때
  • 월별 토큰 한도 관리 — Pro 요금제에서 컨텍스트 한도를 의식해야 하는 팀
  • Caveman Compress 병행 — CLAUDE.md가 길어진 프로젝트에서 입력 토큰까지 같이 줄일 때

피해야 하는 상황

  • 설명이 필요한 학습 목적 — 코드가 왜 이렇게 작동하는지 이해해야 할 때 brevity가 방해가 된다
  • 복잡한 수학·추론 — 논문에서도 명시했듯 chain-of-thought가 필요한 문제에서 압축이 역효과를 낸다
  • 고객 대면 콘텐츠 생성 — 출력이 곧 최종 결과물일 때는 원시인 문체가 나오면 안 된다
  • 신규 팀원 온보딩 — 간결한 답변이 맥락을 잘라먹어서 이해를 방해할 수 있다

이 툴이 실제로 말하는 것

Caveman 자체가 혁명적인 기술은 아니다. 작동 원리는 "프롬프트에 지시 한 줄 추가"다. 19살 개발자가 농담으로 올린 게 하룻밤 만에 1만 업보트를 받은 이유는 기술 때문이 아니었다.

이유는 두 가지다.

첫 번째, 토큰 비용이 개발자의 일상 고민이 됐다. Claude Code를 업무에 쓰는 팀이 늘면서 토큰 한도와 비용이 실질적인 문제로 올라왔다. "4-10% 절감"이 별것 아닌 것 같지만, 월 5억 토큰을 쓰는 팀이라면 월 $3,000 수준의 차이다.

두 번째, Claude의 응답이 필요 이상으로 장황하다는 불만이 쌓여 있었다. "Great question! I'll help you with that. Let me first explain the background..." — 이런 서두를 자르고 싶다는 수요는 Caveman 이전부터 있었다. Caveman은 그 수요에 "원시인"이라는 콘셉트를 붙여서 공유하기 쉽게 만들었다.

Brussee 본인의 말:

"이건 원래 농담이었다. 엄밀한 연구가 아니다."

그 농담이 클로드 코드 스킬 생태계 전체를 흔들었다. 4월 한 달 동안 관련 프로젝트들이 합산 6만 5천 스타를 쌓았다. 사람들이 AI 응답의 경제학을 생각하기 시작했다는 신호다.


요약

항목 내용
만든 사람 Julius Brussee, 19세, 레이던대 AI전공 1학년
작동 원리 SessionStart/UserPromptSubmit/Statusline 세 훅으로 관사·필러·인사말 제거
마케팅 주장 출력 토큰 75% 절감
실제 효과 담화성 텍스트 한정 65~75%, 세션 전체 4~10%
과학적 근거 arXiv:2604.00025 — 간결성 제약 시 정확도 +26.3%p (원시인 문체 특정 연구는 아님)
HN 반응 399포인트, 238댓글, 벤치마크 부재 비판 多
설치 claude plugin marketplace add JuliusBrussee/caveman
라이선스 MIT
GitHub Stars 48h 4,100 → 최고 약 14,000 (출처별 편차 있음)

자주 묻는 질문

Q. Caveman이 코드 품질에 영향을 미치나요?

A. 모른다 — 가 솔직한 답이다. 현재까지 HumanEval, SWE-bench 등 코딩 벤치마크에서 Caveman을 테스트한 공개 연구가 없다. 코드 블록 자체는 압축하지 않기 때문에 생성 코드에 직접 영향을 줄 가능성은 낮지만, 확인된 수치가 없다.

Q. /compact와 차이가 뭔가요?

A. /compact는 Claude Code 내장 기능으로 현재 대화를 요약하고 컨텍스트를 초기화한다. Caveman은 요약 없이 응답 자체를 짧게 만든다. 둘은 병행 사용이 가능하다.

Q. 한국어 응답에도 효과가 있나요?

A. Caveman의 지시문은 영어 기준이다. 한국어 응답에서도 필러를 줄이는 효과는 어느 정도 있지만, 영어 대비 절감률은 낮을 가능성이 높다. 한국어 CLAUDE.md에 직접 지시를 추가하는 방식이 더 효과적일 수 있다.

Q. CLAUDE.md에 직접 지시를 추가하는 것과 스킬 설치의 차이는?

A. 결과는 비슷하지만 스킬 방식이 /caveman lite/full/ultra 강도 전환, 세션 상태 표시 같은 편의 기능을 추가로 제공한다. CLAUDE.md 직접 방식은 설정이 단순하고 스킬 로딩 오버헤드가 없다. 시작은 6줄 CLAUDE.md로 해보고 부족하면 스킬을 설치하는 순서가 합리적이다.

Q. 회사 환경에서 써도 되나요?

A. MIT 라이선스라 상업적 사용에 제한이 없다. 다만 응답이 지나치게 압축되면 팀원 간 커뮤니케이션에서 맥락이 잘릴 수 있다. 개인 코딩 세션에는 ultra, 팀 공유 문서가 나오는 세션에는 lite 또는 비활성화를 권한다.


Caveman GitHub: github.com/juliusbrussee/caveman | arXiv 논문: arxiv.org/abs/2604.00025


Company Bites — AI 신기술·논문·오픈소스를 한입 크기로
🧵 Threads

댓글 없음:

댓글 쓰기

Company.bites© 2026. AI 테크 & 논문 리뷰 / Deep dives into AI & tech research.