지금 쓰고 있는 AI 도구 가격, 진짜 가격이라고 생각하세요? 실은 원래 가격의 2~10%만 내고 있는 거예요. 나머지는 투자자들이 대신 내고 있죠. 이 구조가 언제까지 갈 수 있을까요?
이게 뭔데?
AI 엔지니어 Will Taubenheim이 248,000단어 분량의 리서치 페이퍼를 발표했어요. 핵심은 이거예요 — 지금 AI 산업 전체가 적자 보조금 위에서 돌아가고 있다는 거죠.
숫자로 보면 더 명확해요. OpenAI는 2026년 기준 연간 250억 달러 매출을 올리고 있지만, 추론 비용(inference cost)만 연 141억 달러가 들어요. 여기에 모델 개발비 67억 달러, 인건비 25억 달러, Microsoft에 갚아야 할 투자금 130억 달러를 더하면? 여전히 적자예요.
이건 OpenAI만의 문제가 아니에요. Anthropic은 법원 제출 자료에서 누적 매출 50억 달러에 추론+훈련 비용이 100억 달러 이상이라고 밝혔고, Cursor(Anysphere)는 벤처캐피탈 30억 달러를 투입해서 연매출 20억 달러를 만들어내고 있어요.
Ed Zitron의 표현이 정확해요: "모든 AI 스타트업은 예외 없이 수억 달러를 수천만 달러로, 수십억 달러를 수억 달러로 바꾸는 중이다."
뭐가 달라지는 건데?
핵심은 지금 가격 vs 실제 비용의 격차예요. ScaleDown의 분석에 따르면 H200 GPU 서버 기반으로 계산했을 때 실제 추론 비용은 토큰 100만개당 약 6.37달러인데, GPT-4o-mini API 가격은 0.60달러예요. 보조금율 약 90%.
| 항목 | 지금 (보조금 O) | 보조금 종료 후 |
|---|---|---|
| ChatGPT Plus 구독료 | 월 $20 | 월 $100~200 이상 |
| Claude Code 개발자 비용 | 월 $100~200 | 월 $1,000+ 예상 |
| API 토큰 100만개 | $0.40~10 | $40~200 |
| 고객지원 AI (100만건/일) | 연 수백만 원 | 연 수십억 원 |
| AI 코딩 도구 (개인) | 월 $10~39 | 월 $100~390+ |
더 무서운 건 사용량도 동시에 폭발하고 있다는 거예요. 단순 텍스트 응답은 0.3Wh지만 추론(reasoning) 모드는 1.9Wh, 영상 생성은 1kWh로 3,333배나 전력을 먹어요. 에이전트가 하나의 작업에 AI를 10~20번 호출하면서 토큰 소비가 기하급수적으로 늘고 있죠.
제본스 역설(Jevons' Paradox): 토큰 단가가 떨어지면 사용량이 폭증해서 총비용은 오히려 올라가요. Uber도 처음엔 59% 보조금으로 시장을 잡았다가, 2018~2021년 사이 가격을 92% 올렸죠.
Steve Smith(Ardalis)는 더 직설적이에요: "2027년 말까지 Claude Code, Copilot 같은 에이전트형 AI 구독료가 2026년 1월 대비 10~100배 오를 것"이라고 예측했어요.
핵심만 정리: 시작하는 법
AI 가격이 10배 뛰어도 살아남으려면 지금부터 준비해야 해요.
- AI 비용 계기판 만들기
지금 당장 팀이 쓰는 AI 도구별 월 지출을 추적하세요. API 호출 수, 토큰 사용량, 구독료를 하나의 대시보드로 모아두면 가격 인상 시 즉시 영향을 파악할 수 있어요. - 10배 시나리오 스트레스 테스트
지금 AI 비용이 10배가 되면 사업이 돌아가나요? 핵심 워크플로우 중 AI 의존도가 높은 것부터 점검하고, 대안(로컬 모델, 오픈소스)을 미리 파악해 두세요. - 정액제 우선, 종량제 경계
종량제(per-token, per-action) 모델은 에이전트 시대에 비용 폭탄의 원인이 돼요. 가능하면 정액 구독을 선택하고, 종량제를 쓸 때는 월 상한선을 반드시 설정하세요. - 모델을 작업에 맞춰 분배하기
단순 자동완성에 최상위 모델을 쓰는 건 식료품 사러 트럭 모는 것과 같아요. 간단한 작업은 소형 모델, 복잡한 추론만 프리미엄 모델로. 이것만으로도 비용이 50~67배 줄어들 수 있어요. - 벤더 종속 최소화
하나의 AI 제공자에만 의존하면 가격 인상을 그대로 맞을 수밖에 없어요. 추상화 레이어를 만들어서 OpenAI, Anthropic, 오픈소스 모델 사이를 유연하게 전환할 수 있게 해두세요.
248,000단어 풀 리포트 — The Foundations Are Cracking
Will Taubenheim의 원본 보고서. 추론 보조금뿐 아니라 반도체 공급망(TSMC 92% 독점), 에너지 위기(중국 원자로 37기 vs 미국 0기), 노동시장 충격까지 7개 챕터로 분석해요. 35개 이상의 인터랙티브 데이터 시각화 포함.
AI Benefits — But at What Cost? (Ardalis)
OpenAI, Anthropic, Cursor, Harvey, Lovable 등 주요 AI 기업의 실제 재무 데이터를 파헤친 글. 특히 "모든 AI 스타트업이 수억 달러를 수천만 달러로 바꾸고 있다"는 패턴 분석이 인상적이에요.
The Unsustainable Economics of LLM APIs (ScaleDown)
GPU 서버 원가부터 시작해서 토큰당 실제 비용을 바텀업으로 계산한 기술 분석. 90% 보조금율의 근거가 되는 수식이 나와요. 비즈니스 의사결정자를 위한 전략적 시사점도 포함.
The Real AI Cost Crisis (Appalach.AI)
훈련 비용이 아니라 추론 비용이 진짜 위기라는 관점. 하이퍼스케일러들의 6,000억 달러 인프라 투자와 제본스 역설을 연결해서 설명해요.




