시장 분석 리포트 하나에 반나절. 경쟁사 동향 파악하려면 탭 30개. 이제 AI가 대신 해준다는 건 다들 아는데, 문제는 어떤 AI를 써야 하는가예요. OpenAI, Google, Anthropic — 빅3가 모두 Deep Research를 내놨거든요. 동일한 질문을 던져봤더니, 세 도구의 성격이 완전히 달랐어요.

3초 요약
OpenAI — 대화하며 범위 좁히기 Gemini — 내 Gmail·Drive 연동 Claude — 261개 소스, 6분 분석 용도별로 답이 다름

이게 뭔데?

Deep Research는 AI가 알아서 웹을 돌아다니며 수십~수백 개 소스를 읽고, 출처 달린 보고서를 만들어주는 기능이에요. 2024년 말 OpenAI가 먼저 내놨고, Google과 Anthropic이 뒤따랐어요. 핵심은 단순 요약이 아니라 "다단계 자율 리서치"라는 거예요 — 검색하고, 읽고, 부족한 부분을 발견하면 다시 검색하는 걸 여러 번 반복해요.

세 도구의 기술적 접근 방식이 다 달라요.

1/3

OpenAI Deep Research — "리서치 파트너"

강화학습으로 훈련된 추론 모델(o3/o4-mini)이 연구 계획을 세우고 실행해요. 독보적인 점은 대화형 범위 좁히기 — 바로 리서치를 시작하지 않고, 먼저 후속 질문을 던져서 목표를 구체화해요. 중간에 끼어들어 방향을 바꾸거나 소스를 제한할 수도 있어요.

2/3

Gemini Deep Research — "구글 생태계 통합"

Gemini 2.5 Pro의 100만 토큰 컨텍스트 윈도우로 방대한 자료를 소화해요. 결정적 차이는 Gmail, Google Drive, Chat까지 연동한다는 거예요. 내 이메일과 문서 + 웹 데이터를 합쳐서 분석하고, 결과를 Google Docs로 바로 내보낼 수 있어요.

3/3

Claude Research — "소스 헌터"

리드 오케스트레이터가 여러 서브에이전트를 동시에 파견하는 멀티에이전트 아키텍처예요. 테스트에서 261개 소스를 6분 만에 분석하며 소스 커버리지 1위를 기록했어요. 보고서도 5페이지 내외로 간결하게 핵심만 짚어주는 스타일이에요.

261개
Claude 소스 분석 수 (6분)
62개
Gemini 소스 분석 수 (15분)
30분+
OpenAI 복잡 쿼리 소요 시간

뭐가 달라지는 건데?

같은 "Deep Research"라는 이름이지만, 실제로 써보면 성격이 완전히 달라요. 연구 파트너 vs 데이터 통합자 vs 소스 헌터 — 비유가 아니라 실제 차이예요.

항목 OpenAI Deep Research Gemini Deep Research Claude Research
핵심 모델 o3 / o4-mini Gemini 2.5 Pro Claude (멀티에이전트)
접근 방식 대화형 범위 좁히기 자율 계획 수립 → 실행 병렬 서브에이전트 파견
소스 커버리지 중간 62개 (15분 기준) 261개 (6분 기준)
속도 느림 (10~30분+) 보통 (5~15분) 빠름 (6~18분)
보고서 스타일 장문 (30+ 페이지) 장문 + 구조화 간결 (5페이지 내외)
내 데이터 연동 파일 업로드만 Gmail, Drive, Chat, Docs 파일 업로드만
중간 개입 실시간 방향 수정 가능 계획 확인 후 시작 시작 후 대기
결과 내보내기 복사/다운로드 Google Docs 바로 내보내기 복사/다운로드
가격 (월) $20 (Plus) / $200 (Pro) $19.99 (Advanced) $20 (Pro) / $100 (Max)
쿼리 한도 25회 (Plus) / 250회 (Pro) Advanced 구독자 무제한 (일일 한도 있음) Pro 메시지 한도 내

숫자를 정리하면 이런 그림이에요: Claude가 소스 커버리지와 속도에서 압도적이고, Gemini는 데이터 정확도와 생태계 통합에서 앞서고, OpenAI는 리서치 과정의 제어력에서 독보적이에요.

용도별 추천

리서치 방향이 아직 모호할 때 → OpenAI (대화로 범위를 좁혀주니까)
내 이메일·문서 + 시장 데이터를 합쳐 분석할 때 → Gemini (Gmail/Drive 연동)
빠르게 넓은 소스를 훑어야 할 때 → Claude (261개 소스, 6분)
팩트 체크·숫자 검증이 중요할 때 → Gemini (데이터 정확도 1위)
읽기 좋은 간결한 보고서가 필요할 때 → Claude (5페이지 핵심 요약)

환각(Hallucination)은 세 도구 모두의 문제

Deep Research도 AI인 이상 환각이 있어요. 벤치마크(DR-50)에서 가장 높은 정확도가 34%일 정도로, 아직 완벽한 도구는 없어요. 어떤 도구를 쓰든 핵심 팩트는 반드시 원본 출처를 클릭해서 직접 확인하세요. Deep Research는 출발점이지 결론이 아니에요.

핵심만 정리: 시작하는 법

세 도구 모두 유료 구독이 필요해요. 이미 쓰고 있는 AI 생태계에 따라 선택하는 게 가장 현실적이에요.

  1. 이미 쓰는 AI가 있다면 거기서 시작
    ChatGPT Plus($20/월)를 쓰고 있다면 OpenAI Deep Research가 바로 사용 가능해요. Gemini Advanced($19.99/월)도, Claude Pro($20/월)도 마찬가지. 추가 비용 없이 기존 구독에서 바로 써보세요.
  2. 첫 리서치는 동일한 질문으로 비교 테스트
    실제 업무에서 쓸 질문 하나를 정해서 세 도구에 동시에 던져보세요. "우리 산업의 2026년 트렌드 5가지를 근거와 함께 분석해줘" 같은 질문이면 차이가 확실히 느껴져요.
  3. OpenAI: 대화형 좁히기를 활용
    ChatGPT에서 Deep Research 모드를 선택한 뒤 질문을 입력하면, AI가 먼저 후속 질문을 던져요. 이때 꼼꼼하게 답할수록 결과가 좋아져요. 중간에 소스 제한("이 도메인만 참고해")도 가능해요.
  4. Gemini: 소스 설정에서 Gmail/Drive 켜기
    Gemini Advanced에서 Deep Research를 선택하고, "소스" 버튼에서 Gmail·Drive·Chat을 추가하세요. 내 데이터와 웹 데이터를 합쳐서 분석하는 게 Gemini만의 진짜 강점이에요.
  5. Claude: Research 토글 켜고 질문
    Claude Pro에서 Research 토글을 켜면 멀티에이전트가 동시에 소스를 탐색해요. 속도가 빠르니까 여러 각도로 질문을 바꿔가며 반복 리서치하기에 좋아요.