"웹사이트 하나 만들어줘" — 이 한마디로 정말 쓸 만한 사이트가 나오는 시대가 됐어요. 근데 솔직히, AI가 만든 웹사이트 대부분은 아직도 "부트스트랩 기본 테마" 느낌이잖아요. OpenAI가 이 문제를 정면으로 인정하고, GPT-5.4로 "예쁜" 웹사이트를 만드는 구체적인 노하우를 공식 블로그에 전부 공개했어요.

3초 요약
디자인 시스템 정의 Hard Rules 프롬프트 세팅 frontend-skill 설치 Playwright로 자동 검증 세련된 웹사이트 완성

이게 뭔데?

OpenAI 개발자 블로그에 올라온 "Designing Delightful Frontends with GPT-5.4"는 단순한 소개 글이 아니에요. AI에게 어떤 규칙을 주면 디자인 퀄리티가 확 올라가는지, 프롬프트 레벨에서부터 검증 방법까지 전부 담은 실전 플레이북이에요.

배경을 먼저 알면 이해가 쉬워요. GPT-5.4는 2026년 3월에 출시된 OpenAI의 최신 프론티어 모델인데, 컴퓨터를 직접 조작할 수 있는 최초의 메인 모델이에요. 화면을 읽고, 마우스를 클릭하고, 키보드를 치는 게 됩니다. 그래서 Playwright 같은 브라우저 자동화 도구와 결합하면 — AI가 코드를 짜고, 브라우저에서 직접 확인하고, 문제 있으면 스스로 고치는 사이클이 가능해진 거예요.

이 가이드의 핵심은 크게 세 가지예요:

  1. Hard Rules 프롬프트
    AI가 따라야 할 디자인 규칙을 명시적으로 세팅. "카드 쓰지 마", "히어로는 풀 블리드로", "섹션당 목적 하나" 같은 구체적 제약조건이에요.
  2. Pre-build 3문서
    코딩 전에 비주얼 테시스(분위기·재질·에너지), 콘텐츠 플랜(히어로→CTA 흐름), 인터랙션 테시스(모션 2~3개)를 먼저 작성하게 해요.
  3. Playwright 시각 검증
    AI가 만든 페이지를 직접 브라우저에서 열어 확인하고, 반응형 깨짐이나 인터랙션 오류를 자동으로 수정해요.

추론 레벨은 낮게

OpenAI의 공식 권장: 프론트엔드 작업에선 low~medium 추론이 오히려 더 강력한 결과를 내요. 높은 추론은 모델이 과도하게 생각하게 만들어서, 불필요한 요소가 추가되거나 레이아웃이 복잡해지거든요.

뭐가 달라지는 건데?

"그냥 예쁘게 만들어줘"라고 했을 때 vs Hard Rules를 세팅했을 때, 결과물이 완전히 달라요. OpenAI가 내부 테스트에서 확인한 차이예요.

프롬프트만 (규칙 없음) Hard Rules + frontend-skill
히어로 영역 인셋 이미지 + 카드 나열 풀 블리드 히어로, 브랜드 최우선
레이아웃 대시보드형 카드 격자 섹션 기반, 카드 최소화
타이포그래피 Inter/Roboto 기본값 맥락에 맞는 표현적 폰트
모바일 대응 깨지는 경우 빈번 Playwright로 뷰포트별 자동 검증
모션 없거나 과도함 2~3개 의도적 모션 (Framer Motion)
카피 Lorem ipsum 또는 뻔한 문구 실제 제품 맥락 반영

GPT-5.4의 벤치마크 수치도 인상적이에요. 데스크톱 조작(OSWorld)에서 75%로 사람(72.4%)을 넘었고, 웹 브라우저 사용(WebArena)에서도 67.3%를 기록했어요. 실제 데모에서는 디자인 이미지 한 장을 주고 "이 스타일로 커피숍 웹사이트 만들어줘"라고 했더니, 반응형까지 완벽한 사이트를 한 번에 만들어냈어요.

가장 큰 변화는 AI가 자기 작업물을 직접 "볼 수 있게" 됐다는 거예요. 기존에는 코드만 뱉어내고 실제 렌더링 결과는 사람이 확인해야 했잖아요. 이제 GPT-5.4 + Playwright 조합이면 모델이 직접 페이지를 열어보고, 여러 뷰포트에서 테스트하고, 상태 관리나 네비게이션 문제까지 감지해요.

75%
OSWorld 데스크톱 조작 (사람 72.4%)
2/3
토큰 사용량 절감 (이전 모델 대비)
92.8%
스크린샷 이해도 (Mind2Web)

핵심만 정리: 시작하는 법

OpenAI 가이드의 실전 포인트만 뽑았어요. 이것만 따라 하면 바로 체감할 수 있어요.

  1. Hard Rules 프롬프트 세팅
    아래 규칙을 시스템 프롬프트나 프로젝트 설정 파일에 넣으세요. 핵심만 추리면: 첫 뷰포트는 하나의 구도(대시보드 아님), 브랜드명이 가장 큰 텍스트, 히어로는 풀 블리드, 카드는 인터랙션 용도에서만, 섹션당 목적 하나.
  2. Pre-build 3문서 작성
    코딩을 시작하기 전에 AI에게 세 가지를 먼저 쓰게 하세요: (1) 비주얼 테시스 — 분위기·재질·에너지를 한 문장으로, (2) 콘텐츠 플랜 — 히어로→서포트→디테일→CTA 순서, (3) 인터랙션 테시스 — 모션 아이디어 2~3개.
  3. 스택은 React + Tailwind
    OpenAI가 공식 권장하는 조합이에요. GPT-5.4가 이 스택에서 가장 강력한 결과를 낸다고 해요. shadcn/ui, Framer Motion도 궁합이 좋아요.
  4. 레퍼런스 이미지 첨부
    "예쁘게"라는 말보다 스크린샷 한 장이 10배 효과적이에요. 무드보드나 기존 디자인 캡처를 첨부하면, GPT-5.4가 레이아웃 리듬, 타이포 스케일, 스페이싱까지 추론해서 맞춰줘요.
  5. Playwright로 자동 검증 (선택, 강력 추천)
    Codex에서 `frontend-skill`을 설치하면 Playwright가 자동으로 붙어요. AI가 만든 페이지를 직접 열어보고 데스크톱/모바일 뷰포트에서 검증한 뒤 문제를 수정해요.

흔한 실수: 카피를 대충 넣지 마세요

OpenAI 가이드가 반복해서 강조하는 포인트예요. "Lorem ipsum" 같은 더미 텍스트 대신 실제 제품명, 실제 카피, 실제 맥락을 넣으세요. 카피의 품질이 디자인 결과를 직접 좌우해요. "카피의 30%를 삭제해도 페이지가 나아진다면, 계속 삭제하세요"가 공식 조언이에요.