Minbook
EN

AI 검색 엔진 비교: ChatGPT Search, Perplexity, AI Overviews

· 11 min read

AI 검색은 하나가 아니다

2025년을 기점으로 AI 검색은 단일 패러다임이 아닌 복수의 경쟁 패러다임으로 분화되었다. ChatGPT Search, Perplexity, Google AI Overviews는 모두 “AI가 답을 생성한다”는 공통점을 갖지만, 그 내부 구조와 철학은 근본적으로 다르다.

ChatGPT Search는 대화형 인터페이스 안에서 검색 결과를 종합하는 대화 내 합성(Conversational Synthesis) 모델이다. Perplexity는 모든 주장에 출처 번호를 붙이는 인용 중심 검색(Citation-First Search) 모델이다. Google AI Overviews는 기존 검색 결과 페이지(SERP) 위에 요약을 얹는 SERP 확장(SERP Augmentation) 모델이다.

같은 질문을 세 엔진에 던지면 다른 소스가 인용되고, 다른 구조로 답변이 생성되며, 다른 브랜드가 노출된다. Chen et al. (2025)의 연구에 따르면 ChatGPT Search와 Perplexity 간 인용 도메인 중복율은 약 25%에 불과하다. 이는 하나의 엔진에서 관측한 브랜드 가시성이 다른 엔진에서의 상태를 전혀 대표하지 못한다는 의미다.

이 글에서는 세 엔진 각각의 작동 메커니즘을 해부하고, 데이터 소스 선택 기준, 출처 표기 방식, 브랜드 노출 패턴의 차이를 구조적으로 비교한다. 목표는 “어떤 엔진이 더 낫다”를 판단하는 것이 아니라, 엔진 간 차이가 왜 발생하고 어떤 실무적 함의를 갖는지를 명확히 하는 것이다.

AI 검색 시대에 “검색에 최적화한다”는 말은 더 이상 단수가 아니다. 어떤 엔진의, 어떤 메커니즘에, 어떤 방식으로 최적화하느냐를 특정해야 의미가 있다.


ChatGPT Search: 대화형 합성 모델

작동 메커니즘

ChatGPT Search는 OpenAI의 대화형 AI 인터페이스에 웹 검색 기능을 통합한 것이다. 사용자가 질문을 입력하면, 시스템은 먼저 해당 질문이 실시간 정보를 필요로 하는지 판단한다. 검색이 필요하다고 판단되면 Bing 검색 API와 자체 크롤러(OAI-SearchBot)를 통해 웹 결과를 수집하고, 수집된 결과를 LLM이 종합하여 하나의 서술형 답변을 생성한다.

flowchart LR
    A[사용자 쿼리] --> B{검색 필요 판단}
    B -->|Yes| C[Bing API + OAI-SearchBot]
    B -->|No| G[LLM 직접 응답]
    C --> D[검색 결과 수집<br/>평균 10+ 소스]
    D --> E[LLM 종합 합성<br/>Synthesis]
    E --> F[서술형 응답 + 하단 링크]

핵심 특징은 **합성(Synthesis)**이다. 개별 소스의 내용을 그대로 전달하는 것이 아니라, 여러 소스의 정보를 LLM이 하나의 coherent narrative로 재구성한다. 이 과정에서 원문의 표현은 대부분 사라지고, 모델 자체의 서술 스타일로 재작성된다.

데이터 소스와 수집 구조

ChatGPT Search의 데이터 소스는 크게 두 축으로 구성된다.

소스 유형설명비고
Bing 검색 인덱스Microsoft Bing의 웹 인덱스를 API로 호출. 기본 웹 검색 결과 제공OpenAI-Microsoft 파트너십 기반
OAI-SearchBot 크롤러OpenAI 자체 웹 크롤러가 직접 수집한 페이지robots.txt의 OAI-SearchBot 지시자 준수

Bing 인덱스에 대한 의존도가 높다는 점은 중요한 구조적 특성이다. Bing의 인덱싱 범위와 랭킹 알고리즘이 ChatGPT Search의 소스 풀(Source Pool)에 직접적으로 영향을 미친다. Bing에서 인덱싱되지 않거나 순위가 낮은 페이지는 ChatGPT Search에서도 인용될 가능성이 낮다.

응답 생성 구조

ChatGPT Search의 응답은 일반적으로 다음과 같은 구조를 갖는다.

  1. 도입 요약: 질문에 대한 핵심 답변을 1~2문장으로 제시
  2. 상세 서술: 여러 소스의 정보를 종합한 장문의 설명
  3. 하단 링크 목록: 참조한 소스의 URL을 응답 하단에 나열

평균적으로 하나의 응답에 약 10.42개의 링크가 포함된다. 그러나 이 링크들이 응답 본문의 어떤 문장에 대응하는지는 대부분 명시되지 않는다. 독자 입장에서 “이 주장의 근거가 어디서 왔는지”를 역추적하기 어렵다는 의미다.

Citation 처리 방식

ChatGPT Search의 인용 방식은 **묵시적 참조(Implicit Reference)**에 가깝다. 응답 전체에 걸쳐 복수의 소스 정보가 녹아들어 있지만, 각 문장과 특정 소스 간의 1:1 매핑은 제공하지 않는 경우가 많다. 이는 합성 모델의 구조적 특성에서 기인한다. 여러 소스를 하나의 서술로 재구성하는 과정에서 개별 소스의 경계가 흐려지기 때문이다.

일부 벤치마크에서 위키피디아 등 백과사전형 소스가 상위 인용의 약 48%를 차지한다는 분석이 있다. 이는 ChatGPT Search가 권위 있는 일반 지식 소스에 높은 가중치를 부여하는 경향이 있음을 시사한다.

브랜드 노출 패턴

ChatGPT Search에서 브랜드가 노출되는 경로는 주로 다음과 같다.

  • 직접 인용: 브랜드 공식 사이트가 하단 링크에 포함
  • 간접 언급: 제3자 리뷰, 비교 기사 등에서 브랜드가 언급된 내용이 합성 과정에서 포함
  • 모델 내 학습 데이터: LLM의 사전 학습(Pre-training) 데이터에 포함된 브랜드 정보가 응답에 반영

세 번째 경로가 ChatGPT Search의 고유한 특성이다. 다른 두 엔진과 달리 ChatGPT는 대규모 LLM의 파라메트릭 지식(Parametric Knowledge)이 응답에 개입하므로, 웹 검색 결과에 없는 브랜드 정보도 포함될 수 있다. 반대로 말하면, 학습 데이터에서 충분한 빈도로 등장하지 않은 소규모 브랜드는 구조적으로 불리하다.


Perplexity: 인용 중심 검색 모델

작동 메커니즘

Perplexity는 “답변의 모든 주장에 출처를 부여한다”는 원칙 위에 설계된 검색 엔진이다. 사용자 쿼리가 입력되면 실시간 웹 검색을 수행하고, 수집된 소스를 평가 및 랭킹한 뒤, 각 문장에 번호 기반 인라인 인용(Inline Citation)을 매핑하여 응답을 생성한다.

flowchart LR
    A[사용자 쿼리] --> B[실시간 웹 검색<br/>자체 인덱스 + 크롤링]
    B --> C[소스 수집 및<br/>신뢰도 랭킹]
    C --> D[LLM 응답 생성 +<br/>문장별 출처 매핑]
    D --> E["인라인 인용 응답<br/>[1] [2] [3]..."]
    E --> F[하단 참조 소스 목록]

Perplexity의 구조적 차별점은 **문장-소스 매핑(Sentence-Source Mapping)**이다. 응답 내 각 주장이 어떤 소스에서 왔는지를 [1], [2] 형태의 번호로 명시한다. 독자는 번호를 클릭하여 원문을 직접 확인할 수 있다.

소스 선택 기준과 도메인 패턴

Perplexity의 소스 선택은 다음 요소들을 복합적으로 고려하는 것으로 알려져 있다.

요소설명
관련성(Relevance)쿼리와 소스 콘텐츠 간의 의미적 유사도
신뢰도(Authority)도메인의 전반적 신뢰 수준, 전문성
최신성(Freshness)콘텐츠의 발행 및 업데이트 시점
다양성(Diversity)단일 도메인에 편중되지 않도록 소스 분산

주목할 점은 Perplexity가 커뮤니티 콘텐츠에 대한 친화도가 높다는 것이다. 일부 분석에서 Reddit 등 커뮤니티 소스가 전체 인용의 약 47%를 차지한다는 결과가 보고되었다. 이는 Perplexity가 “실사용자의 경험과 의견”을 높은 가치로 평가하는 설계 철학을 반영한다. 공식 마케팅 콘텐츠보다 실제 사용자의 후기, 토론, Q&A가 인용될 가능성이 높다.

자주 인용되는 도메인 유형을 정리하면 다음과 같다.

  • 커뮤니티/포럼: Reddit, Stack Overflow, Quora
  • 뉴스/미디어: 주요 언론사, 기술 미디어 (TechCrunch, The Verge 등)
  • 전문 블로그: 도메인 전문성이 높은 개인/기업 블로그
  • 공식 문서: 제품 문서, API 레퍼런스, 학술 논문
  • 백과사전: 위키피디아 (다만 ChatGPT Search 대비 비중은 낮음)

Pro Search vs 일반 검색

Perplexity는 두 가지 검색 모드를 제공한다.

항목일반 검색 (Quick Search)Pro Search
검색 깊이단일 라운드 웹 검색멀티 라운드, 후속 질문 자동 생성
소스 수5~10개10~30개 이상
응답 시간3~5초10~30초
추론 과정단순 검색 + 합성질문 분해 → 단계별 검색 → 종합
모델경량 모델고성능 모델 (GPT-4 급)
사용 제한무제한일 한도 또는 유료 구독

Pro Search는 복잡한 쿼리에서 특히 차이가 크다. 단순 사실 확인 쿼리(예: “파이썬 최신 버전”)에서는 일반 검색으로 충분하지만, 비교 분석이나 심층 리서치(예: “2025년 AI 검색 엔진 시장 점유율 비교”)에서는 Pro Search가 더 포괄적인 소스를 수집하고 더 구조화된 답변을 생성한다.

실시간 웹 검색의 강점

Perplexity의 가장 두드러진 기술적 강점은 실시간 웹 검색 역량이다. 모든 쿼리에 대해 기본적으로 실시간 웹 검색이 수행되며, 이는 정보의 최신성(Freshness) 측면에서 구조적 우위를 가져온다.

ChatGPT Search도 실시간 검색을 수행하지만, 대화 맥락에서 검색이 필요하다고 판단될 때만 트리거된다. Perplexity는 모든 쿼리에 대해 기본적으로 검색을 수행하므로, 최신 정보 반영에 있어 더 일관된 성능을 보인다.

2025년 기준 Perplexity는 월간 7.8억 쿼리(전년 대비 340% 성장)를 처리하고 있으며, 특히 리서치, 사실 확인, 기술 문서 검색 영역에서 사용자 충성도가 높다.


Google AI Overviews: SERP 확장 모델

작동 메커니즘

Google AI Overviews(AIO)는 기존 Google 검색 결과 페이지(SERP) 상단에 AI가 생성한 요약 패널을 삽입하는 기능이다. 독립적인 검색 엔진이 아니라 기존 Google 검색의 확장 레이어라는 점에서 앞의 두 엔진과 근본적으로 다르다.

flowchart TB
    subgraph SERP["Google 검색 결과 페이지"]
        direction TB
        A["🔍 검색창"]
        B["AI Overviews 패널<br/>(AI 생성 요약)"]
        C["관련 웹사이트 링크<br/>(AIO 하단)"]
        D["---"]
        E["기존 오가닉 결과<br/>(Blue Links)"]
        F["People Also Ask"]
        G["관련 검색어"]
    end
    A --> B
    B --> C
    C --> D
    D --> E
    E --> F
    F --> G

AI Overviews가 표시되면, 사용자의 시선은 기존의 오가닉 결과(Blue Links) 이전에 AI 요약 패널에 먼저 도달한다. 이는 기존 SERP의 클릭 분포를 구조적으로 변경하는 효과를 가져온다.

기존 Google 인덱스 활용

AI Overviews의 가장 중요한 구조적 특성은 Google의 기존 웹 인덱스를 그대로 활용한다는 점이다. 새로운 크롤러나 별도의 인덱싱 시스템을 운영하는 것이 아니라, 이미 Google 검색에 인덱싱된 페이지들을 소스로 사용한다.

이는 두 가지 함의를 갖는다.

  1. 기존 SEO 성과가 AIO 노출에 영향을 미친다. Google 검색에서 높은 순위를 차지하는 페이지가 AIO에서도 인용될 가능성이 높다. 기존 SEO 투자가 완전히 무효화되지는 않는다.
  2. Google의 인덱스 범위가 소스 풀의 한계다. Bing 인덱스를 사용하는 ChatGPT Search나 자체 크롤링을 하는 Perplexity와 달리, AIO의 소스 풀은 Google 인덱스와 동일하다.

YouTube 콘텐츠가 적극적으로 참조된다는 점도 주목할 만하다. 일부 벤치마크에서 AIO 인용의 약 23%가 YouTube에서 온다는 분석이 있다. Google 생태계 내 멀티모달 콘텐츠(동영상, 이미지)가 우선적으로 참조되는 구조다.

노출 조건: 어떤 쿼리에서 활성화되는가

AI Overviews는 모든 검색 쿼리에 표시되지 않는다. Google이 쿼리의 특성에 따라 AI 요약이 유용한지를 자동으로 판단한다.

쿼리 유형AIO 활성화 빈도설명
정보성 쿼리 (Informational)높음”~란 무엇인가”, “~하는 방법” 등 설명을 구하는 쿼리
비교 쿼리 (Comparative)높음”A vs B”, “~추천” 등 대안을 비교하는 쿼리
네비게이션 쿼리 (Navigational)낮음특정 사이트로 이동하려는 의도가 명확한 쿼리
트랜잭션 쿼리 (Transactional)낮음구매, 결제 등 즉각적 행동 의도가 있는 쿼리
YMYL 쿼리 (Your Money, Your Life)제한적건강, 재정 등 민감한 주제는 표시 자체를 제한하거나 면책 문구 추가

정보성 쿼리와 비교 쿼리에서 AIO가 가장 활발하게 활성화된다. 이는 브랜드 관점에서, 제품이나 서비스에 대한 “비교”, “리뷰”, “추천” 유형의 검색에서 AIO가 등장할 가능성이 높다는 것을 의미한다.

Opt-out 메커니즘

콘텐츠 제공자가 AI Overviews에 자신의 콘텐츠가 인용되는 것을 제어할 수 있는 메커니즘은 제한적이다.

  • nosnippet 메타 태그: Google이 해당 페이지에서 스니펫을 생성하는 것을 차단. AIO 인용도 차단 가능하나, 동시에 기존 검색 결과의 스니펫도 비활성화됨
  • max-snippet 메타 태그: 스니펫 길이를 제한하여 AIO에서의 인용 범위를 간접적으로 조절
  • robots.txt: Google의 일반 크롤링 자체를 차단하면 AIO 인용도 차단되지만, 동시에 Google 검색 전체에서 해당 페이지가 제외됨

현실적으로 AIO만 선택적으로 opt-out하면서 기존 Google 검색 노출은 유지하는 깔끔한 방법은 아직 존재하지 않는다. 이는 콘텐츠 제공자와 Google 간의 지속적인 긴장 요인이다.

브랜드 노출 패턴

AI Overviews에서의 브랜드 노출은 기존 Google SEO 성과와 높은 상관관계를 보인다. 기존 검색에서 1페이지에 노출되는 브랜드가 AIO에서도 인용될 가능성이 높다. 다만 AIO는 요약 형태이므로, 기존 검색에서 10개의 결과가 표시되던 것이 AIO에서는 3~5개의 소스로 압축되는 효과가 있다. 상위 소수 브랜드의 노출 집중도가 기존 검색보다 더 높아지는 구조다.


3개 엔진 종합 비교

핵심 특성 비교 테이블

비교 항목ChatGPT SearchPerplexityGoogle AI Overviews
운영 주체OpenAIPerplexity AIGoogle
서비스 형태대화형 AI 내 검색 기능독립형 AI 검색 엔진기존 SERP 확장 기능
기본 검색 엔진Bing 인덱스 + 자체 크롤러자체 인덱스 + 실시간 크롤링Google 검색 인덱스
응답 생성 방식합성 서술 (Synthesis)인라인 인용 매핑SERP 상단 요약 패널
Citation 방식하단 링크 목록 (묵시적)번호 기반 인라인 인용 (명시적)하단 관련 웹사이트 링크
문장-소스 추적성낮음높음중간
평균 인용 소스 수~10.42개 링크5~15개 (모드에 따라 차이)3~5개
주요 인용 도메인위키피디아 등 백과사전형 (~48%)Reddit 등 커뮤니티형 (~47%)YouTube 등 멀티모달 (~23%)
트리거 조건사용자 활성화 또는 LLM 판단모든 쿼리에 기본 적용Google이 쿼리별 자동 판단
파라메트릭 지식 개입높음 (GPT 모델 내 학습 데이터)낮음 (검색 결과 중심)중간
최신성 (Freshness)검색 트리거 시 실시간항상 실시간Google 인덱스 업데이트 주기에 의존
멀티모달 지원텍스트 중심, 이미지 부분 지원텍스트 중심, 이미지 포함텍스트 + YouTube + 이미지
사용자 규모 (2025)주간 8억 활성 사용자 (ChatGPT 전체)월간 7.8억 쿼리Google 검색 사용자 전체에 노출
엔진 간 도메인 중복ChatGPT-Perplexity ~25%Perplexity-ChatGPT ~25%AIO-AI Mode ~14%

엔진별 Sensitivity 차이

Chen et al. (2025)은 AI 검색 엔진이 세 가지 외부 변수에 대해 **엔진별로 유의미하게 다른 민감도(Sensitivity)**를 보인다고 보고했다.

flowchart TB
    subgraph Sensitivity["민감도 (Sensitivity) 변수"]
        direction TB
        F["Freshness<br/>시의성"]
        L["Language<br/>언어"]
        Q["Query Phrasing<br/>표현 방식"]
    end

    subgraph Engines["엔진별 반응"]
        direction TB
        C["ChatGPT Search"]
        P["Perplexity"]
        G["AI Overviews"]
    end

    F --> C
    F --> P
    F --> G
    L --> C
    L --> P
    L --> G
    Q --> C
    Q --> P
    Q --> G
민감도 변수설명실무 영향
Freshness (시의성)동일 쿼리에 대해 최신 정보 반영 속도와 범위가 엔진마다 다름시사성 높은 쿼리일수록 엔진 간 응답 차이 확대. 뉴스, 트렌드 쿼리에서 특히 두드러짐
Language (언어)동일 의도의 쿼리를 영어/비영어로 입력했을 때 인용 소스와 응답 내용이 달라짐교차 언어 안정성(Cross-language Stability)이 엔진마다 상이. 다국어 시장에서 언어별 모니터링 필수
Query Phrasing (표현 방식)동일 의도를 다른 표현으로 입력했을 때 응답 일관성에 차이 발생특정 엔진은 표현 변화에 더 민감. 모니터링 시 쿼리 변형(Paraphrasing) 포함 필요

이 세 가지 민감도의 엔진별 차이는 측정 방법론에 직접적인 영향을 미친다. 단일 쿼리, 단일 언어, 단일 시점의 측정으로는 브랜드 가시성의 실제 분포를 정확히 파악할 수 없다. 복수 엔진, 복수 언어, 복수 쿼리 변형, 복수 시점을 조합한 체계적 측정이 필요하다.

Earned Media 편향과 Big Brand Bias

Chen et al. (2025)의 연구에서 확인된 또 하나의 중요한 패턴은 Earned Media 편향이다. 세 엔진 모두 브랜드가 직접 운영하는 공식 사이트(Owned Media)보다 제3자가 작성한 리뷰, 비교 기사, 포럼 토론 등(Earned Media)을 유의미하게 더 높은 비율로 인용한다.

미디어 유형설명AI 검색에서의 인용 경향
Owned Media브랜드 공식 사이트, 블로그, 소셜 채널상대적으로 낮은 인용 빈도
Earned Media제3자 리뷰, 기사, 포럼, 커뮤니티 언급유의미하게 높은 인용 빈도
Paid Media광고, 스폰서 콘텐츠AI 검색에서 거의 인용되지 않음

이 패턴은 기존 Google 검색에서 Owned Media와 Earned Media를 비교적 균형 있게 노출하던 것과 대비된다. AI 검색 시대에 브랜드 가시성을 확보하려면 자사 사이트 최적화만으로는 부족하며, 제3자 매체에서의 언급과 평판 확보가 구조적으로 중요해진다.

Big Brand Bias도 확인되었다. 인지도가 높은 대형 브랜드가 AI 응답에서 불균형적으로 자주 언급되는 경향이 있다. 이는 LLM의 학습 데이터에서 대형 브랜드가 더 높은 빈도로 등장하는 것, 그리고 대형 브랜드에 대한 Earned Media가 양적으로 더 풍부한 것이 복합적으로 작용한 결과로 해석된다.

브랜드 유형AI 검색에서의 특성전략적 시사점
대형/인지도 높은 브랜드자연적으로 높은 노출 빈도, Big Brand Bias 수혜기존 가시성 유지 + 정확성 관리에 집중
중소/니치 브랜드구조적 불리함, 자연 노출 빈도 낮음Earned Media 전략 강화, 특화 키워드 집중, 커뮤니티 참여 확대
신규 브랜드학습 데이터 부족, Earned Media 축적 미흡장기적 Earned Media 구축 + 도메인 전문성(Topical Authority) 확보

실무 시사점

멀티엔진 모니터링의 필수성

엔진 간 인용 도메인 중복율이 25% 미만이라는 사실은, 단일 엔진 모니터링이 전체의 4분의 1도 커버하지 못할 수 있다는 것을 의미한다. 브랜드 가시성을 정확히 추적하려면 최소한 세 엔진을 병렬로 모니터링해야 한다.

또한 각 엔진이 다른 민감도 특성을 갖기 때문에, 모니터링 체계에 다음 요소가 포함되어야 한다.

  • 복수 쿼리 변형: 동일 의도를 3~5가지 다른 표현으로 입력
  • 복수 언어: 타겟 시장의 주요 언어별 별도 측정
  • 시계열 추적: 최신성 민감도를 반영하기 위해 정기적(최소 주 1회) 반복 측정

엔진별 최적화가 다른 이유

세 엔진의 최적화 방향이 다른 것은 각 엔진의 소스 선택 메커니즘이 근본적으로 다르기 때문이다.

엔진핵심 최적화 방향
ChatGPT SearchBing 인덱스 최적화 + 백과사전형 콘텐츠에서의 브랜드 언급 확보 + 파라메트릭 지식에 반영되는 장기적 브랜드 존재감 구축
Perplexity커뮤니티 콘텐츠에서의 자연스러운 언급 확보 + 도메인 전문성 높은 콘텐츠 제작 + 실시간 검색에 잘 잡히는 최신 콘텐츠 발행
AI Overviews기존 Google SEO 유지 + YouTube 등 멀티모달 콘텐츠 강화 + 정보성/비교 쿼리에서의 상위 포지션 확보

단일 전략으로 세 엔진 모두에서 최적의 결과를 얻는 것은 구조적으로 불가능하다. 각 엔진의 메커니즘을 이해하고, 엔진별로 분리된 전략을 수립 및 실행하는 것이 AI 검색 시대의 가시성 관리에서 필수적이다.

“AI 검색 최적화”는 하나의 작업이 아니다. 최소 세 개의 서로 다른 최적화 프로젝트이며, 각각의 성과는 별도로 측정되어야 한다.


참고 문헌

  • Chen, M., Wang, X., Chen, K., & Koudas, N. (2025). Generative Engine Optimization: How to Dominate AI Search. arXiv:2509.08919.

Share

Related Posts

Comments