본문 바로가기
Java Study/Article Study 2024. 3. 19.

네이버 검색의 원리

Article Date 2012.01.09
URL blog.naver.com/hoebok/20147866069

네이버 검색 원리

  • 검색 쿼리의 움직임에 대하여

검색 모델링

  • 스마트 검색 서비스
    • 검색엔진에 의한 정보 나열 + 상황과 사용자에게 적합한 문서를 스마트하게 정렬
  • Multi-Ranking System
    • 통합검색에서 사용자의 니즈에 답을 한번에 보여주는 시스템
    • 네이버의 콜렉션 별 적용
      • 뉴스, 이미지, 지식iN, 사이트, 웹, 지역 정보 등 수십여 개에 달하는 콜렉션을 제공
      • 통합검색 기본단위, 클러스터링 작업을 활용
        • 클러스터링 : 웹의 DB를 특성에 따라 구분 작업
    • 콜렉션끼리도 모델을 조율, 적합한 결과 도출
    ex) 최신뉴스 콜렉션에는 최신성이 중요하게 반영된 ‘뉴스랭킹모델’ / 지식iN에는 최신성, 유사도 이외에도 답변을 한 이용자의 신뢰도까지 고려한 ‘지식iN랭킹모델’
  • Collection Ranking
    • 콜렉션 자체에도 랭킹이 적용
    • 콜렉션들의 노출순서가 고정X, 유동적으로 사용자의 검색행동에 따라 변화
  • 대용량 처리 기술
    • 대용량 검색 서비스를 위한 R&D 투자
    • 빠르고 안정적인 서비스 우선
✏️
총 1차 콜렉션 랭킹 → 2차 멀티-랭킹 시스템을 통해서 사용자에게 맞는 결과를 노출시키는 네이버의 검색 모델링
사용자가 언제 무엇을 검색할지에 대한 내용을 저장했다가 검색한 키워드나 빈도수를 측정해선 비슷한 유형의 정보(컬렉션 등)을 보여준다. 이런 “스마트” 검색 서비스에 더 나아가 네이버는 HyperCLOVA 생성형 AI와 함께 “AI” 검색 Cue: 를 런칭할 계획이다.
Cue:는 기본적으로 사용자의 질문에 대한 해답을 목표로 하며, 사용자 마다 검색 흐름을 학습해서 엔드포인트를 제공한다고 보여지는 것이다.
즉, 사용자가 어떤 물품을 구매하고 싶어서 계속해서 그 물품에 대한 정보를 물어본다면, Cue:는 사용자가 원하는 물품의 옵션을 가지고 Naver Shopping에서 해당 물품을 찾아 나열하고 쇼핑을 할 수 있게 하는 식이다.
굳이 네이버스토어 하나하나 다 들어가서 물품을 검색하고, 물품의 특성에 대한 정보를 검색하는 것을 한번에 해결하겠다는 것이다.
아티클에서 언급하는 네이버 검색 모델, 엔진을 넘어서 AI로 진입을 하는것을 보면 로직, 알고리즘에서 이제는 생성형, 학습형 AI를 서포트할 개발 R&D가 점점더 부상할 것이라고 생각한다.