[1] 추천시스템 개요

2024. 9. 30. 00:11데이터 분석/추천시스템(딥러닝 응용)

더보기
  1. 추천시스템
  2. 추천시스템의 3요소
  3. 추천시스템과 검색시스템

추천시스템이란?

  • 우리가 다음에 무엇을 하면 좋을지 의사 결정을 지원하는 기술
  • 장점
    • 사용자: 특별히 키워드를 입력하지 않고도 마음에 드는 아이템을 만날 수 있음
    • 기업: 사용자에게 아이템 구입에 도움을 줌, 더 많은 상품을 팔 수 있음, 긴 시간 동안 웹 서비스 안에 머무르도록 할 수 있음
  • 여러 후보 가운데 가치 있는 것을 선정해서 의사 결정을 지원하는 시스템
  • 선택한 아이템을 사용자가 실제로 열람 or 구입하도록 제시하는 것
  • 추천시스템 고려사항: <추천시스템의 3요소>
    • WHAT? (뭐를 추천할까?)
      • 어떤 아이템을 추천할지? --> "추천 알고리즘"에 따라 달라짐
    • WHEN? (언제 추천할까?)
      • 상품을 구입한 시점에 다른 아이템을 추천할지?
      • 상품을 살펴보는 중에 추천할지?
    • HOW?
      • 웹 사이트에서 추천 아이템을 표시할지?
      • 메일로 보낼지?
      • 스마트폰 푸시 알람을 보낼지?
  • 추천시스템의 시작 (1990~)
    • 제록스 팔로알토 연구소의 연구자 골드버그가 대표적인 추천 알고리즘의 하나인 협조 필터링을 처음으로 조합한 추천 시스템 제안
    • "태피스트리": 전자 메일 중에서 유익한 메일을 선택하는 시스템
      • 한마디로 스팸메일 거르는
    • 2006: 넷플릭스 개최 추천 알고리즘 경쟁 대회
      • 넷플: 추천시스템 1인자
      • 전 세계 186국가 4만팀 이상 참가
      • 10억건의 영상평가 데이터 공개 --> 추천 시스템 연구 가속
    • 2007: The ACM Conference on Recommender Systems (RecSys) 학회 개최
    • 트위터, 넷플릭스, 아마존, 애플 등 추천 시스템 개발자 채용

추천 시스템의 3요소

입력 (데이터 입력)
  • 사용자와 아이템의 콘텐츠 정보
    • 나이, 성별, 주소 등 프로필 정보
    • 회원 등록 시 선호하는 카테고리나 가격대를 설문으로 수집한 경우
    • 우리의 직접적인 클릭
  • 사용자와 아이템의 인터랙션 정보
    • 카테고리, 상품 설명문, 발매일, 가격, 제작자 등
    • 추천할 때 쓰일만한 정보 DB화
    • 사용자 행동로그
    • 사용자가 서비스 안에서 행동한 이력 데이터
    • 열람, 구입, 북마크, 평가 등
콘텐츠 정보보다는 인터랙션 데이터가 실시간으로 업데이트 가능함
  • 콘텐츠 기반 필터링 예시
    • w = CF, 텍스트, 그림체, 이미지 등
    • 대학일기와 비슷한 작품들
  • 협업 필터링 예시
    • 사용자 기반 협업 필터링
    • 아이템 기반 협업 필터링

프로세스 (추천 설계)
  • 개요 추천 설계 (개인화 없음)
    • 신규 아이템순, 낮은 가격순, 높은 인기순 등 모든 사용자에게 동일한 내용 제시
    • 업종에 따라 개인화를 적용한 것보다 클릭률/구매율이 높은 경우도 있음
    • 정보의 신규성이 중요한 경우
    • ex) 뉴스, 틱톡 등 나의 소모도 X
  • 연관 아이템 설계
    • "이 아이템을 확인한 사람은 이런 아이템도 확인했습니다"
      • 해리포터 문제(Harry Potter Problem): 특정 시기에 많은 사람이 해리포터 서적을 다른 아이템과 함께 구입함에 따라 모든 아이템의 추천 아이템으로 항상 해리포터가 추천됨
    • "관련 아이템" --> 각 아이템 사이의 유사도 사용
  • 개인화 설계
    • 사용자의 프로필이나 행동 이력을 기반으로 각 사용자에 맞춰 추천
      • ex) 내가 방문한 롯데백화점-본점과 비슷한 몰, 20대여자 가방과 함께 찾는 아이템
    • 열람 이력을 그대로 표시하는 추천
      • ex) YouTubeMusic의 RECAP 기능
출력 (추천 결과 제시)
  • 첫 페이지에 표시 
      • WHEN? 
        • 상품을 구입한 시점에 다른 아이템을 추천할지?
        • 상품을 살펴보는 중에 추천할지?
      • HOW?
        • 웹 사이트에서 추천 아이템을 표시할지?
        • 메일로 보낼지?
        • 스마트폰 푸시 알람을 보낼지?
      • 사용자의 행동 패턴에 따라 제시 방법이 달라짐
        • 핸드폰 쇼핑 ↑ --> 스마트폰 푸시 알람 Good!
        • 쇼핑 중 비교 ↑ --> 매상품마다 비교 상품 제시 Good!
      • ex) 프린터 구입(0909) --> 한달 뒤 [ 프린터 추천(x) / 잉크 카트리지 추천(o) ]
  • 상품 구입 후 메일로 전송
  • 우편으로 쿠폰 발송

추천 시스템과 검색 시스템

  • 검색 시스템
    • 다양한 문장이 디지털화됨에 따라 키워드를 입력해서 원하는 문장을 찾아내는 기술
    • 웹 사이트 검색에 사용되는 방법으로 구글 창업자가 발명함
    • "페이지 랭크"
      • 문장의 단어 정보뿐만 아니라 웹 사이트의 페이지 사이에 존재하는 링크 정보를 사용해 중요한 링크가 더 많이 모인 웹사이트일수록 중요도가 높다고 판단함
  추천 시스템 검색 시스템
공통점 많은 아이템에서 가치 있는 아이템을 선택함
사용자가 미리 마음에 드는 아이템을 파악하고 있는가? 파악하고 있지 않은 경우가 많음 파악하고 있는 경우가 많음
키워드(쿼리) 입력 입력 없음 (PUSH 타입) 입력 있음 (PULL 타입)
연관 아이템 추천 방법 사용자 프로필이나 과거 행동으로 추측 입력된 검색 키워드로 사용자 의도 추측
사용자의 자세 수동적 능동적
개인화 개인화하는 경우가 많음 개인화하지 않는 경우가 많지만 최근에는 개인화 서비스가 증가하고 있음
  • 아마존, 유튜브, 넷플릭스 같은 서비스들은 추천/검색 시스템을 모두 포함하고 있음
  • ex) 사용자가 특정 키워드로 검색하고 아이템 상세 페이지를 열람하면 "이 아이템도 추천합니다"라고 표시되는 경우