[1] 추천시스템 개요
2024. 9. 30. 00:11ㆍ데이터 분석/추천시스템(딥러닝 응용)
더보기
- 추천시스템
- 추천시스템의 3요소
- 추천시스템과 검색시스템
추천시스템이란?
- 우리가 다음에 무엇을 하면 좋을지 의사 결정을 지원하는 기술
- 장점
- 사용자: 특별히 키워드를 입력하지 않고도 마음에 드는 아이템을 만날 수 있음
- 기업: 사용자에게 아이템 구입에 도움을 줌, 더 많은 상품을 팔 수 있음, 긴 시간 동안 웹 서비스 안에 머무르도록 할 수 있음
- 여러 후보 가운데 가치 있는 것을 선정해서 의사 결정을 지원하는 시스템
- 선택한 아이템을 사용자가 실제로 열람 or 구입하도록 제시하는 것
- 추천시스템 고려사항: <추천시스템의 3요소>
- WHAT? (뭐를 추천할까?)
- 어떤 아이템을 추천할지? --> "추천 알고리즘"에 따라 달라짐
- WHEN? (언제 추천할까?)
- 상품을 구입한 시점에 다른 아이템을 추천할지?
- 상품을 살펴보는 중에 추천할지?
- HOW?
- 웹 사이트에서 추천 아이템을 표시할지?
- 메일로 보낼지?
- 스마트폰 푸시 알람을 보낼지?
- WHAT? (뭐를 추천할까?)
- 추천시스템의 시작 (1990~)
- 제록스 팔로알토 연구소의 연구자 골드버그가 대표적인 추천 알고리즘의 하나인 협조 필터링을 처음으로 조합한 추천 시스템 제안
- "태피스트리": 전자 메일 중에서 유익한 메일을 선택하는 시스템
- 한마디로 스팸메일 거르는
- 2006: 넷플릭스 개최 추천 알고리즘 경쟁 대회
- 넷플: 추천시스템 1인자
- 전 세계 186국가 4만팀 이상 참가
- 10억건의 영상평가 데이터 공개 --> 추천 시스템 연구 가속
- 2007: The ACM Conference on Recommender Systems (RecSys) 학회 개최
- 트위터, 넷플릭스, 아마존, 애플 등 추천 시스템 개발자 채용
추천 시스템의 3요소
입력 (데이터 입력)
- 사용자와 아이템의 콘텐츠 정보
- 나이, 성별, 주소 등 프로필 정보
- 회원 등록 시 선호하는 카테고리나 가격대를 설문으로 수집한 경우
- 우리의 직접적인 클릭
- 사용자와 아이템의 인터랙션 정보
- 카테고리, 상품 설명문, 발매일, 가격, 제작자 등
- 추천할 때 쓰일만한 정보 DB화
- 사용자 행동로그
- 사용자가 서비스 안에서 행동한 이력 데이터
- 열람, 구입, 북마크, 평가 등
콘텐츠 정보보다는 인터랙션 데이터가 실시간으로 업데이트 가능함
- 콘텐츠 기반 필터링 예시
- w = CF, 텍스트, 그림체, 이미지 등
- 대학일기와 비슷한 작품들
- 협업 필터링 예시
- 사용자 기반 협업 필터링
- 아이템 기반 협업 필터링
프로세스 (추천 설계)
- 개요 추천 설계 (개인화 없음)
- 신규 아이템순, 낮은 가격순, 높은 인기순 등 모든 사용자에게 동일한 내용 제시
- 업종에 따라 개인화를 적용한 것보다 클릭률/구매율이 높은 경우도 있음
- 정보의 신규성이 중요한 경우
- ex) 뉴스, 틱톡 등 나의 소모도 X
- 연관 아이템 설계
- "이 아이템을 확인한 사람은 이런 아이템도 확인했습니다"
- 해리포터 문제(Harry Potter Problem): 특정 시기에 많은 사람이 해리포터 서적을 다른 아이템과 함께 구입함에 따라 모든 아이템의 추천 아이템으로 항상 해리포터가 추천됨
- "관련 아이템" --> 각 아이템 사이의 유사도 사용
- "이 아이템을 확인한 사람은 이런 아이템도 확인했습니다"
- 개인화 설계
- 사용자의 프로필이나 행동 이력을 기반으로 각 사용자에 맞춰 추천
- ex) 내가 방문한 롯데백화점-본점과 비슷한 몰, 20대여자 가방과 함께 찾는 아이템
- 열람 이력을 그대로 표시하는 추천
- ex) YouTubeMusic의 RECAP 기능
- 사용자의 프로필이나 행동 이력을 기반으로 각 사용자에 맞춰 추천
출력 (추천 결과 제시)
- 첫 페이지에 표시
-
- WHEN?
- 상품을 구입한 시점에 다른 아이템을 추천할지?
- 상품을 살펴보는 중에 추천할지?
- HOW?
- 웹 사이트에서 추천 아이템을 표시할지?
- 메일로 보낼지?
- 스마트폰 푸시 알람을 보낼지?
- 사용자의 행동 패턴에 따라 제시 방법이 달라짐
- 핸드폰 쇼핑 ↑ --> 스마트폰 푸시 알람 Good!
- 쇼핑 중 비교 ↑ --> 매상품마다 비교 상품 제시 Good!
- ex) 프린터 구입(0909) --> 한달 뒤 [ 프린터 추천(x) / 잉크 카트리지 추천(o) ]
- WHEN?
-
- 상품 구입 후 메일로 전송
- 우편으로 쿠폰 발송
추천 시스템과 검색 시스템
- 검색 시스템
- 다양한 문장이 디지털화됨에 따라 키워드를 입력해서 원하는 문장을 찾아내는 기술
- 웹 사이트 검색에 사용되는 방법으로 구글 창업자가 발명함
- "페이지 랭크"
- 문장의 단어 정보뿐만 아니라 웹 사이트의 페이지 사이에 존재하는 링크 정보를 사용해 중요한 링크가 더 많이 모인 웹사이트일수록 중요도가 높다고 판단함
추천 시스템 | 검색 시스템 | |
공통점 | 많은 아이템에서 가치 | 있는 아이템을 선택함 |
사용자가 미리 마음에 드는 아이템을 파악하고 있는가? | 파악하고 있지 않은 경우가 많음 | 파악하고 있는 경우가 많음 |
키워드(쿼리) 입력 | 입력 없음 (PUSH 타입) | 입력 있음 (PULL 타입) |
연관 아이템 추천 방법 | 사용자 프로필이나 과거 행동으로 추측 | 입력된 검색 키워드로 사용자 의도 추측 |
사용자의 자세 | 수동적 | 능동적 |
개인화 | 개인화하는 경우가 많음 | 개인화하지 않는 경우가 많지만 최근에는 개인화 서비스가 증가하고 있음 |
- 아마존, 유튜브, 넷플릭스 같은 서비스들은 추천/검색 시스템을 모두 포함하고 있음
- ex) 사용자가 특정 키워드로 검색하고 아이템 상세 페이지를 열람하면 "이 아이템도 추천합니다"라고 표시되는 경우
'데이터 분석 > 추천시스템(딥러닝 응용)' 카테고리의 다른 글
[2] 추천 시스템 프로젝트 (6) | 2024.10.02 |
---|