mahout 추천 예제

mahout 추천 예제

Mahout으로 기본 추천을 작성하는 것은 매우 간단합니다. Mahout은 매우 구성 가능하기 때문에 일반적으로 선택할 수 있는 구현이 다릅니다. 나는 단지 내가 “좋은 출발점”이라고 생각하는 것을 설명 할 것이다. 이 다이어그램은 사용자 기반 추천자의 다양한 Mahout 구성 요소 간의 관계를 보여 주며 있습니다. 항목 기반 추천 시스템은 관련된 환경 알고리즘이 없다는 점을 제외하면 유사합니다. 이 파이썬 스크립트는 Mahout 출력 파일 part-r-00000을 읽고 각 동영상 ID에 대한 표시기 배열을 만든 다음 JSON Elasticsearch 요청을 출력하여 표시기 목록으로 필름 문서를 업데이트합니다. 우리는 쉽게 지금 추천에 대한 추천을 요청할 수 있습니다. userID 2를 사용하여 사용자에게 권장되는 세 가지 항목을 얻으려면 다음과 같이 할 것입니다. Mahout의 권장 자는 DataModel이라는 인터페이스를 사용하여 상호 작용 데이터를 처리합니다. 다음과 같은 구성 된 상호 작용을 로드할 수 있습니다. 이것은 권장 엔진의 중요한 부분입니다.

이러한 구현은 Neighborhood 구현에 첨부됩니다. 항목유사성은 아라고러스이지만 항목 간의 유사성을 찾습니다. 이제 몇 가지 권장 사항을 얻을 준비가 되었습니다. 이는 간단합니다: Mahout 기반 의 협업 필터링 엔진은 항목에 대한 사용자의 선호도(“취향”)를 취하고 다른 항목에 대한 예상 기본 설정을 반환합니다. 예를 들어 책이나 CD를 판매하는 사이트는 고객이 듣고 싶어할 수 있는 이전 구매 데이터에서 Mahout을 사용하여 쉽게 알아낼 수 있습니다. Mahout의 항목 기반 추천자는 사용자 ID, itemID 및 기본 설정의 세 가지 주요 데이터 조각에 의존합니다. “사용자”는 웹 사이트 방문자이거나 단순히 비즈니스에서 제품을 구매하는 고객일 수 있습니다. 마찬가지로, 항목은 제품, 제품 그룹 또는 웹사이트의 페이지일 수 있습니다. 이 예제에서 고객 주문을 기본 설정에 대한 프록시로 사용해 보겠습니다.

이 예제에서는 제품별로 고객별 고유한 주문 수를 간단하게 계산할 수 있습니다. 항목 기반 추천을 조작하는 방법을 탐색할 때 기본 설정 값은 많은 것(페이지 클릭, 명시적 평점, 주문 수 등)이 될 수 있습니다. 테스트 데이터가 수집되면 열 헤더가 포함되지 않은 쉼표로 구분된 .txt 파일에 넣습니다. 예제에서는 Pearson상관 유사성을 사용하여 두 사용자 간의 유사성을 찾았습니다. 참조 추천 엔진의 구성 요소 및 논리에 대해 자세히 알아보려면 추천 엔진의 아키텍처, Mahout과의 공동 필터링 및 탄성 검색 엔진. Mahout의 추천자는 사용자와 항목 간의 상호 작용을 입력으로 기대합니다. Mahout에 이러한 데이터를 제공하는 가장 쉬운 방법은 모든 줄에 사용자 ID, itemID, 값이있는 텍스트 파일 의 형태입니다. 여기서 userID 및 itemID는 특정 사용자 및 특정 항목을 참조하고, 값은 상호 작용의 강도를 나타낸다(예를 들어.