Skip to content

Dashboard

Tổng quan về Recommender System [Recommender System cơ bản - Phần 1]

Created by Admin

GIỚI THIỆU

Recommender System là một trong những ứng dụng phổ biến nhất của khoa học dữ liệu ngày nay. Chúng được sử dụng để dự đoán "rating" hoặc "preference" mà người dùng sẽ dành cho một mặt hàng. Hầu hết mọi công ty công nghệ lớn đều đã áp dụng chúng dưới nhiều hình thức. Hầu hết mọi công ty công nghệ lớn đều đã áp dụng chúng dưới một số hình thức.

  • Amazon sử dụng nó để đề xuất sản phẩm cho khách hàng
  • Netflix sử dụng gợi ý phim cho người dùng
  • YouTube sử dụng nó để đề xuất các video và quyết định video sẽ phát tiếp theo trên chế độ tự động phát
  • Facebook sử dụng nó để gợi ý kết bạn, đề xuất các trang để thích và mọi người theo dõi. Qua bài viết lần này, chúng ta sẽ tìm hiểu tổng quan cách thức hoạt động và xây dựng một hệ thống Recommender System. Từ đó ứng dụng vào thực tế với bộ dữ liệu của Movilens, sử dụng Python kèm các thư viện NumPy, Pandas, Scikit-Learn để xây dựng hệ thống Recommender System cơ bản

TỔNG QUAN VỀ RECOMMENDER SYSTEM

Một hệ thống gợi ý phim thường được chia thành 3 quá trình chính:

  • Bước 1: Tìm các đặc trưng (features) có ảnh hưởng đến việc đánh giá của người dùng, thông qua việc phân tích và thăm dò dữ liệu
  • Bước 2: Phân tích và áp dụng giải thuật filtering phù hợp
  • Bước 3: Tiến hành training mô hình Nhìn chung, hệ thống Recommender System có thể được chia thành 4 loại chính:
  • Simple Recommenders: Đưa ra các đề xuất tổng quát cho mọi người dùng, dựa trên mức độ phổ biến và/hoặc thể loại phim. Ý tưởng cơ bản đằng sau hệ thống này là những bộ phim nổi tiếng hơn và được giới phê bình đánh giá cao hơn sẽ có xác suất được khán giả bình thường thích cao hơn. Một ví dụ có thể là IMDB Top 250.
  • Content-based Recommenders: Đề xuất các mặt hàng tương tự dựa trên một mặt hàng cụ thể. Hệ thống này sử dụng siêu dữ liệu mục, chẳng hạn như thể loại, đạo diễn, mô tả, diễn viên, v.v. cho phim, để đưa ra các đề xuất này. Ý tưởng chung đằng sau các hệ thống giới thiệu này là nếu một người thích một mặt hàng cụ thể, họ cũng sẽ thích một mặt hàng tương tự với nó. Và để khuyến nghị điều đó, nó sẽ sử dụng siêu dữ liệu mục trước đây của người dùng. Một ví dụ điển hình có thể là YouTube, nơi dựa trên lịch sử của bạn, nó gợi ý cho bạn những video mới mà bạn có thể xem.
  • Collaborative filtering Recommenders: Những hệ thống này được sử dụng rộng rãi và chúng cố gắng dự đoán “ratings” hoặc “preference” mà người dùng sẽ đưa ra một mặt hàng dựa trên xếp hạng trước đây và sở thích của những người dùng khác. Bộ lọc cộng tác không yêu cầu siêu dữ liệu mục giống như các bộ lọc dựa trên nội dung của nó.
  • Hybrid Recommenders: Hybrid Filtering là sự kết hợp của hai giải thuật Content-based Filtering và Collaborative Filtering: Hybrid Filtering được sử dụng mềm dẻo khi hệ thống Collaborative Filtering không có các hành vi (ratings), khi đó hệ thống sẽ sử dụng Content-based Filtering và ngược lại, khi Content-based Filtering không có các feature cần thiết trong việc đánh giá thì hệ thống sẽ sử dụng Collaborative Filtering để thay thế. Trong bài viết này, chúng ta sẽ tập trung giới thiệu và xây dựng 2 loại RS phổ biến là Content-based và Collaborative Filtering với Python và bộ dữ liệu Movilens

phần tiếp theo của series này, chúng ta tiếp tục tìm hiểu thuật toán và cách thức xây dựng hệ thống Contented-based Filtering Recommender System.

Source: https://viblo.asia/p/tong-quan-ve-recommender-system-recommender-system-co-ban-phan-1-aWj53j3el6m