Áp dụng ML cho bài toán gợi ý tự động phân loại sản phẩm như thế nào?

classification
nlp
machine-learning

#1

Chào mọi người, mình chưa biết gì về ML nhiều và đang có bài toán cần phải giải quyết như sau:

Minh thu thập thông tin các sản phẩm từ các site: name, brand, size, hình ảnh. Các sản phẩm ở các site khác nhau, cùng một sản phẩm nhưng có: name, brand, size, hình ảnh không giống nhau (ví dụ name có tên gọi gần giống nhau, brand có thể có có thể không, size có thể có có thể không. Có 1 tool để gom nhóm các sản phẩm đó lại thành 1 nhóm (xác định các cái đó là cùng 1 sản phẩm) và dùng con người. VD:

  1. brand: dairyland name: plus trutaste lactose free milk 3.25% size 2 LT
  2. brand: dairyland name: lactose free 3.25% milk size 2L
  3. brand: dairyland **name:**homogenized milk lactose free 3.25% m.f. 2 l size 2l

Giờ mình muốn sử dụng ML, AI để đưa ra gợi ý các sản phẩm cùng nhóm đó và có thể tự động hóa được khi có các sản phẩm mới thu thập.

Mong các bạn chỉ dẫn giúp tiếp cận và xử lý bài toán thế nào


#2

input là có những gì bạn nhỉ?

hiện tại những thông tin nào con người phải nhập và những thông tin nào con người ko cần nhập


#3

Mình còn thiếu sản phẩm còn có: link link tới site gốc, image hình ảnh, price giá

Mình có:

  1. Tập dữ liệu đã được xác định cùng 1 sản phẩm
  2. Tập dữ liệu các sản phẩm không phải là 1

Input là: sản phẩm/ tập các sản phẩm cần xác định (phân loại)
Output là: danh sách gợi ý phân loại

Con người chỉ review lại thông tin: name, brand, size, image - link trên site để xác định 2 sản phẩm đó là cùng 1 sản phẩm. (như ví dụ trên: sản phẩm 2, 3 và 1 cùng là 1 sản phẩm 1)