Customer Lifetime Value Modeling

probability

#1

Chào cả nhà ạ,

Em có tìm hiểu về Customer Lifetime Value Model cho dạng kinh doanh non-contractual. Em đã lần lượt qua các model: Pareto/NBD (1987), BG/NBD (2005), và hiện tại là Abe-Pareto (2009). Lý do em chuyển từ model BG/NBD sang Abe-Pareto, là vì khi tính expected lifetime theo model này sẽ tiến ra \inf. Abe-Pareto khắc phục được điều này.

2 model đầu em sử dụng packages lifetimes của Python. Model cuối thì em dùng packages BTYDplus của R ạ.

Input vào model vẫn là: (x, t, T) (lần lượt: frequency, recency, age. Đơn vị: ngày). Output: P(alive), P(active), predicted_purchases, lifetime.

Em có một số thắc mắc như sau ạ:

  1. CLV: Hiện tại khi chạy xong model, em tính CLV theo công thức: CLV=predicted_purchases*monetary* (Với monetary=total_sales/active_days - Hiểu là số tiền trung bình tiêu trong 1 ngày của khách hàng). Tuy nhiên, so sánh với model BG/NBD, trước khi tính CLV, có bước fit monetary value vào Gamma Gamma Model for Monetary Value nữa. Em không hiểu ý nghĩa của việc này ạ. Và việc này có làm cải thiện độ chính xác của CLV không?

  2. Error: Em quan tâm đến sai số của lifetime, predicted purchases. Em tính theo MAEMAPE.

  • Lifetime: MAPE ~ 5%. Tuy nhiên, khi tính MAPE cho từng khách hàng, thì hơn một nửa > 50%. Như vậy có phải sai số đang lớn không ạ?
  • Predicted Purchases: Em không biết xử lý, vì có một số khách hàng actual=0. Kể cả khi loại bỏ actual=0, thì MAPE có thể ra \inf.

Vậy em có nên lo lắng khi MAPE lớn? Và nếu muốn có một sai số theo %, thì ngoài MAPE em nên chọn cách đánh giá nào ạ?

Em cảm ơn mọi người ạ! Em mới tham gia Data Science, mong được mọi người giúp đỡ ạ.

P.s: Ngoài ra, em thấy các model em đã tìm hiểu phụ thuộc hoàn toàn vào XÁC SUẤT mà không có các yếu tố về Trends, Seasonal… Mà các yếu tố như vậy (mưa bão, giảm giá…) lại ảnh hưởng rất nhiều đến transactions của khách hàng. Có hướng nghiên cứu nào như vậy không ạ? Em cảm ơn ạ.