[05/05/2020 08:00] Time-Series Prediction Xin chào mọi người, mình đang dùng tập dữ . . .


#1

Nguồn post: https://www.facebook.com/257768141347267_951354381988636
Time-Series Prediction

Xin chào mọi người, mình đang dùng tập dữ liệu bán hàng, ngôn ngữ python, data khoảng 2 năm rưỡi, nhiệm vụ dự đoán MỐC THỜI GIAN KẾ TIẾP:

  • Doanh số theo ngày, tháng, tuần trong năm (1->52)
  • Mặt hàng, số lượng theo ngày, tháng, tuần trong năm

Theo các bạn đã từng làm vấn đề này thì

  • Những mô hình nào nên dùng? Arima, Sarima và mô hình nào?
  • Tham số nào cần lưu ý
  • Làm sao để input data train là datetime ?

Rất mong được các bạn chia sẻ kinh nghiệm.

Chân thành cảm ơn.


#2

Ban co the su dung Arima, prophet, lstm, autoML azure… sau do, chon best model dua teen accuracy metrics nhu mape. Tham so can luu y: tuy model va tuy data. Vi du Arima thi can xac dinh p,d,q. Ve data time, ban co the chuyen thanh index cua dt.


#3

Co the tham khao book nay. Dang free ah. http://link.springer.com/openurl?genre=book


#4

bạn dùng thử lightgbm nhé


#5

Mình mới inbox bạn nhé


#6

dữ liệu bán hàng thì cứ test thử SARIMA có khi kết quả cũng tốt rồi, cứ test một cái đơn giản trước thôi, cần gì đao to búa lớn như LSTM.


#7

Trong môn forecast bạn có thể sử dụng các model khác nhau như họ Arima, Prophet, LSTM, hoặc là DNNs. quan trọng là bạn phải tìm ra được các quy luật về xu hướng, tính mùa vụ, tính bão hoà, ngày lễ, sự kiện, dò tìm các factor ảnh hưởng khác như chương trình khuyến mãi, đối thủ ra mắt sản phẩm, ảnh hưởng tương quan của kinh tế nền (auto nếu có thể).


#8

Mình chia sẻ vài ý nhỏ để bạn tham khảo thêm. Bạn có thể thử data của bạn với các model như Holt Winter exponential smoothing, autoregression model, ARIMA, SARIMA, SARIMAX, Prophet … Ngoài ra, bạn cũng có thể làm theo kiểu ensemble, bạn chọn ra vài models để huấn luyện, rồi lấy weighted average kết quả dự đoán của các model đó làm kết quả dự đoán cuối cùng của bạn. Chúc bạn ra kết quả tốt!


#9

Trước hết bạn đã chọn Metrics đánh giá mô hình chưa :D. Model chọn sau cũng được


#10

Dùng tất cả model có thể đi. Bạn có thể tham khảo các cách tiếp cận trên cuộc thi M5-Accuracy của Kaggle