RMLSE (Hỏi về Log)

machine-learning

#1

Chào mọi người

Minh cũng vừa mới tập tành học machine learning thì mình có làm 1 bài toán trên fast.ai Cụ thể là được làm trên dataset - bluebook-for-bulldozers Kaggle

Mình thắc mắc 1 điều là lúc mình sử dụng RMSE trên salePrice thì loss của mình cao ngất ngưởng kiểu cảm thấy nó không còn là loss nữa. Nhưng sao khi tìm hiểu và thấy có ghi RMLSE thì mình thực hiện log1p như hướng dẫn trên salePrice và nhận được loss function rất ổn

Nhưng mình không hiểu là tại sao phải Log trên price ? có thể không log có được không ? Nhiều suy nghĩ như vậy nên mình mạn phép lên đây để hỏi :smiley: Mong nhận được lời giải thích từ các câu hỏi trên Mình xin cảm ơn Cảm ơn vì đã đọc bài viết của mình


#2

Hàm mất mát (loss function) thực chất là định lượng giá trị sai khác giữa nhãn thật (true label) với giá trị dự đoán(outcome), loss function nằm trong khoảng từ 0 -> +inf. Dựa vào định nghĩa thì có thể thấy là loss function có thể hoàn toán không sử dụng hàm log.

Trên thực tế, ngta hay sử dụng log do các lí do:

  • Đây là một hàm liên tục, không âm và không tăng.
  • Một trong những tiêu chí để đánh giá hàm loss function đó có thực sự tốt là nó cần phải tối thiểu giá trị cho những dự đoán đúng và tối đa giá trị cho những dự đoán sai. Hàm log làm rất tốt điều này. Nếu nhìn vào đồ thị hàm log, ta có thể thấy giá trị của loss fucntion có log tăng rất nhanh khi các giá trị dự đoán sai càng nhiều: log

Best regard. Tham khảo:

https://www.quora.com/What-is-an-intuitive-explanation-for-the-log-loss-function


#3

Thực sự cảm ơn chủ post đã giải thích mình cũng đã hiểu dc cái mà bạn truyền tải