Phương pháp đánh giá

machine-learning

#1

Em có biết một số phương pháp để đánh giá chất lượng như hold-out, Stratified sampling, repeated hold-out, k-fold cross-validation, bootstrap sampling,… E có thắc mắc giữa 2 phương pháp Stratified sampling vs k-fold cross validation thì phương pháp nào tốt hơn trong các bài toán thực tế? Ưu điểm, nhược điểm của chúng như thế nào? Mong được mn giải đáp ạ.


#2

Stratified sampling và k-fold cv có thể dùng kết hợp với nhau. Stratified sampling là để tách data thành các tập mà trong đó giữ nguyên phân bố các class so với data ban đầu. k-fold cv thì sẽ lặp lại việc train trên k-1 fold và test trên fold còn lại