[Hỏi/Đáp] Áp dụng Yolov3 với bài toán nhận diện ký tự viết tay

classification
deep-learning
computer-vision

#1

Xin chào mọi người, Em đang ngâm cứu bài toán nhận diện chữ số viết tay. Em base trên 1 project ở github (https://github.com/penny4860/tf2-eager-yolo3) để train yolo3 với tập ký tự viết tay của e, tuy nhiên độ chính xác rất tệ (khoảng 10-20%),
E cũng search trên google thì thấy rất ít người dùng yolov3 để nhận diện ký tự viết tay. E đang thấy mất định hướng, ko hiểu do dataset của e chưa đủ nhiều hay như nào. (tâp dataset của e có 10 ảnh, mỗi ảnh có 10 số). Thêm nữa, em train với dataset trên thì cũng rất chậm, mất khoảng 7s cho 1 epoch ,mà phải chạy khoảng 200 epoch thì train_loss nó mới nhỏ hơn 5, nhưng như e nói ở trên, kết quả khá tệ

Em là newbie nên rất mong mọi người chỉ bảo định hướng như nào để giải quyết bài toán này a.


#2

Lý do việc em muốn dùng Yolo là gì? Yolo nó không thiết kế cho vấn đề nhận diện chữ viết tay. Localization text thì may ra.


#3

Dataset 10 ảnh thì ko đủ cho deep learning được đâu bạn ơi :frowning: Bạn train lâu hơn thì train loss vẫn sẽ giảm nhưng chỉ là overfit trên tập train thôi. Bạn chịu khó 1-2 tiếng label thêm data, rồi áp dụng data augmentation, rồi thử lại xem sao.