Scene text recognition

deep-learning
computer-vision

#1

Chào mọi người. Như tiêu đề em có một số câu hỏi về chủ đề Scene text recognition

  1. Kết quả hiện tại mình làm: thì trên bộ tiếng việt (mìnhlàm trên line) nhưng kq ra không chính xác CER là 90% nhưng LER (line error rate) chỉ có tàm 12% mình đã sử dụng các mô hình như
  • CRNN
  • CRNN Attention based
  • AON (nhưng cái này không hợp ngữ cảnh và ra kết quả rất thấp) Đều không ra kết quả tốt hơn loss function vs validation loss cũng không khả quan sau một hồi mình training (không thể giảm validation loss được nữa kiểu bị bão hòa)

Bộ data mình sử dụng là về chữ viết tay

  1. Mình cũng làm trên các bộ chữ số dài như container id và cũng tự generate ra dữ liệu để có thể có thêm dữ liệu để thực hiện nhưng kết quả dự đoán ngoài thực tế quá tệ so với những gì thể hiện trong train (train-loss val-loss đạt 94% nhưng ra thực tế chỉ còn 70% ~ 72%)

mình muốn hỏi cách để giải quyết các vấn đề trên của mình. Mong mọi người ra tay tương trợ

Xin cảm ơn mọi người đã dành thời gian ra đọc