Hỏi nguyên nhân ảnh bị nhận dạng sai

classification

#1

Chào mọi người!

Em newbie Machine Learning và có làm 1 bài toàn về nhận dạng ký tự: số 0-9, các phép tính + - x, các biến x y z, và 2 dấu ( )

Kết quả dự đoán của em rất tệ (vd: ảnh đầu vào là 45-9+6 nhưng output là 45X8z6). Em đã train và test model ở link sau: https://colab.research.google.com/drive/1eTyQmMep8ID_mr6Jhf2Iu6phdkrv_WHu?usp=sharing

Hy vọng mọi người vào xem và chỉ ra lỗi sai giúp em (em đã có chú thích từng bước làm nên sẽ không mất nhiều thời gian của anh/chị đâu ạ!)

Về dataset ban đầu của em là ảnh 45*45, chữ đen nền trắng, em load nó vào ImageDataGenerator như trong link trên rồi train. Trong khi đó ký tự em đưa vào nhận dạng thì em có xử lý qua một số bước, đáng kể là threshold (đưa về chữ trắng nền đen, ngược với ảnh train) rồi dilate (làm cho nét vẽ to hơn), đặc biệt là khi em resize ký tự đó (để cho phù hợp với input của model) thì một số ký tự bị biến dạng (ví dụ dấu trừ, do không giữ được aspect ratio). Em không biết có phải điều này đã làm cho model nhận dạng sai hay không? Hay là do kiến trúc model của em chưa tốt? Mong anh chị chỉ dạy giúp em!

Em cảm ơn nhiều ạ!