[05/03/2020 11:05] Chào mọi người. Mình đang làm end-to-end OCR cho mấy văn . . .


#1

Nguồn post: https://www.facebook.com/257768141347267_949991645458243
Chào mọi người. Mình đang làm end-to-end OCR cho mấy văn bản tiếng Việt thì gặp trường hợp các con dấu đè lên chữ khiến việc phát hiện + đọc chữ khó khăn hơn giống như văn bản dưới đây. Hiện tại mình đang nghĩ đến 1 số method:

  1. loại bỏ dấu bằng cách lọc theo màu, tuy nhiên chắc chắn ko thể làm được khi chữ cần đọc cùng màu với con dấu.
  2. loại bỏ dấu bằng các model watermark remival giống như tnay https://github.com/marcbelmont/cnn-watermark-removal . Tuy vậy mình ko chắc con dấu có giống “watermark” hay ko để áp dụng cho hiêu quả
  3. Coi con dấu là 1 loại nhiễu, tạo dữ liệu với con dấu để train OCR detetion. Như thế thì phần tạo dữ liệu sẽ khá phức tạp

Ai có kinh nghiệm xử lý phần này rồi thì cho mình vài gợi ý với :smiley:


#2

Dùng GAN loại bỏ nhiễu :confused:


#3

Mình ngả theo phương án 3. Ngoài ra visual attention trong trường hợp này khá hữu ích


#4

Làm cách 3 đó bạn phức tạp tí nhưng hiệu quả


#5

Đỗ Mạnh vào hóng solution này :3


#6

Tớ muốn nghiên cứu về công nghệ OCR nên bắt đầu học cái gì vậy Bạn


#7

em cũng đang vươngs đoạn dấu này quá,có đôi khi nó còn có nửa con dấu ở ngang góc trang giấy nữa


#8

Ông làm ứng dụng mày hay đấy, đôi khi tôi cần cái này cho cv, khi nào ra app ới nhé


#9

thử bài này xem thử đi bác


#10

Ocr bn tự code hay dùng lib nào thế


#11

Bạn dùng end to end method nào vậy


#12

a hóng ké chuyên gia nè :crazy_face: