CNN Model cho nhận diện cầu thủ

yolo

#1

Chào mọi người,

Sau khi học khóa học CNN của giáo sư Andrew Ng, em đã thử tự làm 1 model nhận diện cầu thủ dùng thư viện tensorflow

Mô hình của em dựa trên paper yolo: https://arxiv.org/pdf/1506.02640.pdf, sử dụng hệ thống mạng figure 3, nhưng với 1 vài chỉnh sửa như sau:

  1. Thay vì train lần lượt sử dụng ảnh kích thước 224x224 rồi 448x448, em dùng ảnh 448x448 trong suốt quá trình train

  2. Ảnh em convert về trắng đen trước khi train

  3. Sử dụng hàm định nghĩa sẵn trong thư viện keras thay vì như trong paper: hàm kullback_leibler_divergence

  4. Một vài chỉnh sửa bounding box cho phù hợp với số lượng classes

Em đã thử train nhưng accuracy chỉ tầm 40 ~ 45%. Em thắc mắc không biết vì sao acc của model lại thấp đến vậy.

Link model: https://github.com/thongnguyen050999/Player-Detector


#2

Số lượng data của em là như thế nào? Có bao nhiêu class? Em thử dùng transfer learning chưa?


#3

Em muốn thử tự tạo 1 model từ scratch nên đã không dùng transfer learning ạ. Còn data hiện tại em mới làm khoảng chừng 100 ảnh thôi.


#4

Em có bao nhiêu class? mỗi class bao nhiêu ảnh?

Em vẽ thử train loss, test/val loss chưa? liệu em có bị over fitting không?

Github em để private hay gì đó nên không truy cập được


#5

Bạn để ảnh màu đi mình chưa train thử yolo vơi ảnh đen trắng nhưng mình nghĩ ảnh màu có nhiều thông tin hơn chứ nhỉ


#6

Mình không biết lí do tại sao bạn convert về ảnh trắng đen trước khi training ? Mình đã từng thử train custom object với Yolo , theo kinh nghiệm của mình thì bạn chuẩn bị data có thể dùng Yolo Mark, hoặc trích xuất data từ các tập public như COCO, OpenImage nếu có class mà bạn quan tâm, sau đó bạn chỉnh sửa file config theo github của Alexey như: class number, filter …

Mình đã thử và thành công,


#7

Em đã sửa lại link model rồi ạ.


#8

Cảm ơn bạn, mình sẽ thử ý tưởng này.