Trích xuất vector đặc trưng của các objects trong ảnh

deep-learning
computer-vision
object-detection
yolo

#1

Xin chào anh/chị,

Hiện tại em đang tự học học về CV, cụ thể là bài toán object detection với YOLO algorithm đang làm 1 project nho nhỏ. Project em muốn làm là đưa vào 1 ảnh các con vật, em sẽ lấy bounding box của các con vật trong ảnh, rồi từ đó đưa ra vector đặc trưng của con vật đó. (Đặc trưng có thể là bò sát/thú có vú/lông vũ …)

Em định dùng YOLO để cắt các objects(classify luôn tên loài) ra đưa vào 1 model đã train sẵn để tiếp tục trích xuất. Em không biết liệu có thể đưa hết từ việc classification đến feature extraction cho YOLO giải quyết được luôn không?

Do em không tìm được tài liệu hướng dẫn về cách giải các bài toán cụ thể như thế này, cũng như newbie chưa từng trải nên em lập topic này để xin ý kiến mọi người ạ.


#2

Nếu bạn định theo hướng này thì tốt nhất dùng 1 2-stage model, nó cũng hoạt động tương tự. Feature chính là cái sau khi RoI Align, rồi sau đó bạn thích làm như nào thì làm. Trong source code các model đó đều hỗ trợ RoI Align theo ground-truth bounding box.