[Multiple-Object Tracking] Làm thế nào để bắt đầu ?

deep-learning
object-detection
machine-learning

#1

Chào mọi người. Mình cũng là 1 thành viên cũ trên group lâu lắm rồi mới có dịp đăng bài vì một số vấn đề mình cảm thấy bế tắc trong lúc làm việc mong mọi người chia sẻ cũng như giúp đỡ mình.

Như tiêu đề thì mọi người cũng thấy rằng mình đang bế tắc ở mảng đề tài Multiple-Object Tracking. Bế tắc thế nào ?

chắc một số bạn đọc tiêu đề có thể nghĩ mình chưa tìm hiểu hay đọc qua các phương pháp và các survey khác nhau (mình cũng từng bị hiểu nhầm tiêu đề như vậy nên không có gì cả cũng do mình không biết chọn 1 tiêu đề sao cho phù hợp)

Mình đã đọc các survey thống kê và các phương pháp được triển khai trong mảng đề tài trên suốt từ năm 2012 đền cuối năm 2019 và mình đọc xong và mình đã có rất nhiêu phương pháp với các độ chính xác của phương pháp (có thể mình chưa đọc hết còn bỏ sót mình đọc tầm 30 ~ 40 phương pháp khác nhau). Nhưng nó thực sự không tốt

mình cũng nhận thấy đây cũng là một lĩnh vực rất khó và có thể đang trong thời gian nghiên cứu độ chính xác cao nhất mình đọc là tầm 74.7 (MOTA trên bộ MOT challenge, nhưng lại khá thấp trên các bộ khác như standforld Drone, …) và IDS(số lượng người bị tráo đổi ID) cực kỳ cao và một số vấn đề về re-ID. và chắc chắn 1 điều là như thế mà không đủ để có thể mang chúng vào thực tế để áp dụng. Mình rất phân vân để bắt đầu làm 1 phương pháp nào đó (làm cho đã rồi xong không xài được do mình làm để ra sản phẩm triển khai. Mình cũng có làm thử 1 phương pháp DeepSORT"2017" nó cũng rất tốt nhưng không đủ để triển khai và hầu như là mình mất thời gian vô ích).

Trên là các vấn đề mà mình đang gặp phải. Mong mọi người có thể giúp đỡ mình để mình có thể tìm được hướng giải quyết cho vấn đề trên

Cảm ơn mọi người đã đọc Thái Học p/s: mình viết liệt kê hơi yếu nên mình trình bày nội dung câu chuyện mình gặp phải luôn cho mọi người dễ hình dung


#2

Chào bạn. Mình đoán là bài toán của bạn là tracking người? Mình từng làm 1 bài toán là đếm số người ở trong 1 phòng, phòng thì tất nhiên là có góc khuất, người đi ra đi vào vùng nhìn của camera. Mình có nhận thấy thế này:

  • Với các thuật toán tracking, ko cần biết là dựa trên thuật toán cổ điển hay deep learning đều tập trung tối ưu vào MOTA, MOTP,…Điều này có nghĩa là bản chất của các thuật toán hiện tại đều tập trung vào cải thiện bounding box, thời gian xử lý, khả năng khôi phục tracking khi mất 1 phần (occluded). Thế nên, nếu mà mục đích bài toán của bạn là tối ưu những yếu tố như trên thì bạn mới cần xem nhiều về tracking.
  • Mình đoán là bạn ko thực sự cần mấy cái tracking. Mình nghĩ là bạn muốn reidentify người khi họ đi khỏi khu vực nhìn của camera rồi quay trở lại. Với th này thì tracking, trong những cái mình biết, chẳng có cái nào giải quyết dc cả. Mình nghĩ là bạn có thể xem qua people reidentification. Còn tracking thì dùng cái nào dựa trên KCF cũng dc. Mình đoán như trên vì bạn nói:

DS(số lượng người bị tráo đổi ID) cực kỳ cao và một số vấn đề về re-ID