Output của deep learning (CNN) có phải là 1 file chứa ma trận điểm để nhận dạng?

deep-learning

#1

Em đang tìm hiểu về ConvNet cho phân loại ảnh nhưng xem 1 số example vẫn chưa hiểu 1 số chỗ, nhờ các anh (chị) thông não giúp em: 1/Khi training xong có phải ta sẽ có 1file .File này sẽ là đầu vào + với ảnh muốn nhận dạng để ra kq ko? 2/CNN khác gì với các thứ như AlexNet, VGG16, MobileNet. Được biết nó là pre-trained. Mà pre-trained là models dc training sẵn, nhưng em đọc thấy nó như là các biến thể của CNN. Em đang thắc mắc chưa tìm được câu trả lời, mong anh (chị) nào biết giúp em với. Em cám ơn nhiều.


#2

Khi training xong sẽ là 1 file lữu trữ trọng số của mô hình. Từ trọng số của mô hình đề đưa ra dự đoán cho ảnh mới Ví dụ đơn giản: Tập input 2 và 3 … và output tương ứng là 10 và 11 … Thì ta cần xây dựng mô hình để nó làm sao dự đoán được : 2 * w = 10 ; 3 * w = 15.1 ; … thì w = 5 là trọng số của mô hình trên thì nó sẽ lưu trọng số của mô hình, tức là 5.

Chứ nó lưu đầu vào + kq làm gì. Nếu trong TH đầu vào hoàn toàn mới ko có trong tập dữ liệu train nó đoán kiểu gì


#3

Hình như bạn đang bị nhầm giữa lớp (layer) và cấu trúc của 1 model deep learning (deep learning network) AlexNet, VGG16, MobileNet là những cấu trúc mạng model của các ông lớn làm ra. Trong 1 cấu trúc mạng này có thể bao gồm nhiều lớp CNN.