SVD-Singular Value Decomposition rút trích đặc trưng cho văn bản

classification
nlp

#1

Em chào mọi người, Em đang đọc tài liệu tìm hiểu về phương pháp giảm số chiều với SVD. Em đã hiểu công thức tính ma trận xấp xỉ Tuy nhiên em không hiểu áp dụng svd để giảm số chiều vì công thức trên chỉ là tính ma trận xấp xỉ ma trận đầu tức ma trận tính ra vẫn có cùng kích cỡ ma trận đầu Khi áp dụng svd để rút gọn chiều của ma trận đặc trưng trong văn bản thì xuất hiện công thức tính ma trận rút gọn ví dụ ma trận ban đầu kích cỡ 113 thì rút gọn lại còn 23. Điều em không hiểu là tại sao lại có công thức sau:

SVD7 SVD8

Dưới đây là tài liệu giải thích và áp dụng svd để rút gọn cho văn bản:

svd

SVD1 ! SVD4 SVD4|564x442 SVD5