[NLP] - Thuật toán hoặc cách phân loại câu sau khi khảo sát?

classification
machine-learning

#1

Xin chào cả nhà,

Em cũng đang tập tành học về NLP - Text Classification (phân loại câu hỏi). Em có đang vọc về tự động phân loại câu và trả lời câu hỏi bình luận để hỗ trợ các trang bán thiết bị di động.

Hiện tại thì e đã crawl dữ liệu từ 5 trang bán di động, và đã phân loại câu hỏi từ dữ liệu thu được, xem người dùng hỏi về giá, hay về khuyến mãi, chỗ nào còn hàng,…

Tuy nhiên cách thức hiện tại của em đang khá thủ công và có phần cảm tính, em đọc một lượt các câu bình luận rồi tự chia ra thành các loại câu hỏi.

Không biết ở nhà mình, sau khi khảo sát, mọi người có dùng phương thức phân loại nhãn/câu nào mà có cơ sở, khoa học hơn, hoặc thuật toán nào đó chẳng hạn.

Em cũng xin gửi cả nhà các câu crawl và kết quả phân loại của em. Link GGDrive: https://drive.google.com/drive/u/0/folders/1ewNw--JdnGdc_cxeFTcqSeg2QSyEHWUd