Xin hỏi cách sử dụng fasttext để đưa ra từ khóa trong văn bản

nlp

#1

Hiện tại e mới đang bắt đầu nghiên cứu về NLP. Và e đang có 1 bài tập là trích xuất được keyword từ 1 văn bản sử dụng fasttext nhưng e đang không biết nên bắt đầu từ đâu. mọi người ai biết có thể hướng dẫn e hoàn thành bài tập này được ko ạ? e cảm ơn nhiều


#2

Bạn có thể cho ví dụ không?


#3

ví dụ là như bác vào 1 trang báo đọc 1 bài viết thì cuối trang nó sẽ thường có các từ khóa của cái bài báo đó là gì đấy ạ. Thì đây của e tương tự vậy đầu vào là 1 bài viết, đầu ra sẽ là các từ khóa chính của bài đấy ạ


#5

có bác nào giúp e với ạ


#6

Ý tưởng chưa có sao lại nghĩ đến công cụ rồi nhỉ :slight_smile: Mình cũng chưa nghĩ ra ý tưởng dùng fasttext như nào để giải bài này.

  1. Bạn có thể lấy ra các cụm danh từ trong văn bản, đếm tần suất để lấy được keyword
  2. Sử dụng tf-idf để tìm ra các cụm từ quan trọng trong văn bản + kết hợp các kỹ thuật tiền xử lý theo dữ liệu