Sử dụng thực thể định danh (named entity) để cải thiện chất lượng dịch máy


#1

Chào mọi người, hiện tại em đang làm một project về dịch máy, ý tưởng ban đầu là việc sử dụng named entity để improve dịch máy nơ-ron. Hiện tại thì em đang implement theo hướng được đề xuất trong paper Improving Neural Translation Models with Linguistic Factors Em đang định sử dụng named entity như một feature, để có thể implement như bài báo thì em cần phải tạo một embedding cho named entity tag (B-PERSON, I-LOC,etc…). Mọi người có thể gợi ý hoặc đưa ra hướng giải quyết cho việc tạo embedding cho các named entity tag giúp em ? Em xin cảm ơn