Chào mọi người, mình có làm NLP từ trước nhưng bây giờ mới thử nghiên cứu NLP mảng tiếng Việt. Các bạn cho mình hỏi là với công đoạn Tokenize thì mình nên sử dụng VnCoreNlp hay là underthesea, hoặc các bộ thư viện khác. Và thứ 2 là mình phải cài đặt như thế nào để sử dụng được tính năng POS tagging của VnCoreNlp trên Google Colab. Các bài tutorial hướng dẫn trên Python IDE thì không áp dụng được cho Colab.
Có một bạn up ảnh đoạn code lên nhưng chỉ áp dụng cho việc tokenize chứ không POS tagging được, và code trong ảnh có nhiều kí tự mình không biết làm sao để viết được như thế.
Mình xin cảm ơn nhiều