Nhận dạng giọng nói

deep-learning

#1

Em chào các anh chị ạ! HIện tại em đang tìm hiểu về bài toán nhận dạng được ngôn ngữ và câu nói trong Video và chuyển nó thành text. Em có tham khảo trên google thì có nhiều tài liều khiến em mong lung và không hiểu rõ Anh chị nào đã làm về vấn đề này rồi có thể hướng dẫn em :

  • Hướng tiếp cận
  • Những kiến thức cần biết
  • Và những course để có thể làm vấn đề này Em xin cảm ơn

#2

Key word là speech recognition

Mình đang học course RNN của thầy Andrew Ng và nó hướng đến những sequence model như thế này, mình nghĩ bạn nên học course đó, có 1 video thầy lấy ví dụ cũng là từ 1 audio chuyển thành text

Sau đó, bạn có thể tự phát triển riêng và sâu hơn theo ý của bạn.


#3

Mình cảm ơn bạn…! vừa tìm thử có phần sequence model thấy mô tả giống thứ mình cần