Vào ra dữ liệu âm thanh


#1

cho hỏi mọi người ở đây có ai đã làm với dữ liệu là âm thanh chưa ạ? nếu có thì cho em hỏi cách thức đọc và chuyển 1 file âm thanh dạng .wav sang dạng là dạng phổ 2D ? để em training dữ liệu với mạng CNN được không ạ ?


#2

Mình cũng đang lam cái này, bạn có thể xem bài viết về bài thi xử lý voice của Zalo đấy và tiện đây cũng hóng thêm cao nhân chỉ dạy ạ :<


#3

Voice ko phỏ biến như ảnh vs nlp. Chắc nên tìm cty tt để trau đồi


#4

Read audio với gen spectrogram có thể dùng các thư viện có sẵn: scipy, librosa,… là dùng đc luôn mà