Giới thiệu Tiền xử lý dữ liệu tín hiệu nói chung và dữ liệu âm thanh nói riêng đóng vai trò cực kỳ quan trọng trong bất cứ một phương pháp học máy nào. Các mô hình học sâu cho tín hiệu âm thanh rất nhạy cảm với dữ liệu đầu vào, vì vậy bước làm sạch dữ liệu đầu vào sẽ quyết định hiệu suất mô hình tốt hay kém. Trong bài này mình sẽ giới thiệu một vài phương pháp tiền xử lý...
May Fest Signal Processing Audio ProcessingNếu như Spectral (spectrum, phổ tín hiệu) có được bằng cách thực hiện biến đổi Fourier rời rạc (DFT) thì đặc trưng Cepstral có được bằng cách biến đổi DFT (hoặc DCT) spectrum của tín hiệu đó. Các đặc trưng cepstral như Mel-frequency cepstral coefficients (MFCC) được sử dụng rộng rãi trong các bài toán xử lý tiếng nói vì tính trực quan của nó. Trong bài này mình sẽ giới thiệu hai đặc trưng...
May Fest Audio Processing MFCC GFCC CepstralPhổ Fourier (Fourier Spectrum) của một tín hiệu cho thấy nội dung tín hiệu đó trong miền tần số. Điều này làm cho phổ (Spectrum) trở thành một miền dễ chịu để làm việc bởi vì ta có thể kiểm tra các tín hiệu một cách trực quan. Trong thực tế, ta làm việc với các tín hiệu thời gian rời rạc, sao cho biến đổi miền thời gian-tần số tương ứng là biến đổi Fourier rời rạc. Phép biến đổi...
May Fest Signal Processing Audio Processing Spectral Audio Features