ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Markov random field in speech enhancement: Application for tonal languages

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Markov random field in speech enhancement: Application for tonal languages
นักวิจัย : Tanawan Saimai , Charturong Tantibundhit , Chutamanee Onsuwan , Chai Wutiwiwatchai
คำค้น : Markov random field models , Noisy speech signals , Quality evaluation , Short time Fourier transforms , Spectral subtractions , Speech enhancement algorithm , Voice activity detectors , Harmonic analysis , Signal to noise ratio , Markov processes , Acoustic noise
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2556
อ้างอิง : Proceedings of meetings on acoustics. 19 (2013) Art. no. , 1939-800X , http://dspace.library.tu.ac.th/handle/3517/6707
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

This paper proposed speech enhancement algorithm based on Markov random field (MRF) model for Thai, a tonal language. Firstly, a noisy speech signal is transformed using the short time Fourier transform (STFT). In so doing, noise is removed and speech is preserved, especially harmonics information as f0 patterns are relevant perceptual cues for lexical tones. The voice activity detector is used to classify each STFT time frame into voiced and unvoiced. Harmonics information is retrieved from each voiced time frame, where four neighborhoods of the analyzed STFT coefficients include its adjacent time frames (left, right) and nearest harmonics (top, bottom). For the unvoiced, four adjacent coefficients (left, right, top, and bottom) are used. A two-state MRF model is used to classify STFT coefficients into speech and noise. Those with speech state are retained, while the rest is set to zero. The enhanced speech is estimated by the inverse STFT. Results from quality evaluation test on four sets of Thai rhyming words corrupted by white noise at SNR levels of 0, 5, and 10dB showed that the proposed algorithm significantly improved SNR of noisy speeches compared with spectral subtraction (1.3dB on average) and Wiener filtering (1.9dB on average). © 2013 Acoustical Society of America.

บรรณานุกรม :
Tanawan Saimai , Charturong Tantibundhit , Chutamanee Onsuwan , Chai Wutiwiwatchai . (2556). Markov random field in speech enhancement: Application for tonal languages.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Tanawan Saimai , Charturong Tantibundhit , Chutamanee Onsuwan , Chai Wutiwiwatchai . 2556. "Markov random field in speech enhancement: Application for tonal languages".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Tanawan Saimai , Charturong Tantibundhit , Chutamanee Onsuwan , Chai Wutiwiwatchai . "Markov random field in speech enhancement: Application for tonal languages."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2556. Print.
Tanawan Saimai , Charturong Tantibundhit , Chutamanee Onsuwan , Chai Wutiwiwatchai . Markov random field in speech enhancement: Application for tonal languages. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2556.