ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Lexical units for Thai LVCSR

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : Lexical units for Thai LVCSR
นักวิจัย : Markapong Jongtaveesataporn , Issara Thienlikit , Chai Wutiwiwatchai , Sadaoki Furui , ชัย วุฒิวิวัฒน์ชัย
คำค้น : Compound pseudo-morpheme , Lexical unit , Pseudo-morpheme , Thai language model , Thai LVCSR , Word Segmentation , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2552
อ้างอิง : http://www.nstda.or.th/thairesearch/node/17671
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Traditional language models rely on lexical units that are defined as entities separated from each other by word boundary markers. Since there are no such boundaries in Thai, alternative definitions of lexical units have to be pursued. The problem is to find the optimal set of lexical units that constitutes the vocabulary of the language model and yields the best final result. The word is a traditional lexical unit recognized by Thai people and is used by most of the natural language processing systems, including an automatic speech recognition system. This paper discusses problems with using words as a lexical unit and investigates other lexical units for the Thai large vocabulary continuous speech recognition (LVCSR) system. The pseudo-morpheme is introduced in the paper and shown to be unsuitable for use as a lexical unit directly. A technique using pseudo-morphemes to improve the system based on the traditional word model is introduced and some improvements can be gained by this technique. Then, a new lexical unit for Thai, the compound pseudo-morpheme, and an algorithm to build compound pseudo-morphemes are presented. The experimental results show that the system using compound pseudo-morphemes outperforms other systems. Thus, the compound pseudo-morpheme is the most suitable lexical unit for Thai LVCSR system.

บรรณานุกรม :
Markapong Jongtaveesataporn , Issara Thienlikit , Chai Wutiwiwatchai , Sadaoki Furui , ชัย วุฒิวิวัฒน์ชัย . (2552). Lexical units for Thai LVCSR.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Markapong Jongtaveesataporn , Issara Thienlikit , Chai Wutiwiwatchai , Sadaoki Furui , ชัย วุฒิวิวัฒน์ชัย . 2552. "Lexical units for Thai LVCSR".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Markapong Jongtaveesataporn , Issara Thienlikit , Chai Wutiwiwatchai , Sadaoki Furui , ชัย วุฒิวิวัฒน์ชัย . "Lexical units for Thai LVCSR."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2552. Print.
Markapong Jongtaveesataporn , Issara Thienlikit , Chai Wutiwiwatchai , Sadaoki Furui , ชัย วุฒิวิวัฒน์ชัย . Lexical units for Thai LVCSR. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2552.