ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Advantages of prosody mapping in cross-language speech synthesis

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : Advantages of prosody mapping in cross-language speech synthesis
นักวิจัย : Anocha Rugchatjaroen , Nattanun Thatphithakkul , Ausdang Thangthai , Sittipong Saychum , Chai Wutiwiwatchai , อโณชา รักชาติเจริญ , ณัฐนันท์ ทัดพิทักษ์กุล , อัษฎางค์ แตงไทย , สิทธิพงษ์ สายชุม , ชัย วุฒิวิวัฒน์ชัย
คำค้น : Artificial Intelligence and signal and image processing , F0 modeling , Information, computing and communication sciences , Prosody mapping , Speech / pattern recognition , Speech synthesis , การสังเคราะห์เสียงพูด , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์ , แบบจำลองท่วงทำนองภาษาพูด
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2551
อ้างอิง : http://www.nstda.or.th/thairesearch/node/23956
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

This paper invetigates on a novel area of prosody modeling by mapping from a language with similar prosodic characteristics. This is a worth solution for cross-language speech synthesis where an only small set or worst none of speech resource exists in the target language. The approach preserves prosody co-articulation by mapping prosodic units among similar languages and conducting a corpus-based unit selection algorithm to borrow prosody sequences from the rich-resource language. A case study is to make use of Thai F0 contours in a syllable base to generate F0 curves for Mandarin Chinese Results based on a objective RMSE measure as well as a subjective MOS reveaks its capability over a simple template-based model.

บทความนี้นำเสนอวิธีการจำลองท่วงทำนองของเสียงพูดที่ยืมของภาษาข้างเคียงมาใช้โดยอาศัยคุณประโยชน์ของความคล้ายคลึงกันของบางคู่ภาษาที่มีลักษณะท่วงทำนองการเปล่งเสียงพูดในแต่ละพยางค์ที่คล้ายกัน วิธีนี้จะทำให้สามารถสร้างแบบจำลอวที่ไม่ต้องใช้ฐานข้อมูลเสียงพูดของภาษาเป้าหมายเลย แต่สามารถจำลองท่วงทำนองของภาษเป้าหมายได้จากความต่อเนื่องกันของภาษาคู่ที่มีฐานข้อมูลอยู่มาก โดยบทความนี้นำเสนอคู่ภาษาตัวอย่างไทย-จีน ซึ่งใช้กระบวน corpus-based unit selection มายืมทำนองของภาษาที่มีฐานข้อมูลอยู่มาก (ภาษาจีน) ไปใช้กับภาษาที่ไม่มีฐานข้อมูลเสียงอยู่เลย (ภาษาไทย) และใช้ความรู้ทางภาษาศาสตร์มาทดลองสร้างแบบจำลองพื้นฐานของภาษาเป้าหมาย โดยทำการยืมเฉพาะ F0 contour มาใช้งาน ผลการทดลองให้ผลในระดับพอใช้งานได้อย่างมีนัยสำคัญ

บรรณานุกรม :
Anocha Rugchatjaroen , Nattanun Thatphithakkul , Ausdang Thangthai , Sittipong Saychum , Chai Wutiwiwatchai , อโณชา รักชาติเจริญ , ณัฐนันท์ ทัดพิทักษ์กุล , อัษฎางค์ แตงไทย , สิทธิพงษ์ สายชุม , ชัย วุฒิวิวัฒน์ชัย . (2551). Advantages of prosody mapping in cross-language speech synthesis.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Anocha Rugchatjaroen , Nattanun Thatphithakkul , Ausdang Thangthai , Sittipong Saychum , Chai Wutiwiwatchai , อโณชา รักชาติเจริญ , ณัฐนันท์ ทัดพิทักษ์กุล , อัษฎางค์ แตงไทย , สิทธิพงษ์ สายชุม , ชัย วุฒิวิวัฒน์ชัย . 2551. "Advantages of prosody mapping in cross-language speech synthesis".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Anocha Rugchatjaroen , Nattanun Thatphithakkul , Ausdang Thangthai , Sittipong Saychum , Chai Wutiwiwatchai , อโณชา รักชาติเจริญ , ณัฐนันท์ ทัดพิทักษ์กุล , อัษฎางค์ แตงไทย , สิทธิพงษ์ สายชุม , ชัย วุฒิวิวัฒน์ชัย . "Advantages of prosody mapping in cross-language speech synthesis."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2551. Print.
Anocha Rugchatjaroen , Nattanun Thatphithakkul , Ausdang Thangthai , Sittipong Saychum , Chai Wutiwiwatchai , อโณชา รักชาติเจริญ , ณัฐนันท์ ทัดพิทักษ์กุล , อัษฎางค์ แตงไทย , สิทธิพงษ์ สายชุม , ชัย วุฒิวิวัฒน์ชัย . Advantages of prosody mapping in cross-language speech synthesis. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2551.