ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์
นักวิจัย : พีรเชษฐ ปอแก้ว , เทพชัย ทรัพย์นิธิ , ชัย วุฒิวิวัฒน์ชัย , Peerachet Porkaew , Thepchai Supnithi , Chai Wutiwiwatchai
คำค้น : Artificial Intelligence and signal and image processing , Electroni translator , Information, computing and communication sciences , Machine learning , Speech-to-speech translation , Statistical Manchine Translation , การแปลภาษาเชิงสถิติ , ระบบแปลภาษาจากเสียงสู่เสียง , ล่ามอิเล็กทรอนิกส์ , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2551
อ้างอิง : http://www.nstda.or.th/thairesearch/node/24040
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

เทคนิคการแปลภาษาเชิงสถิติถูกนำาประยุกต์ใช้ในระบบล่ามอิเล็กทรอนิกส์ เพื่อแปลบทสนทนาพื้นฐาน เทคนิคดังกล่าวนี้ มีความเหมาะสมกับภาษาพูดเมื่อเทียบกับการแปลแบบที่อาศัยการวิเคราะห์โครงสร้างไวยากรณ์ เพราะภาษาพูดนั้นไม่มีแบบแผนทางไวยากรณ์ที่ชัดเจนเหมือนภาษาเขียน ซึ่งการแปลเชิงสถิตินี้อาศัยคลังข้อมูลของภาษาต้นทางและภาษาปลายทาง อีกทั้งคลังคู่ประโยค เพื่อนำมาสร้างเป็นแบบจำลองทางสถิติ ก่อนที่จะนำไปใช้ในกระบวนการแปลจริง ในการนี้ผู้พัฒนาได้ใช้คลังข้อความ และคลังคู่ประโยคภาษาไทยและภาษาอังกฤษจำนวน 200,000 ประโยค (ประมาณ 1.3 ล้านคำ) เพื่อสร้างแบบจำลองดังกล่าว จากนั้นทดสอบโดยใช้เทคนิค Cross Validation แล้ววัดผลการแปลเทียบกับผลเฉลยได้ค่า BLEU Score เป็น 0.13 สำหรับการแปลภาษาอังกฤษเป็นไทย และ 0.14 สำหรับการแปลภาษาไทยเป็นอังกฤษ นอกจากนี้ผู้พัฒนาได้ออกแบบและพัฒนาระบบให้บริการซึ่งเมื่อทดสอบแล้ว พบว่าระบบจะใช้เวลาประมาณ 1 วินาที เพื่อแปลประโยคความยาว 15 คำ และรองรับผู้ใช้ได้จำนวน 4,000 คำต่อวัน

Statistical approach for machine translation was applies to the "Electronic Translator" system. Comparing to rule-based approach, this approach is more practiacl for appech translation due to the ungrammatical in natural speech. The statistical approach requires monolingual and parallel corpus in order to generate statistical models. The translator will search for the best translation result according to the generated models. In this work, we use Thai and English monolingual corpus and English-Thai parallel corpus. The parallel corpus consists of 200,000 sentence pairs (around 1.3 million words). We test the system by using cross-validation method. The average BLUE scores are 0.13 for English-to-Thai translation and 0.14 Thai-to-English translation. In translation a 15-word sentence per second. Approximately 4,000 users per day can be supported.

บรรณานุกรม :
พีรเชษฐ ปอแก้ว , เทพชัย ทรัพย์นิธิ , ชัย วุฒิวิวัฒน์ชัย , Peerachet Porkaew , Thepchai Supnithi , Chai Wutiwiwatchai . (2551). การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
พีรเชษฐ ปอแก้ว , เทพชัย ทรัพย์นิธิ , ชัย วุฒิวิวัฒน์ชัย , Peerachet Porkaew , Thepchai Supnithi , Chai Wutiwiwatchai . 2551. "การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
พีรเชษฐ ปอแก้ว , เทพชัย ทรัพย์นิธิ , ชัย วุฒิวิวัฒน์ชัย , Peerachet Porkaew , Thepchai Supnithi , Chai Wutiwiwatchai . "การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2551. Print.
พีรเชษฐ ปอแก้ว , เทพชัย ทรัพย์นิธิ , ชัย วุฒิวิวัฒน์ชัย , Peerachet Porkaew , Thepchai Supnithi , Chai Wutiwiwatchai . การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2551.