ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม

หน่วยงาน จุฬาลงกรณ์มหาวิทยาลัย

รายละเอียด

ชื่อเรื่อง : การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม
นักวิจัย : ณัฐณรงค์ พ่วงศรี
คำค้น : การรู้จำเสียงพูดอัตโนมัติ , การประชุมรัฐสภา , Automatic speech recognition , Legislative bodies -- Thailand
หน่วยงาน : จุฬาลงกรณ์มหาวิทยาลัย
ผู้ร่วมงาน : อติวงศ์ สุชาโต , โปรดปราน บุณยพุกกณะ , ชัย วุฒิวิวัฒน์ชัย , จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
ปีพิมพ์ : 2555
อ้างอิง : http://cuir.car.chula.ac.th/handle/123456789/37618
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2555

ข้อมูลเสียงพูด (Speech utterance) และคำบรรยายเสียง (Transcription) ที่มีความถูกต้องเป็นส่วนสำคัญที่ใช้ ในการพัฒนาระบบรู้จำเสียงพูดอัตโนมัติ (Automatic speech recognition) โดยเฉพาะอย่างยิ่งกับระบบที่นำไปใช้ในการถอดความการประชุมรัฐสภา สำหรับในประเทศไทยนั้น สำนักงานเลขาธิการสภาผู้แทนราษฏร ได้จัดทำรายงานการประชุมและจัดเก็บข้อมูลเสียงบันทึกระหว่างการประชุมไว้ตลอดช่วงสมัยประชุม ทำให้มีข้อมูลดังกล่าวเป็นจำนวนมากเพียงพอที่จะนำมาใช้ในการพัฒนาระบบรู้จำเสียงพูดอัตโนมัติอย่างไรก็ตามเนื่องจากข้อมูลทั้งสองส่วนยังมีความไม่สอดคล้องกันเกิดขึ้นในบางจุด ดังนั้น วิทยานิพนธ์นี้จึงนำเสนอวิธีในการระบุส่วนที่แตกต่างกันที่เกิดขึ้น กฎที่ได้จากการวิเคราะห์ หลักเกณฑ์การจัดทำรายงานการประชุมสภา และส่วนที่แตกต่างกันที่เกิดขึ้นจริงถูกนำมาใช้วิเคราะห์ประโยคจากรายงานการประชุม เพื่อสร้างประโยคสมมติฐานขึ้นมาเพิ่มเติม จากนั้น ประโยคจากรายงานการประชุมและประโยคสมมติฐานจะถูกนำไปผ่านกระบวนการปรับแนวเสียง (Force alignment) เพื่อประเมินความน่าจะเป็นของแต่ละประโยคซึ่งประโยคที่มีความน่าจะเป็นสูงที่สุด จะถูกเลือกเป็นคำบรรยายเสียงสำหรับข้อมูลเสียงพูดสำหรับใช้ใน กระบวนการระบุส่วนที่ไม่ตรงกัน จากการทดลองพบว่าระบบที่พัฒนาขึ้น มีค่าความแม่นยำในการระบุส่วนที่แตกต่างกัน 72.6% และคำบรรยายเสียงที่ได้จากประโยคที่มีความน่าจะเป็นสูงที่สุด มีความถูกต้องตรงกับข้อมูลเสียงพูดในระดับหน่วยเสียงย่อ 96.5% โดยเมื่อเปรียบเทียบกับคำบรรยายเสียงที่ได้จากรายงานการประชุมพบว่า สามารถลดความไม่ตรงกันได้ถึง 26.8%

บรรณานุกรม :
ณัฐณรงค์ พ่วงศรี . (2555). การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม.
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
ณัฐณรงค์ พ่วงศรี . 2555. "การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม".
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
ณัฐณรงค์ พ่วงศรี . "การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม."
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย, 2555. Print.
ณัฐณรงค์ พ่วงศรี . การระบุและแก้ไขส่วนที่แตกต่างของบทถอดความระหว่างเสียงบันทึกการประชุมรัฐสภาไทยและรายงานการประชุม. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย; 2555.