ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม
นักวิจัย : วศิน สินธุภิญโญ , Chittaphone Chansylilath , Wasin Sinthupinyo
คำค้น : Computer-human interaction , Lao OCR , Lao Optical Character Recognition , การรู้จำตัวอักษรภาษาลาว , ลาวโอซีอาร์ , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2552
อ้างอิง : http://www.nstda.or.th/thairesearch/node/19375
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

ภายใต้ข้อตกลงความร่วมมือระหว่างศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (ศอ.) กับNational Authority for Science Technology of Lao (NAST) สาธารณรัฐประชาธิปไตยประชาชนลาว เกี่ยวกับความร่วมมือการวิจัยและพัฒนาเทคโนโลยีอิเล็กทรอนิกส์ คอมพิวเตอร์ โทรคมนาคมและสารสนเทศนั้น ได้มีความร่วมมือที่จะพัฒนาเทคโนโลยีการรู้จำตัวอักษรภาษาลาวขึ้น โดยขั้นตอนพัฒนาเทคโนโลยีการรู้จำตัวอักษรภาษาลาว ได้แก่ การเตรียมฐานข้อมูลภาพตัวอักษรภาษาลาวเพื่อใช้ในการฝึกฝนโปรแกรม โดยฐานข้อมูลมีทั้งอักษรภาษาลาว ภาษาอังกฤษ และสัญลักษณ์พิเศษ รวม 260ตัวอักษรจาก 10 ฟอนต์และมีมากกว่า 1,080 ภาพต่อตัวอักษร ส่วนการพัฒนาโปรแกรมรู้จำตัวอักษรภาษาลาว จะมีขั้นตอนการทำงานของโปรแกรมประกอบด้วยการแบ่งแยกภาพเอกสารทั้งหน้าออกเป็นภาพตัวอักษร (Segmentation) การกำจัดสิ่งรบกวน (Noise removal) การแบ่งแยกบรรทัด (Line separation) การสกัดลักษณะสำคัญ (Feature extraction) โดยใช้เทคนิคการย่อและขยายภาพตัวอักษรเข้าสู่แม่แบบมาตรฐาน (Template) การรู้จำ (Recognition) โดยใช้เทคนิคโครงข่ายประสาทเทียม (Artificial Neural Network) และการจัดวางเรียงเป็นข้อความ (Pasting) ซึ่งประสิทธิภาพการทำงานของโปรแกรมถูกประเมินโดย Information Technology Research Institute (ITRI) สาธารณรัฐประชาธิปไตยประชาชนลาว บนเอกสาร 4 ประเภทได้แก่ หนังสือ เอกสารราชการ นิตยสารและหนังสือพิมพ์ ผลปรากฎว่าอัตราการรู้จำเฉลี่ยที่ 83.38% และใช้เวลาทำงานประมาณ 58 วินาทีต่อหน้า

Lao Optical Character Recognition (Lao OCR) is a project under Memorandum of Understanding between National Electronics and Computer Technology Center (NECTEC) and National Authority for Science Technology of Lao (NAST), Lao People's Democratic Republic on Collaboration in Research and Development of Electronics, Computer, Telecommunications and Information Technologies. The Lao OCR technology development is consist of characters image corpus development and Lao OCR program development. The character image corpus is consist of 260 characters include English alphabets, Lao alphabets and symbols from 10 fonts and more than 1,080 images per each character. While program processes are image characters segmentation, noise removal, line separation feature extraction by normalize character bitmap to template, recognition by artificial neural network and text pasting. Finally the program is evaluated by Information Technology Research Institute (ITRI), Lao People's Democratic Republic on 4 document types : book, government letter, magazine and newspaper. The evaluation result are 83.83% on accuracy rate and around 58 second per page on processing time.

บรรณานุกรม :
วศิน สินธุภิญโญ , Chittaphone Chansylilath , Wasin Sinthupinyo . (2552). เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วศิน สินธุภิญโญ , Chittaphone Chansylilath , Wasin Sinthupinyo . 2552. "เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วศิน สินธุภิญโญ , Chittaphone Chansylilath , Wasin Sinthupinyo . "เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2552. Print.
วศิน สินธุภิญโญ , Chittaphone Chansylilath , Wasin Sinthupinyo . เทคนิคการรู้จำตัวอักษรภาษาลาวด้วยโครงข่ายประสาทเทียม. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2552.