ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

A comparative study on different techniques for Thai part-of-speech tagging

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : A comparative study on different techniques for Thai part-of-speech tagging
นักวิจัย : Jaruwat Pailai , Rachada Kongkachandra , Thepchai Supnithi , Prachya Boonkwan
คำค้น : Conditional Random Fields , CRFs , N-Gram , Natural Language Processing , NLP , Support Vector Machine , SVM , Thai Part of Speech Tagging
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2556
อ้างอิง : 10th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, ECTI-CON (2013) Art. no. 6559527 , : 978-147990545-4 , http://dspace.library.tu.ac.th/handle/3517/7053
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

The natural language processing (NLP) for Thai language is rather complicated using in the real tasks because it has a complex sequential structure of the sentence. The POS tagging can improve the accuracy of syntactic analysis so it can support the improvement of many NLP tasks. We present the supervised machine learning that is suitable for annotate the POS type for Thai language by comparison between the Support Vector Machine (SVM) and the Conditional Random Fields (CRFs). The BEST 2012 News and Entertainments corpus is utilized in our experiments. However, the sequential characteristic of Thai language is the interesting point and we use it as our feature in training set. Our sequential features contain forward 3-gram, backward 3-gram and 5-gram. The best accuracy of our experiments is 93.638% from SVMs POS tagging that learning by word of forward 3-gram when the size of training data is ten thousand tokens. Moreover, with the same training data, the best accuracy of CRFs is very close with SVM that is 93.254% when the learning form is the word with POS of 5-gram. © 2013 IEEE.

บรรณานุกรม :
Jaruwat Pailai , Rachada Kongkachandra , Thepchai Supnithi , Prachya Boonkwan . (2556). A comparative study on different techniques for Thai part-of-speech tagging.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jaruwat Pailai , Rachada Kongkachandra , Thepchai Supnithi , Prachya Boonkwan . 2556. "A comparative study on different techniques for Thai part-of-speech tagging".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jaruwat Pailai , Rachada Kongkachandra , Thepchai Supnithi , Prachya Boonkwan . "A comparative study on different techniques for Thai part-of-speech tagging."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2556. Print.
Jaruwat Pailai , Rachada Kongkachandra , Thepchai Supnithi , Prachya Boonkwan . A comparative study on different techniques for Thai part-of-speech tagging. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2556.