ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition
นักวิจัย : Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong
คำค้น : Boosting Technique , Data mining , Ensemble learning , Unknown word recognition , Word boundary detection
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2553
อ้างอิง : Computational collective intelligence : technologies and applications. Part 2 : second international conference, ICCCI 2010, Kaohsiung, Taiwan, November 10-12, 2010 pp. 132-141 , 3642167314 , 9783642167317 , 0302-9743 , http://dspace.library.tu.ac.th/handle/3517/5010
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : Lecture notes in computer science ; 6422
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

A boosting-based ensemble learning can be used to improve classification accuracy by using multiple classification models constructing to cope with errors obtained from preceding steps. This paper presents an application of the boosting-based ensemble learning with penalty setting profiles on automatic unknown word recognition in Thai. Treating a sequential task as a non-sequential problem requires us to rank a set of generated candidates for a potential unknown word position. Since the correct candidate might not located at the highest rank among those candidates in the set, the proposed method provides penalties, in the form of a penalty setting profile, to improper ranking in order to reconstruct the succeeding classification model. In addition a number of alternative penalty setting profiles are introduced and their performances are compared on the task of extracting unknown words from a large Thai medical text. Using the naïve Bayes as the base classifier for ensemble learning, the proposed method achieves the accuracy of 89.24%, which is an improvement of 9.91%, 7.54%, 5.25% over conventional naïve Bayes, non-ensemble version, and flat penalty setting profile. © 2010 Springer-Verlag Berlin Heidelberg.

บรรณานุกรม :
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . (2553). Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . 2553. "Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . "Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2553. Print.
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . Boosting-based ensemble learning with penalty setting profiles for automatic thai unknown word recognition. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2553.