ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition
นักวิจัย : Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong
คำค้น : Boosting technique , Ensemble learning , Machine learning , Text mining , Unknown word recognition , Word boundary detection
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2555
อ้างอิง : Computers & mathematics with applications. 63,6 (2012) pp. 1117-1134 , 0898-1221 , http://dspace.library.tu.ac.th/handle/3517/6518
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

A boosting-based ensemble learning can be used to improve classification accuracy by using multiple classification models constructed to cope with errors obtained from their preceding steps. This paper proposes a method to improve boosting-based ensemble learning with penalty profiles via an application of automatic unknown word recognition in Thai language. Treating a sequential problem as a non-sequential problem, the unknown word recognition is required to include a process to rank a set of generated candidates for a potential unknown word position. To strengthen the recognition process with ensemble classification, the penalty profiles are defined to make it more efficient to construct a succeeding classification model which tends to re-rank a set of ranked candidates into a suitable order. As an evaluation, a number of alternative penalty profiles are introduced and their performances are compared for the task of extracting unknown words from a large Thai medical text. Using the Nave Bayes as the base classifier for ensemble learning, the proposed method with the best setting achieves an accuracy of 90.19%, which is an accuracy gap of 12.88, 10.59, and 6.05 over conventional Nave Bayes, non-ensemble version, and the flat-penalty profile. © 2012 Published by Elsevier Ltd.

บรรณานุกรม :
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . (2555). Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . 2555. "Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . "Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2555. Print.
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2555.