ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Multi-classification of business types on twitter based on topic model

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : Multi-classification of business types on twitter based on topic model
นักวิจัย : Chanattha Thongsuk , Choochart Haruechaiyasak , Somkid Saelee , ชนัฐฐา ทองสุข , ชูชาติ หฤไชยะศักดิ์ , สมคิด แซ่หลี
คำค้น : Blogs , Encyclopedias , Information filters , Internet , Latent Dirichlet Allocation (LDA) , Multi-classification , Social networking (online) , Twitter , ทวิตเตอร์ , บล็อก , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์ , สารานุกรม , อินเทอร์เน็ต , เครือข่ายสังคมออนไลน์
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2554
อ้างอิง : http://www.nstda.or.th/thairesearch/node/23869
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Today many businesses have adopted Twitter as a new marketing channel to promote their products and services. One of the potentially useful applications is to recommend users to follow businesses which match their interests. One possible solution is to apply classification algorithm to predict user's Twitter posts into some predefined business categories. Due to the short length characteristic, classifying Twitter posts is very difficult and challenging. In this paper, we propose a feature processing framework for constructing text categorization models. A topic model is constructed from a set of terms based on the Latent Dirichlet Allocation (LDA) algorithm. We apply the topic model for two different feature processing approaches: (1) feature transformation, i.e., using a set of topics as features and (2) feature expansion, i.e., appending a set of topics to a set of terms. Experimental results show that the highest accuracy of 95.7% is obtained with feature expansion technique, an improvement of 18.7% over the Bag of Words (BO W) model.

บรรณานุกรม :
Chanattha Thongsuk , Choochart Haruechaiyasak , Somkid Saelee , ชนัฐฐา ทองสุข , ชูชาติ หฤไชยะศักดิ์ , สมคิด แซ่หลี . (2554). Multi-classification of business types on twitter based on topic model.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Chanattha Thongsuk , Choochart Haruechaiyasak , Somkid Saelee , ชนัฐฐา ทองสุข , ชูชาติ หฤไชยะศักดิ์ , สมคิด แซ่หลี . 2554. "Multi-classification of business types on twitter based on topic model".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
Chanattha Thongsuk , Choochart Haruechaiyasak , Somkid Saelee , ชนัฐฐา ทองสุข , ชูชาติ หฤไชยะศักดิ์ , สมคิด แซ่หลี . "Multi-classification of business types on twitter based on topic model."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2554. Print.
Chanattha Thongsuk , Choochart Haruechaiyasak , Somkid Saelee , ชนัฐฐา ทองสุข , ชูชาติ หฤไชยะศักดิ์ , สมคิด แซ่หลี . Multi-classification of business types on twitter based on topic model. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2554.