ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Measuring the validity of document relations discovered from frequent itemset mining

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Measuring the validity of document relations discovered from frequent itemset mining
นักวิจัย : Kritsada Sriphaew , Thanaruk Theeramunkong
คำค้น : document relations
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2550
อ้างอิง : Proceedings of the 2007 IEEE Symposium on Computational Intelligence and Data Mining (CIDM 2007) art. no. 4221311, pp. 293-299 , http://dspace.library.tu.ac.th/handle/3517/2833 , http://dspace.library.tu.ac.th/handle/3517/2833
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

The extension approach of frequent itemset mining can be applied to discover the relations among documents. Several schemes, i.e., n-gram, stemming, stopword removal and term weighting, can be applied to form different document representations for mining. It is necessary to formulate a benchmark for comparing the quality of discovered relations extracted from various document representations. This work proposes a series of evaluation criteria, called order accumulative citation matrix, which is formulated from the citation information in the publications. A new measure, called validity, is presented to reflect the validity (or quality) of discovered relations based on the proposed evaluation criteria. Regarding to the dataset, the expected validity is determined as a baseline for each set of discovered relations. With more than 10,000 documents, the experimental results show that the document document relations using bigram as term definition are more valid than those using unigram with a gap of 13% to 35%. Although the term frequency weighting can improve the validity of discovered document relations when applying unigram as term definition, the binary weighting performs better in the case of bigram. Comparing to the baseline, the results show that the discovered document relations are significantly more valid than the expectation with the factor of 10 to 1,000.

บรรณานุกรม :
Kritsada Sriphaew , Thanaruk Theeramunkong . (2550). Measuring the validity of document relations discovered from frequent itemset mining.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Kritsada Sriphaew , Thanaruk Theeramunkong . 2550. "Measuring the validity of document relations discovered from frequent itemset mining".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Kritsada Sriphaew , Thanaruk Theeramunkong . "Measuring the validity of document relations discovered from frequent itemset mining."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2550. Print.
Kritsada Sriphaew , Thanaruk Theeramunkong . Measuring the validity of document relations discovered from frequent itemset mining. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2550.