Content-Based Document Retrieval Using Graph-Based Approach
Main Article Content
Abstract
The purposes of the research were to design method for content-based document retrieval using graph-based approach and to test the effectiveness of the content-based document retrieval using graph-based approach. Experimental data was electronic books which database design subject.
The results revealed that the proposed method consists of four major steps; 1) text processing, 2) indexing, 3) similarity measure and 4) document ranking. The experiment showed that using Jaccard’s Coefficient with degree of document tree to measure similarity of documents can rank the query result more efficient than only using Jaccard’s Coefficient. Furthermore, this proposed method was good average precision (0.75), average recall (1.00) and average F-measure (0.846). This results of the study provided the proposed method could be used in content-based document retrieval effectively.
Downloads
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
วารสารวิชาการการจัดการเทคโนโลยีสารสนเทศและนวัตกรรม, 3(2), 81-87.
[2] มหาวิทยาลัยสุโขทัยธรรมาธิราช สาขาวิชาศิลปศาสตร์. (2554). เอกสารการสอนชุดวิชา 13723 หน่วยที่ 8-15 การจัดโครงสร้าง
สารสนเทศและการค้นคืน. นนทบุรี : สาขาศิลปศาสตร์ มหาวิทยาลัยสุโขทัยธรรมาธิราช.
[3] สมจิน เปียโคกสูง และนิศาชล จำนงศรี. (2553). ระบบนำทางความรู้เพื่อการเข้าถึงเนื้อหาในสื่อสิ่งพิมพ์. วารสารสารสนเทศศาสตร์,
28(3), 9-20.
[4] มหาวิทยาลัยสุโขทัยธรรมาธิราช สาขาวิชาศิลปศาสตร์. (2554). เอกสารการสอนชุดวิชา 13723 หน่วยที่ 1-7 การจัดโครงสร้าง
สารสนเทศและการค้นคืน. นนทบุรี : สาขาศิลปศาสตร์ มหาวิทยาลัยสุโขทัยธรรมาธิราช.
[5] อำพล ธรรมเจริญ. (2551). กราฟและการประยุกต์. กรุงเทพฯ: โรงพิมพ์พิทักษ์การพิมพ์.
[6] บุญเสริม กิจศิริกุล. (2546). ปัญญาประดิษฐ์. ภาควิชาวิศวกรรมคอมพิวเตอร์, คณะ วิศวกรรมศาสตร์ กรุงเทพฯ: จุฬาลงกรณ์
มหาวิทยาลัย.
[7] NECTEC PEDIA. (2014, January 5). N-Gram. Retrieved from: http://wiki.nectec.or.th/runewwiki/bin/
view/IT630_11_Assignment/N-Gram
[8] สมชาย ประสิทธิ์จูตระกูล. (2541). การออกแบบแฟ้มผกผันเพื่อการค้นคืนข้อความไทย. กรุงเทพฯ: สถาบันวิจัยและพัฒนา
คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย.
[9] Thammasut, D., & Sornil, O. (2006). A Graph-Based Information Retrieval System. Proceeding of International
Symposium on Communication and Information Technologies (pp. 743 – 748). Bangkok, Thailand: IEEE.