การจำแนกประเภทภูมิปัญญาท้องถิ่นของไทยแบบอัตโนมัติโดยวิธีการทางเหมืองข้อมูล
Main Article Content
บทคัดย่อ
ในบทความนี้นำเสนอวิธีการจำแนกประเภทภูมิปัญญาท้องถิ่นแบบอัตโนมัติด้วยวิธีการทางเหมืองข้อมูล เพื่อให้สามารถจำแนกประเภทภูมิปัญญาท้องถิ่นจากข้อมูลแบบพรรณนาโวหารด้วยการประมวลผลของคอมพิวเตอร์ได้ ช่วยลดเวลาในการจับใจความรวมถึงแก้ปัญหาการจำแนกประเภทโดยมนุษย์ได้ โดยประกอบไปด้วยขั้นตอนหลัก ดังนี้ 1) การสกัดคำจากข้อความบรรยายและกาจัดคำหยุด 2) การคัดเลือกคุณลักษณะคำสำคัญ 3) การสร้างแบบจำลองการจำแนกประเภท 4) การทดสอบความแม่นยำ จากผลการทดสอบด้วยวิธี K-Folds Cross Validation ด้วยตัวอย่างข้อมูลภูมิปัญญาท้องถิ่นของไทย จำนวน 500 ข้อมูล เพื่อเปรียบเทียบความแม่นยำของการจำแนกประเภทด้วยอัลกอริทึม Decision Tree, K-Nearest Neighbor, Distance-Weight K-Nearest Neighbor และ Naïve Bayes พบว่าอัลกอริทึม Naïve Bayes ให้ค่าความแม่นยำสูงที่สุด คือ 93.5% ดังนั้นจึงนำแบบจำลองดังกล่าวมาพัฒนาส่วนติดต่อผู้ใช้ผ่านทางหน้าเว็บด้วยภาษา PHP เชื่อมต่อกับตัวประมวลผลเหมืองข้อมูลผ่าน WEKAAPIเพื่ออำนวยความสะดวกในการเรียกใช้งานแบบจำลองการจำแนกประเภทข้อมูลใหม่ผ่านทางเว็บได้โดยง่าย