การคัดแยกประเภทของมะเร็งเม็ดเลือดขาว โดยใช้วิธีการจัดอันดับ ร่วมกับเทคนิคซัพพอร์ตเวกเตอร์แมชชีน

ผู้แต่ง

  • ภัทราวุฒิ แสงศิริ King Mongkut's University of Technology North Bangkok
  • ศจีมาจ ณ วิเชียร King Mongkut's University of Technology North Bangkok
  • พยุง มีสัจ King Mongkut's University of Technology North Bangkok

คำสำคัญ:

Classification, Rankng Support, Vector Machine

บทคัดย่อ

การค้นหากลุ่มย่อยของยีนที่มีอำนาจจำแนก เป็นปัญหาที่สำคัญสำหรับงานวิจัยทางด้านชีววิทยา เนื่องจากมีจำนวนยีนเพิ่มขึ้นเป็นจำนวนมาก ดังนั้นเทคนิคการลดมิติของข้อมูล จึงเป็นประโยชน์ในการช่วยค้นหากลุ่มย่อยของยีน สาเหตุเนื่องจากเมื่อข้อมูลมีจำนวนมิติหรือตัวแปรมาก ทำให้ข้อมูลเกิดการกระจาย (data sparse) และทำให้เกิดปัญหามิติข้อมูล (Curse of Dimensionality) งานวิจัยนี้จะนำเอาข้อมูลยีนของโรคมะเร็งเม็ดเลือดขาวแบบเฉียบพลัน (Acute Leukemia) ซึ่งมีจำนวนมิติของข้อมูล 7,129 มิติ แบ่งออกเป็น 2 กลุ่ม คือ ALL และ AML มาทำการทดลองและเพื่อเปรียบเทียบประสิทธิภาพของการลดมิติข้อมูล ระหว่างวิธี Correlation Based Feature Selection, Gain Ratio และ Information Gain โดยนำผลลัพธ์ที่ได้จากการลดมิติ มาเป็นข้อมูลอินพุตของ ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) เพื่อคัดแยกประเภทของโรคมะเร็ง ซึ่งผลการทดลองแสดงให้เห็นว่า การลดข้อมูลโดยวิธี Gain Ratio และ Information Gain มีความเหมาะสม คือ สามารถลดมิติของข้อมูลเหลือ 36 มิติ และเพิ่มความแม่นยำจากเดิม 73.53% เป็น 88.24%

ดาวน์โหลด

เผยแพร่แล้ว

2014-10-24

ฉบับ

ประเภทบทความ

วิทยาศาสตร์สุขภาพ