วิธีจำแนกกลุ่มระยะการเป็นโรคมะเร็งเต้านมด้วยกระบวนการทางสถิติ
คำสำคัญ:
โรคมะเร็งเต้านม, ตัวแบบการถดถอยเชิงอันดับ, ตัวแบบการวิเคราะห์การจำแนกกประเภท, สถิติทดสอบวอลด์, สถิติทดสอบวิคส์ แลมด้าบทคัดย่อ
การวิจัยครั้งนี้เป็นการหาตัวแบบการพยากรณ์การจัดกลุ่มความน่าจะเป็นผู้ป่วยที่ตรวจพบว่าเป็นโรคมะเร็งเต้านมหรือไม่และถ้าเป็นมะเร็งเป็นระยะใด โดยพิจารณาตามลักษณะเซลล์เนื้อร้ายที่เจริญเติบโตผิดปกติของโรคมะเร็งเต้านม ซึ่งมีตัวแปรอิสระคือเซลล์เนื้อร้ายที่เจริญเติบโตผิดปกติ ได้แก่ ความหนาของก้อนเนื้อ, ความสม่ำเสมอของขนาดเซลล์, ความสม่ำเสมอของรูปร่างเซลล์, การเกาะติดขอบของเซลล์, ขนาดเซลล์เดียว, นิวเคลียสไม่ถูกห้อหุ้ม, โครมาตินเฉพาะ, นิวคลีโอไลในภาวะปกติและการแบ่งตัวของเซลล์, ส่วนตัวแปรตามคือความน่าจะเป็นที่ผู้ป่วยโรคมะเร็งเต้านมตรวจพบว่าเป็นโรคมะเร็งเต้านมในระยะใดหรือไม่เป็นโรคมะเร็งเต้านมโดยใช้เทคนิคตัวแบบการถดถอยเชิงอันดับ (Ordinal Logistic Regression Model) และวิธีการวิเคราะห์การจำแนกประเภท (Discriminant Analysis Model) สรุปผลได้ว่าตัวแบบ Ordinal Logistic Regression ใช้ตัวแปรน้อยเพียงบางตัวในการพยากรณ์ในแต่ละระยะของการเป็นมะเร็งและตัวแบบ Ordinal Logistic Regression มีอำนาจจำแนกได้ถูกต้องร้อยละ 55.50 สูงกว่าวิธี Discriminant Analysis มีอำนาจจำแนกได้ถูกต้องร้อยละ 54.10 ตัวแบบการถดถอยเชิงอันดับมีอำนาจจำแนกแบ่งได้เป็นผู้ป่วยที่ไม่เป็นมะเร็งเต้านมได้ถูกต้องร้อยละ 73.60 ผู้ป่วยที่เป็นมะเร็งเต้านมระยะที่ 1-4 ได้ถูกต้องร้อยละ 5, ร้อยละ 43.6, ร้อยละ 61.4 และร้อยละ 76.40 ตามลำดับ ส่วนตัวแบบ Discriminant Analysis ใช้ตัวแปรพยากรณ์ทั้ง 9 ชนิดในการพยากรณ์ โดยที่ตัวแบบ Discriminant Analysis มีอำนาจจำแนกผู้ป่วยที่ไม่เป็นมะเร็งเต้านมได้ถูกต้องร้อยละ 56 ผู้ป่วยที่เป็นมะเร็งเต้านมระยะที่ 1-4 ได้ถูกต้องร้อยละ 49.10 ร้อยละ 35.6 ร้อยละ 72.6 และร้อยละ 60 ตามลำดับ
References
สถาบันมะเร็งแห่งชาติ (2550). แนวทางการตรวจวินิจฉัยและรักษาโรคมะเร็งเต้านม.พิมพ์ครั้งที่ 1 พ.ศ. 2550. กรุงเทพฯ :
กรมการแพทย์ กระทรวงสาธารณสุข (2546). การประเมินเทคโนโลยีการตรวจวินิจฉัยมะเร็งเต้านมในระยะเริ่มแรกที่เหมาะสมสำหรับประเทศไทย: ตุลาคม 2546. หน้า28-30.
ชุดฐานข้อมูลจาก Wisconsin Breast Cancer Database (WBCD). http://www.archive.ics.uci.edu/ml/dataset.html.
วีรานันท์ พงศาภักดี (2541). การวิเคราะห์ข้อมูลเชิงกลุ่ม : ทฤษฎีและการประยุกต์ (GLIM และ SPSS/FW). พิมพ์ครั้งที่ 2. นครปฐม: ภาควิชาคณิตศาสตร์ คณะวิทยาศาสตร์ มหาวิทยาลัยศิลปากร วิทยาเขตพระราชวังสนามจันทร์, 2541.
กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์ข้อมูลหลายตัวแปร. พิมพ์ครั้งที่ 3. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์สถิติขั้นสูงด้วย SPSS for Windows. พิมพ์ครั้งที่ 6. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
ศิริชัย กาญจนวาสี (2550) . การวิเคราะห์พหุระดับ (Multi-Level Analysis) . พิมพ์ครั้งที่ 4. กรุงเทพมหานคร:โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย
Agresti, A., (2002). Categorical Data Analysis. 2nd rev-ed., New York: John Wiley & Sons,2002.
Lachin JM. (2000). Biostatistical methods: the assessment of relative rate. New York: Wiley- Interscience,
Wallenstein S, Bodian C.. (1987). Inferences on odds ratios, relative risks, and risk differences based on standard regression programs. Am J Epidemiol 1987;126:346–55.
Wacholder S. (1986). Binomial regression in GLIM: estimating risk ratios and risk differences. Am J Epidemiol 1986;123:174–84.
Rahman, Mezbuhar, Cortes, Judy and Pardis, Cyrus (2001), A Note on Logistic Regression, Journal of Statistics & Management Systems, Vol. 4, No.2 p 175-187
Jiahe Qian, (2003), Application of Logistic Regression in Analysis of e-rater Data,Education Testing Service, ETS MS 02-T, Princeton, NJ 08541
Downloads
เผยแพร่แล้ว
How to Cite
ฉบับ
บท
License
เนื้อหาและข้อมูลที่ปรากฏในบทความที่ตีพิมพ์ในวารสารสถิติประยุกต์และเทคโนโลยีสารสนเทศถือเป็นความคิดเห็นส่วนบุคคลของผู้เขียนแต่ละท่าน ความผิดพลาดของข้อความและผลที่อาจเกิดจากนำข้อความเหล่านั้นไปใช้ผู้เขียนบทความจะเป็นผู้รับผิดชอบแต่เพียงผู้เดียว
บทความ ข้อมูล เนื้อหา รูปภาพ ฯลฯ ที่ได้รับการตีพิมพ์ในวารสารถือเป็นลิขสิทธิ์ของวารสาร หากบุคคลหรือหน่วยงานใดต้องการนำทั้งหมดหรือส่วนหนึ่งส่วนใดไปเผยแพร่ต่อหรือเพื่อกระทำการใดๆ จะต้องได้รับอนุญาตเป็นลายลักอักษรณ์จากวารสาร ก่อนเท่านั้น