วิธีจำแนกกลุ่มระยะการเป็นโรคมะเร็งเต้านมด้วยกระบวนการทางสถิติ

ผู้แต่ง

  • เกรียง กิจบำรุงรัตน์

คำสำคัญ:

โรคมะเร็งเต้านม, ตัวแบบการถดถอยเชิงอันดับ, ตัวแบบการวิเคราะห์การจำแนกกประเภท, สถิติทดสอบวอลด์, สถิติทดสอบวิคส์ แลมด้า

บทคัดย่อ

การวิจัยครั้งนี้เป็นการหาตัวแบบการพยากรณ์การจัดกลุ่มความน่าจะเป็นผู้ป่วยที่ตรวจพบว่าเป็นโรคมะเร็งเต้านมหรือไม่และถ้าเป็นมะเร็งเป็นระยะใด โดยพิจารณาตามลักษณะเซลล์เนื้อร้ายที่เจริญเติบโตผิดปกติของโรคมะเร็งเต้านม ซึ่งมีตัวแปรอิสระคือเซลล์เนื้อร้ายที่เจริญเติบโตผิดปกติ ได้แก่ ความหนาของก้อนเนื้อ, ความสม่ำเสมอของขนาดเซลล์, ความสม่ำเสมอของรูปร่างเซลล์, การเกาะติดขอบของเซลล์, ขนาดเซลล์เดียว, นิวเคลียสไม่ถูกห้อหุ้ม, โครมาตินเฉพาะ, นิวคลีโอไลในภาวะปกติและการแบ่งตัวของเซลล์, ส่วนตัวแปรตามคือความน่าจะเป็นที่ผู้ป่วยโรคมะเร็งเต้านมตรวจพบว่าเป็นโรคมะเร็งเต้านมในระยะใดหรือไม่เป็นโรคมะเร็งเต้านมโดยใช้เทคนิคตัวแบบการถดถอยเชิงอันดับ (Ordinal Logistic Regression Model) และวิธีการวิเคราะห์การจำแนกประเภท (Discriminant Analysis Model)  สรุปผลได้ว่าตัวแบบ Ordinal Logistic Regression ใช้ตัวแปรน้อยเพียงบางตัวในการพยากรณ์ในแต่ละระยะของการเป็นมะเร็งและตัวแบบ Ordinal Logistic Regression มีอำนาจจำแนกได้ถูกต้องร้อยละ 55.50 สูงกว่าวิธี Discriminant Analysis มีอำนาจจำแนกได้ถูกต้องร้อยละ 54.10 ตัวแบบการถดถอยเชิงอันดับมีอำนาจจำแนกแบ่งได้เป็นผู้ป่วยที่ไม่เป็นมะเร็งเต้านมได้ถูกต้องร้อยละ 73.60   ผู้ป่วยที่เป็นมะเร็งเต้านมระยะที่ 1-4 ได้ถูกต้องร้อยละ 5, ร้อยละ 43.6, ร้อยละ 61.4 และร้อยละ 76.40 ตามลำดับ  ส่วนตัวแบบ Discriminant Analysis ใช้ตัวแปรพยากรณ์ทั้ง 9 ชนิดในการพยากรณ์ โดยที่ตัวแบบ Discriminant Analysis มีอำนาจจำแนกผู้ป่วยที่ไม่เป็นมะเร็งเต้านมได้ถูกต้องร้อยละ 56 ผู้ป่วยที่เป็นมะเร็งเต้านมระยะที่ 1-4 ได้ถูกต้องร้อยละ 49.10 ร้อยละ 35.6 ร้อยละ 72.6 และร้อยละ 60 ตามลำดับ

Author Biography

เกรียง กิจบำรุงรัตน์

คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฎธนบุรี

References

ชัญวลี ศรีสุโข (2554). โรคมะเร็งเต้านม: อมรินทร์พริ้นติ้งแอนด์พับลิชชิ่ง กรุงเทพฯ; 2554; หน้า 5-10.

สถาบันมะเร็งแห่งชาติ (2550). แนวทางการตรวจวินิจฉัยและรักษาโรคมะเร็งเต้านม.พิมพ์ครั้งที่ 1 พ.ศ. 2550. กรุงเทพฯ :
กรมการแพทย์ กระทรวงสาธารณสุข (2546). การประเมินเทคโนโลยีการตรวจวินิจฉัยมะเร็งเต้านมในระยะเริ่มแรกที่เหมาะสมสำหรับประเทศไทย: ตุลาคม 2546. หน้า28-30.

ชุดฐานข้อมูลจาก Wisconsin Breast Cancer Database (WBCD). http://www.archive.ics.uci.edu/ml/dataset.html.
วีรานันท์ พงศาภักดี (2541). การวิเคราะห์ข้อมูลเชิงกลุ่ม : ทฤษฎีและการประยุกต์ (GLIM และ SPSS/FW). พิมพ์ครั้งที่ 2. นครปฐม: ภาควิชาคณิตศาสตร์ คณะวิทยาศาสตร์ มหาวิทยาลัยศิลปากร วิทยาเขตพระราชวังสนามจันทร์, 2541.

กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์ข้อมูลหลายตัวแปร. พิมพ์ครั้งที่ 3. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์สถิติขั้นสูงด้วย SPSS for Windows. พิมพ์ครั้งที่ 6. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

ศิริชัย กาญจนวาสี (2550) . การวิเคราะห์พหุระดับ (Multi-Level Analysis) . พิมพ์ครั้งที่ 4. กรุงเทพมหานคร:โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย

Agresti, A., (2002). Categorical Data Analysis. 2nd rev-ed., New York: John Wiley & Sons,2002.

Lachin JM. (2000). Biostatistical methods: the assessment of relative rate. New York: Wiley- Interscience,

Wallenstein S, Bodian C.. (1987). Inferences on odds ratios, relative risks, and risk differences based on standard regression programs. Am J Epidemiol 1987;126:346–55.

Wacholder S. (1986). Binomial regression in GLIM: estimating risk ratios and risk differences. Am J Epidemiol 1986;123:174–84.

Rahman, Mezbuhar, Cortes, Judy and Pardis, Cyrus (2001), A Note on Logistic Regression, Journal of Statistics & Management Systems, Vol. 4, No.2 p 175-187

Jiahe Qian, (2003), Application of Logistic Regression in Analysis of e-rater Data,Education Testing Service, ETS MS 02-T, Princeton, NJ 08541

Downloads

เผยแพร่แล้ว

2017-06-30

How to Cite

กิจบำรุงรัตน์ เ. (2017). วิธีจำแนกกลุ่มระยะการเป็นโรคมะเร็งเต้านมด้วยกระบวนการทางสถิติ. วารสารสถิติประยุกต์และเทคโนโลยีสารสนเทศ, 2(1), 25–35. สืบค้น จาก https://ph02.tci-thaijo.org/index.php/asit-journal/article/view/164898