CLASSIFICATION GROUPS FOR THE STAGE OF BREAST CANCER WITH STATISTICS METHOD

Authors

  • เกรียง กิจบำรุงรัตน์

Keywords:

Breast cancer, Ordinal Logistic Regression Model, Discriminant Analysis Model, Wald statistic, Wilks' Lambda

Abstract

This research is prediction of a model of possibility for detection of non- breast cancer and breast cancer and stages of breast cancers. Assessment of characteristics of abnormal growth of breast cancer cells such as Clump Thickness (X1), Uniformity of Cell Size (X2), Uniformity of Cell Shape (X3), Marginal Adhesion (X4), Single Epithelial Cell Size (X5), Bare Nuclei (X6), Bland Chromatin (X7), Normal Nucleoli (X8), and Mitoses (X9) are independent variable. The dependent variable is the probability that the patient is detected at any stage of breast cancer or non-breast cancer based on the tumor cells with abnormal growth of breast cancer by using Ordinal Logistic Regression Model and Discriminant Analysis Model. In conclusions Ordinal Logistic Regression Model can use few variables in prediction of stages of breast cancer and Ordinal Logistic Regression Model has 55.50% classification higher than Discriminant Analysis Model has 54.10% classification. Ordinal Logistic Regression Model showed classification accuracy as following: non-breast cancer 73.60%, breast cancer stage 1- 4 as 5%, 43.6%, 61.4% and 76.4% respectively.  Nine predicted variables were used in Discriminant Analysis Model and classification accuracy was recorded as non-breast cancer 56%, breast cancer stage 1- 4 as 49.1%, 35.6%, 72.6% and 60% respectively.

Author Biography

เกรียง กิจบำรุงรัตน์

คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฎธนบุรี

References

ชัญวลี ศรีสุโข (2554). โรคมะเร็งเต้านม: อมรินทร์พริ้นติ้งแอนด์พับลิชชิ่ง กรุงเทพฯ; 2554; หน้า 5-10.

สถาบันมะเร็งแห่งชาติ (2550). แนวทางการตรวจวินิจฉัยและรักษาโรคมะเร็งเต้านม.พิมพ์ครั้งที่ 1 พ.ศ. 2550. กรุงเทพฯ :
กรมการแพทย์ กระทรวงสาธารณสุข (2546). การประเมินเทคโนโลยีการตรวจวินิจฉัยมะเร็งเต้านมในระยะเริ่มแรกที่เหมาะสมสำหรับประเทศไทย: ตุลาคม 2546. หน้า28-30.

ชุดฐานข้อมูลจาก Wisconsin Breast Cancer Database (WBCD). http://www.archive.ics.uci.edu/ml/dataset.html.
วีรานันท์ พงศาภักดี (2541). การวิเคราะห์ข้อมูลเชิงกลุ่ม : ทฤษฎีและการประยุกต์ (GLIM และ SPSS/FW). พิมพ์ครั้งที่ 2. นครปฐม: ภาควิชาคณิตศาสตร์ คณะวิทยาศาสตร์ มหาวิทยาลัยศิลปากร วิทยาเขตพระราชวังสนามจันทร์, 2541.

กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์ข้อมูลหลายตัวแปร. พิมพ์ครั้งที่ 3. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

กัลยา วานิชย์บัญชา. (2551) การวิเคราะห์สถิติขั้นสูงด้วย SPSS for Windows. พิมพ์ครั้งที่ 6. กรุงเทพมหานคร: โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.

ศิริชัย กาญจนวาสี (2550) . การวิเคราะห์พหุระดับ (Multi-Level Analysis) . พิมพ์ครั้งที่ 4. กรุงเทพมหานคร:โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย

Agresti, A., (2002). Categorical Data Analysis. 2nd rev-ed., New York: John Wiley & Sons,2002.

Lachin JM. (2000). Biostatistical methods: the assessment of relative rate. New York: Wiley- Interscience,

Wallenstein S, Bodian C.. (1987). Inferences on odds ratios, relative risks, and risk differences based on standard regression programs. Am J Epidemiol 1987;126:346–55.

Wacholder S. (1986). Binomial regression in GLIM: estimating risk ratios and risk differences. Am J Epidemiol 1986;123:174–84.

Rahman, Mezbuhar, Cortes, Judy and Pardis, Cyrus (2001), A Note on Logistic Regression, Journal of Statistics & Management Systems, Vol. 4, No.2 p 175-187

Jiahe Qian, (2003), Application of Logistic Regression in Analysis of e-rater Data,Education Testing Service, ETS MS 02-T, Princeton, NJ 08541

Downloads

Published

2017-06-30

How to Cite

กิจบำรุงรัตน์ เ. (2017). CLASSIFICATION GROUPS FOR THE STAGE OF BREAST CANCER WITH STATISTICS METHOD. Journal of Applied Statistics and Information Technology, 2(1), 25–35. Retrieved from https://ph02.tci-thaijo.org/index.php/asit-journal/article/view/164898