การพัฒนาโปรแกรมสำหรับการรวมและกำจัดความซ้ำซ้อนของเอเอสวี ในชุดข้อมูลไมโครไบโอมด้วยภาษาไพทอน

Main Article Content

เทวินทร์ ฟักเอม
ธนพร อึ้งเวชวานิช
มณฑล ฟักเอม
ปิยะพงษ์ โอฬารทิชาชาต
อานนท์ จันทร์เกษม

บทคัดย่อ

การรวมชุดข้อมูลแอมพลิคอนซีเควนส์แวเรียนต์ (เอเอสวี) จากหลายการทดลองเพื่อการวิเคราะห์ชุดข้อมูลไมโครไบโอม มักประสบปัญหาความซ้ำซ้อนของข้อมูล นำไปสู่การประมวลผลช้า การระบุอนุกรมวิธานไม่ถูกต้อง และเพิ่มภาระงานในการจัดการข้อมูลด้วยตนเอง งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาและประเมินประสิทธิภาพโปรแกรมภาษาไพทอนสำหรับการรวมและกำจัดความซ้ำซ้อนของเอเอสวี โปรแกรมพัฒนาภายใต้กรอบแนวคิดวงจรชีวิตการพัฒนาระบบ (เอสดีแอลซี) ใช้วิธีการจับคู่ตรงกันทุกตำแหน่ง (เอ็กแซกต์แมตช์) เพื่อรักษาความละเอียดลำดับเอเอสวี รองรับการทำงานที่ยืดหยุ่นผ่านส่วนติดต่อผู้ใช้แบบกราฟฟิก จูปิเตอร์ และคอมมานด์ไลน์


ผลการประเมินประสิทธิภาพเชิงเทคนิคด้วยชุดข้อมูล 2 ถึง 10 ชุด จำนวนเอเอสวี 33,445 ถึง 117,678 สาย พบว่า โปรแกรมมีความถูกต้องในการกำจัดความซ้ำซ้อน 100% และใช้เวลาประมวลผลเฉลี่ยเพียง 4.29 ถึง 35.58 วินาที ตามลำดับ ด้านผลการประเมินความพึงพอใจผู้ใช้งานอยู่ในระดับดี ค่าเฉลี่ย 4.29 โดยผู้ใช้พึงพอใจด้านความถูกต้องของผลลัพธ์สูงสุด โปรแกรมนี้ช่วยลดความซ้ำซ้อนของเอเอสวีและเพิ่มความถูกต้องในการเตรียมชุดข้อมูลไมโครไบโอมสำหรับการวิเคราะห์ปลายทางด้านชีวสารสนเทศ

Article Details

รูปแบบการอ้างอิง
ฟักเอม เ., อึ้งเวชวานิช ธ. ., ฟักเอม ม., โอฬารทิชาชาต ป., & จันทร์เกษม อ. (2025). การพัฒนาโปรแกรมสำหรับการรวมและกำจัดความซ้ำซ้อนของเอเอสวี ในชุดข้อมูลไมโครไบโอมด้วยภาษาไพทอน. วารสารวิชาการ "การประยุกต์ใช้เทคโนโลยีสารสนเทศ", 11(2), 18–32. สืบค้น จาก https://ph02.tci-thaijo.org/index.php/project-journal/article/view/260477
ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Lee, J.-Y. (2023). The principles and applications of high-throughput sequencing technologies. Development & Reproduction, 27(1), 9–24. https://doi.org/10.12717/DR.2023.27.1.9

Liu, Y.-X., Qin, Y., Chen, T., Lu, M., Qian, X., Guo, X., & Bai, Y. (2021). A practical guide to amplicon and metagenomic analysis of microbiome data. Protein & Cell, 12(5), 315–330. https://doi.org/10.1007/s13238-020-00724-8

Dacey, D. P., & Chain, F. J. J. (2021). Concatenation of paired-end reads improves taxonomic classification of amplicons for profiling microbial communities. BMC Bioinformatics, 22, Article 493. https://doi.org/10.1186/s12859-021-04410-2

Fasolo, A., Deb, S., Stevanato, P., Concheri, G., & Squartini, A. (2024). ASV vs OTUs clustering: Effects on alpha, beta, and gamma diversities in microbiome metabarcoding studies. PLOS ONE, 19(10). https://doi.org/10.1371/journal.pone.0309065

Chiarello, M., McCauley, M., Villéger, S., & Jackson, C. R. (2022). Ranking the biases: The choice of OTUs vs. ASVs in 16S rRNA amplicon data analysis has stronger effects on diversity measures than rarefaction and OTU identity threshold. PLOS ONE, 17(2), e0264443. https://doi.org/10.1371/journal.pone.0264443

Lin, Q., Dorsett, Y., Mirza, A., Tremlett, H., Piccio, L., Longbrake, E. E., Ni Choileain, S., Hafler, D. A., Cox, L. M., Weiner, H. L., Yamamura, T., Chen, K., Wu, Y., & Zhou, Y. (2024). Meta-analysis identifies common gut microbiota associated with multiple sclerosis. Genome Medicine, 16(1), Article 94. https://doi.org/10.1186/s13073-024-01364-x

Muller, E., Algavi, Y. M., & Borenstein, E. (2021). A meta-analysis study of the robustness and universality of gut microbiome–metabolome associations. Microbiome, 9(1), Article 203. https://doi.org/10.1186/s40168-021-01149-z

Estaki, M., Jiang, L., Bokulich, N. A., McDonald, D., González, A., Kosciolek, T., Martino, C., Zhu, Q., Birmingham, A., Vázquez-Baeza, Y., Dillon, M. R., Bolyen, E., Caporaso, J. G., & Knight, R. (2020). QIIME 2 enables comprehensive end-to-end analysis of diverse microbiome data and comparative studies with publicly available data. Current Protocols in Bioinformatics, 70(1), Article e100.https://doi.org/10.1002/cpbi.100

Xiao, L., Zhang, F., & Zhao, F. (2022). Large-scale microbiome data integration enables robust biomarker identification. Nature Computational Science, 2(5), 307–316. https://doi.org/10.1038/s43588-022-00247-8

อรยา ปรีชาพานิช. (2557). คู่มือเรียน การวิเคราะห์และออกแบบระบบ (System Analysis and Design) ฉบับสมบูรณ์. ไอดีซีฯ.

Python Software Foundation. (n.d.). What is Python? Executive summary. Retrieved from https://www.python.org/doc/

Amazon Web Services. (n.d.). What is Python? Retrieved from https://aws.amazon.com/th/what-is/python/

Köster, J., & Rahmann, S. (2021). Sustainable data analysis with Snakemake. F1000Research, 10, 33.https://doi.org/10.12688/f1000research.29032.2

The Python Packaging Authority. (n.d.). Python Packaging User Guide: Tool recommendations. Retrieved from https://packaging.python.org/en/latest/guides/tool-recommendations/

Python Package Index. (n.d.). pandas: Powerful Python data analysis toolkit. Retrieved from https://pypi.org/project/pandas

Pandas via NumFOCUS. (n.d.). Package overview: Pandas. Retrieved from https://pandas.pydata.org/docs/getting_started/overview.html

NumPy Developers. (n.d.). What is NumPy? Retrieved from https://numpy.org/devdocs/user/whatisnumpy.html

The Matplotlib Development Team. (n.d.). Pyplot tutorial. Retrieved from https://matplotlib.org/stable/tutorials/pyplot.html

International Collaboration of Volunteer Developers. (n.d.). Python tools for computational molecular biology (Biopython). Retrieved from https://biopython.org/

Python Software Foundation. (n.d.). tkinter: Python interface to Tcl/Tk. Retrieved from https://docs.python.org/3/library/tkinter.html

Lex, A. (n.d.). UpSet. Retrieved from https://upset.app/

Wang, C., Liu, C., Zhang, Y., & Wei, R. (2023). An independent evaluation in a CRC patient cohort of microbiome 16S rRNA sequence analysis methods: OTU clustering, DADA2, and Deblur. Frontiers in Microbiology, 14, 1178744. https://doi.org/10.3389/fmicb.2023.1178744

Özkurt, E., Fritscher, J., Soranzo, N., Ng, D. Y. K., Davey, R. P., Bahram, M., & Hildebrand, F. (2022). LotuS2: An ultrafast and highly accurate tool for amplicon sequencing analysis. Microbiome, 10, Article 176. https://doi.org/10.1186/s40168-022-01365-1

Lu, Y., Zhou, G., Ewald, J., Pang, Z., Shiri, T., & Xia, J. (2023). MicrobiomeAnalyst 2.0: Comprehensive statistical, functional and integrative analysis of microbiome data. Nucleic Acids Research, 51(W1), W310–W318. https://doi.org/10.1093/nar/gkad407

QIIME 2 Development Team. (2024). Artifact API (Using QIIME 2 with Python). Retrieved from https://docs.qiime2.org/2024.10/interfaces/artifact-api/

Chaiyapechara, S., Uengwetwanit, T., Arayamethakorn, S., Bunphimpapha, P., Phromson, M., Jangsutthivorawat, W., Tala, S., Karoonuthaisiri, N., & Rungrassamee, W. (2022). Understanding the host-microbe-environment interactions: Intestinal microbiota and transcriptomes of black tiger shrimp Penaeus monodon at different salinity levels. Aquaculture, 546, Article 737371. https://doi.org/10.1016/j.aquaculture.2021.737371

Angthong, P., Uengwetwanit, T., Uawisetwathana, U., Koehorst, J. J., Arayamethakorn, S., Schaap, P. J., Martins Dos Santos, V., Phromson, M., Karoonuthaisiri, N., Chaiyapechara, S., & Rungrassamee, W. (2023). Investigating host-gut microbial relationship in Penaeus monodon upon exposure to Vibrio harveyi. Aquaculture, 567, Article 739252. https://doi.org/10.1016/j.aquaculture.2023.739252

Uengwetwanit, T., Uawisetwathana, U., Arayamethakorn, S., Khudet, J., Chaiyapechara, S., Karoonuthaisiri, N., & Rungrassamee, W. (2020). Multi-omics analysis to examine microbiota, host gene expression and metabolites in the intestine of black tiger shrimp (Penaeus monodon) with different growth performance. PeerJ, 8, Article e9646. https://doi.org/10.7717/peerj.9646

Angthong, P., Uengwetwanit, T., Arayamethakorn, S., Chaitongsakul, P., Karoonuthaisiri, N., & Rungrassamee, W. (2020). Bacterial analysis in the early developmental stages of the black tiger shrimp (Penaeus monodon). Scientific Reports. https://doi.org/10.1038/s41598-020-61559-1

กาญจนา รูปต่ำ. (2565). การพัฒนาระบบทดสอบออนไลน์สำหรับวิทยาลัยเทคโนโลยีประจวบคีรีขันธ์ (วิทยานิพนธ์ปริญญามหาบัณฑิต). มหาวิทยาลัยธุรกิจบัณฑิตย์. https://libdoc.dpu.ac.th/thesis/Kanjana.Rupt.pdf