Application for VDO’s content search based on keywords
Keywords:
Information searching,, Text-based videos’ content searching, Application, Elastic searchAbstract
This study aimed to develop a text-based videos’ content searching application. The developed system converts videos into audio files using Google Cloud Text to Speech in order to generate .json file. Afterwards, the file is fetched to elastic search, which has the ability to search for texts. This will not only decrease the complexity of the data, but also the search length. When the user inserts the desired keywords, the application will retrieve the data from elastic search using Postman; consists of Mocking service and Ngrok for Hit matching and score calculation, and then show the results. In this study, Analyse Token was used as a tool to analyze, split texts, and evaluate the precision of the search. The test was performed on 14 dharma videos from internet using 10 random keywords. The study has shown that the VDO’s content search based on keywords with the application has the accuracy value is 80.71. Since the search used in this study is only for normal keywords, Natural Language Processing (NLP) could be used in order to enhance the performance of the application to support in the data analysis area.
References
อุไร ทองหัวไผ่. ภาพรวมของระบบค้นคืนสารสนเทศ. Information retrieval [อินเทอร์เน็ต]. 2562 [เข้าถึงเมื่อ 2 ก.ย. 2563]. เข้าถึงได้จาก: http://instructor.ru.ac.th/urai/cos4351/cos4351_1.pdf
วีระศักดิ์ เดชนพพรพันธุ์. สถิติข้อมูลการใช้โซเชียลมีเดียของไทย 2020. Think about wealth [อินเทอร์เน็ต]. 2563 [เข้าถึงเมื่อ 2 ก.ย. 2563]. เข้าถึงได้จาก: https://www.thinkaboutwealth.com/ socialmediastatthailand2020
Brett M, Upendra C, Bhuvana R. Fast audio search using vector space modelling. In: IEEE Workshop on Automatic Speech Recognition & Understanding (ASRU), December 9-13, 2007; Kyoto, Japan; 2007. p. 641-6.
Sakamoto N, Yamamoto K, Nakagawa S. Combination of syllable based N-gram search and word search for spoken term detection through spoken queries and IV/OOV classification. In: IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), December 13-17, 2015; Scottsdale, AZ; 2015. p. 200-6.
Elizalde B, Zarar S, Raj B. Cross modal audio search and retrieval with joint embeddings based on text and audio. In: IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 12-17, 2019; Brighton, United Kingdom; 2019. p. 4095-9.
Chen Z, Jang JR. On the use of anti-word models for audio music annotation and retrieval. IEEE T Audio Speech 2009;17(8):1547-56.
ปณวรรต คงธนกุลบวร, คณิศร จี้กระโทก. การแปลงภาษาไทยและภาษาอังกฤษเป็นรูปอักษรเบรลล์โดยใช้การรู้จำเสียงพูด. วารสารสมาคมเวชสารสนเทศไทย 2559;2(2):146-52.
ธานลิ ม่วงพล, อวยไชย อินทรสมบัติ. การใช้เสียงควบคมุอุปกรณ์ไฟฟ้าด้วยแอนดรอยด์และไมโครคอนโทรลเลอร์. วารสารมหาวิทยาลัยฟาร์อีสเทอร์น 2560;11(พิเศษ): 20-30.
Dharanipragada S, Roukos S. New word detection in audio-indexing. In: IEEE Workshop on Automatic Speech Recognition and Understanding Proceedings. December 12-17, 1997; Santa Barbara, CA, USA; 1997. p. 551-7
จักรกฤษณ์ เสน่ห์ นมะหุต. ระบบสารสนเทศสำหรับการสืบค้นข้อมูลท่องเที่ยวด้วยเสียง. วารสารบริหารธุรกิจเทคโนโลยีมหานคร 2557;11(2):1-17.
ฉัตรชัย อนิทรประพันธ์, ไกรศักดิ์ เกษร. เทคนิคการค้นคืนสารสนเทศข้ามภาษา (ไทย - อังกฤษ) โดยใช้ออนโทโลยี. วารสารเทคโนโลยีสารสนเทศ 2557;10(1):21-9.
โกญจนพงษ์ ทองเพชร, คะชา ชาญศิลป์. แนวคิดในการค้นคืนข้อมูลเชิงความหมายด้านเทคโนโลยีสารสนเทศภาษาไทย. ใน: เอกสารประกอบการประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏนครปฐม ครั้งที่ 3 วันที่ 10-11 สิงหาคม 2554. มหาวิทยาลัยราชภัฎนครปฐม.
นครปฐม; 2554. หน้า 91-7.
Downloads
Published
How to Cite
Issue
Section
License
บทความทุกบทความที่ได้รับการตีพิมพ์ถือเป็นลิขสิทธิ์ของ คณะวิทยาศาสตร์แฟละเทคโนโลยี มหาวิทยาลัยหัวเฉียวเฉลิมพระเกียรติ