แอปพลิเคชันสืบค้นเนื้อหาของวีดิทัศน์โดยใช้ข้อความ

ผู้แต่ง

  • พรศักดิ์ ปรีเลขา สาขาวิชาเทคโนโลยีสารสนเทศ คณะวิศวกรรมศาสตร์และเทคโนโลยี สถาบันการจัดการปัญญาภิวัฒน์

คำสำคัญ:

การสืบค้นข้อมูล, สืบค้นเนื้อหาของวีดิทัศน์, แอปพลิเคชัน, elastic search

บทคัดย่อ

การวิจัยครั้งนี้มีวัตถุประสงค์ในการพัฒนาแอปพลิเคชันสืบค้นเนื้อหาของวีดิทัศน์โดยใช้ข้อความ ระบบที่พัฒนาใช้ เทคนิคการแปลงวีดิทัศน์เป็นข้อความเสียงโดยใช้ Google Cloud Speech to Text เพื่อให้ได้ไฟล์ .json จากนั้นทำการ จัดเก็บไฟล์ลงใน elastic search ซึ่งมีความสามารถในการค้นหาคำ เพื่อลดความซับซ้อนของข้อมูล ลดระยะเวลาในการ ค้นหา โดยผู้ใช้งานพิมพ์คำค้นที่ต้องการแล้ว แอปพลิเคชันจะทำการดึงข้อมูลจาก elastic search ใช้โพสต์แมน (Postman) ที่ประกอบด้วย Mocking service ร่วมกับ Ngrok ในการเช็คข้อมูลของ Hit matching และ score แล้วจึงแสดงผลลัพธ์ ของการสืบค้น ซึ่งผู้วิจัยเลือกใช้ Analyse Token เป็นตัววิเคราะห์และการตัดคำ โดยใช้รูปแบบการค้นหาข้อความจากวิธี ดังกล่าว สำหรับการประเมินความถูกต้องของการสืบค้นเนื้อหาวีดีทัศน์จากแอปพลิเคชันที่ได้พัฒนา ผู้วิจัยสุ่มเลือกวีดิทัศน์ ธรรมะที่เผยแพร่สาธารณะผ่านอินเทอร์เน็ต จำนวน 14 ไฟล์ และทำการสุ่มคำสำคัญที่ต่างกันเพื่อใช้ในการสืบค้น จำนวน 10 คำ ผลการทดสอบพบว่า แอปพลิเคชันที่พัฒนาสามารถสืบค้นเนื้อหาของวีดิทัศน์โดยใช้ข้อความ มีความถูกต้องอยู่ที่ 80.71 ในอนาคตสำหรับการเพิ่มประสิทธิภาพในการสืบค้นเนื้อหาของวีดิทัศน์โดยใช้ข้อความให้มีประสิทธิภาพเพิ่มขึ้น ควรนำเทคโนโลยี Natural Language Processing (NLP) เข้ามาช่วยในการวิเคราะห์ข้อมูล เนื่องจากงานของผู้วิจัยยัง เป็นการค้นแบบคีย์เวิร์ดธรรมดา

References

อุไร ทองหัวไผ่. ภาพรวมของระบบค้นคืนสารสนเทศ. Information retrieval [อินเทอร์เน็ต]. 2562 [เข้าถึงเมื่อ 2 ก.ย. 2563]. เข้าถึงได้จาก: http://instructor.ru.ac.th/urai/cos4351/cos4351_1.pdf

วีระศักดิ์ เดชนพพรพันธุ์. สถิติข้อมูลการใช้โซเชียลมีเดียของไทย 2020. Think about wealth [อินเทอร์เน็ต]. 2563 [เข้าถึงเมื่อ 2 ก.ย. 2563]. เข้าถึงได้จาก: https://www.thinkaboutwealth.com/ socialmediastatthailand2020

Brett M, Upendra C, Bhuvana R. Fast audio search using vector space modelling. In: IEEE Workshop on Automatic Speech Recognition & Understanding (ASRU), December 9-13, 2007; Kyoto, Japan; 2007. p. 641-6.

Sakamoto N, Yamamoto K, Nakagawa S. Combination of syllable based N-gram search and word search for spoken term detection through spoken queries and IV/OOV classification. In: IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), December 13-17, 2015; Scottsdale, AZ; 2015. p. 200-6.

Elizalde B, Zarar S, Raj B. Cross modal audio search and retrieval with joint embeddings based on text and audio. In: IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 12-17, 2019; Brighton, United Kingdom; 2019. p. 4095-9.

Chen Z, Jang JR. On the use of anti-word models for audio music annotation and retrieval. IEEE T Audio Speech 2009;17(8):1547-56.

ปณวรรต คงธนกุลบวร, คณิศร จี้กระโทก. การแปลงภาษาไทยและภาษาอังกฤษเป็นรูปอักษรเบรลล์โดยใช้การรู้จำเสียงพูด. วารสารสมาคมเวชสารสนเทศไทย 2559;2(2):146-52.

ธานลิ ม่วงพล, อวยไชย อินทรสมบัติ. การใช้เสียงควบคมุอุปกรณ์ไฟฟ้าด้วยแอนดรอยด์และไมโครคอนโทรลเลอร์. วารสารมหาวิทยาลัยฟาร์อีสเทอร์น 2560;11(พิเศษ): 20-30.

Dharanipragada S, Roukos S. New word detection in audio-indexing. In: IEEE Workshop on Automatic Speech Recognition and Understanding Proceedings. December 12-17, 1997; Santa Barbara, CA, USA; 1997. p. 551-7

จักรกฤษณ์ เสน่ห์ นมะหุต. ระบบสารสนเทศสำหรับการสืบค้นข้อมูลท่องเที่ยวด้วยเสียง. วารสารบริหารธุรกิจเทคโนโลยีมหานคร 2557;11(2):1-17.

ฉัตรชัย อนิทรประพันธ์, ไกรศักดิ์ เกษร. เทคนิคการค้นคืนสารสนเทศข้ามภาษา (ไทย - อังกฤษ) โดยใช้ออนโทโลยี. วารสารเทคโนโลยีสารสนเทศ 2557;10(1):21-9.

โกญจนพงษ์ ทองเพชร, คะชา ชาญศิลป์. แนวคิดในการค้นคืนข้อมูลเชิงความหมายด้านเทคโนโลยีสารสนเทศภาษาไทย. ใน: เอกสารประกอบการประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏนครปฐม ครั้งที่ 3 วันที่ 10-11 สิงหาคม 2554. มหาวิทยาลัยราชภัฎนครปฐม.

นครปฐม; 2554. หน้า 91-7.

Downloads

เผยแพร่แล้ว

2020-12-30