กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้:
http://ir.sru.ac.th/handle/123456789/1130ระเบียนเมทาดาทาแบบเต็ม
| ฟิลด์ DC | ค่า | ภาษา |
|---|---|---|
| dc.contributor.author | ศราวุธ มากชิต | en_US |
| dc.date.accessioned | 2025-10-16T10:41:29Z | - |
| dc.date.available | 2025-10-16T10:41:29Z | - |
| dc.date.issued | 2568-09-15 | - |
| dc.identifier.uri | http://ir.sru.ac.th/handle/123456789/1130 | - |
| dc.description.abstract | เทคนิค Vector Quantization (VQ) ได้ถูกนำมาใช้กันอย่างแพร่หลายในการจัดการกับปัญหาและอุปสรรคของการจัดเก็บและเวลาในการประมวลผลข้อมูล สำหรับการค้นหาเพื่อนบ้านที่ใกล้ที่สุด (Nearest Neighbors: NN) ในแอปพลิเคชันต่าง ๆ ของข้อมูลมัลติมีเดีย ซึ่งอัลกอริทึม K means clustering เป็นวิธีการหนึ่งของ VQ เพื่อจัดการกับปัญหาดังกล่าว ปัจจุบันการค้นคืนข้อมูลข้ามมีเดีย (Cross-media retrieval) มีความสำคัญมากขึ้น เนื่องจากการเติบโตอย่างรวดเร็วของข้อมูลทางด้านมัลติมีเดีย เช่น ข้อความ รูปภาพ วิดีโอ เสียง และ ข้อมูล 3 มิติเราสามารถค้นคืนข้อมูลโดยการส่งคำถาม (query) ของสื่อประเภทหนึ่งเพื่อค้นคืนสื่ออีกประเภทหนึ่ง ถึงแม้ว่าจะมีการนำเสนอเทคนิค VQ หรืออัลกอริธึมการทำแฮชชิง (Hashing) จำนวนมาก เพื่อรหัสขนาดกะทัดรัด (Compact code) โดยมีวัตถุประสงค์ในการทำงานแบบเรียลไทม์แต่ถ้าจะค้นหาอย่างละเอียดถี่ถ้วน (Exhaustive search) นั้นไม่สามารถทำได้ในโลกแห่งความเป็นจริง และการคำนวณระยะทางแฮมมิง (Hamming distance) ก็ให้ผลลัพธ์ที่คลาดเคลื่อนสูง เนื่องจากมีการสูญเสียข้อมูลขณะทำการเข้ารหัส (Quantization loss) ในงานวิจัยนี้มีวัตถุประสงค์เพื่อ 1) พัฒนาตารางดัชนีแบบกลับด้านด้วยรหัส K-means และ 2) นำเสนอแนวทางและวิเคราะห์ประสิทธิภาพการค้นคืนข้อมูลข้ามมีเดียแบบใหม่ที่ผ่านการเรียนรู้เชิงลึก (DNN) โดยใช้วิธีการเรียนรู้คุณสมบัติของข้อมูลมัลติมีเดีย (Multimedia features) เพื่อการค้นคืนข้อมูลข้ามมีเดีย วิธีการที่นำเสนอเป็นวิธีการค้นหาแบบใหม่ที่ใช้ค่าความสัมพันธ์ (Relevant score) ของตารางดัชนีแบบกลับด้าน (Inverted index) ด้วยรหัสกลุ่ม K-means จับคู่กับคำถามดิบ (Raw query) โดยผ่านการเรียนรู้ด้วยโครงข่ายประสาทเทียมเชิงลึก (DNN) เพื่อปรับปรุงประสิทธิภาพของดัชนี K-means แบบดั้งเดิม การทดสอบได้ดำเนินการกับชุดข้อมูลมัลติมีเดียมาตรฐาน 4 ชุด ผลลัพธ์ที่ได้แสดงให้เห็นถึงประสิทธิผลที่ช่วยเพิ่มประสิทธิภาพ เมื่อเทียบกับการค้นคืนแบบพื้นฐาน (baseline) ด้วยรหัส K-means ทั้งด้านความถูกต้องและเวลา ซึ่งสามารถกล่าวสรุปได้ว่า โมเดลการเรียนรู้ DNN สามารถเรียนรู้คุณสมบัติข้อมูลคำถามดิบของข้อมูล มัลติมีเดียได้ดีในการเชื่อมโยงกับค่าคะแนนความสัมพันธ์ของแต่ละกลุ่ม K-means ได้อย่างมีประสิทธิภาพ | en_US |
| dc.description.sponsorship | Vector quantization (VQ) has lately become commonly employed for Nearest Neighbors (NN) search in multimedia retrieval applications to overcome the limitation of the storage and calculation time. One of VQ technique called K-means clustering can be used to solve the problems. Due to the growing rise of multimedia data such as text view, photo view, video view, audio view, and 3D view, cross-media retrieval has become increasingly vital. We can submit a query of each media view to retrieve the results of another media view. Despite the fact that several VQ approaches or hashing algorithms have been developed to construct compact binary codes. An exhaustive search is unfeasible in real-time, and Hamming distance computation in the Hamming space produces erroneous results because of quantization loss. The objectives of this work are, 1) to develop inverted index tables with K means code; and 2) to propose the new way and analyze the effective of cross media retrieval by applying deep learning. The method had learned each multimedia features and search for another kinds of media view in the K-means index. As a result, we offer a unique search strategy for K-means hash codes that employs a relevant score of index structure. We create an inverted index table based on K means clusters and train a neural network by matching a raw query with the relevant score of each cluster to increase the accuracy and efficiency of the original K-means index. Experiments are conducted on four benchmark multimedia datasets. Our findings suggest that the efficacy improves baseline performance in accuracy and computation time. We can conclude that The DNN learning model is able to learn the raw question data properties of multimedia data effectively in association with the correlation score values of each K-means group. | en_US |
| dc.language.iso | th | en_US |
| dc.publisher | มหาวิทยาลัยราชภัฏสุราษฎร์ธานี | en_US |
| dc.subject | การจัดทำดัชนีกลับด้าน | en_US |
| dc.subject | การค้นคืนข้อมูลข้ามมีเดีย | en_US |
| dc.subject | การค้นหาเพื่อนบ้านที่ใกล้ที่สุด | en_US |
| dc.subject | ดัชนีรหัสไบนารี่ | en_US |
| dc.title | การพัฒนาการค้นคืนข้อมูลข้ามมีเดียบนดัชนีแฮชโค้ด K-means | en_US |
| dc.title.alternative | The development of cross-media retrieval on the K-means hash code index | en_US |
| dc.type | Research Report | en_US |
| ปรากฏในกลุ่มข้อมูล: | EDU: Research Reports | |
แฟ้มในรายการข้อมูลนี้:
| แฟ้ม | รายละเอียด | ขนาด | รูปแบบ | |
|---|---|---|---|---|
| Sarawut.pdf | 8.26 MB | Adobe PDF | ดู/เปิด |
รายการทั้งหมดในระบบคิดีได้รับการคุ้มครองลิขสิทธิ์ มีการสงวนสิทธิ์เว้นแต่ที่ระบุไว้เป็นอื่น