面向农业知识类音视频合成文件的分布式索引系统研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息通信技术、多媒体技术的蓬勃发展和网络宽带的迅速普及，互联网进入读图时代，人们渴望用一种最简单直接的方式来看世界，由于音视频视听兼容、声像并茂，承载信息量大，具有表达直观、立体形象、现场感强烈等特点，进而能够加速信息流通和信息的充分表达。其中在农业领域，农业生产知识类音视频，使用音视频动画，生动形象展示生产流程，提供了重要的科技信息指导农业生产，提高效益，在农业科技信息的传播中起着重要的作用。
　　以农业知识类音视频合成文件（以下简称视频）为研究对象，针对当前知识类视频检索粗糙、视频资源分散、缺乏统一的共享机制等问题，本文基于自然语言处理得到视频中所表达的文本内容，并利用Mapreduce分布式计算模型设计实现面向农业音视频合成文件的索引系统，进而在此基础上，为用户提供检索界面，实现基于语义的农业知识视频检索服务。随着计算机视觉、人工智能和语音识别的发展，对视频检索研究逐渐向视频的低层特征信息和高层语义信息相结合的方向发展。本文在充分分析农业知识类音视频文件具有“音频为主，视频为辅”以及视频镜头切换少，所讲授知识具有陈述性、程序性等特点的基础上，主要进行以下几个方面的研究:
　　(1)基于语音识别进行视频文本内容的提取。首先利用FFmpeg技术进行视频中音频的提取，然后基于自然语言、语音识别对视频内容进行语义文本标注，形成了上GB的视频内容文本文件。为了提高语音识别的正确率，最大程度的保留完整的语义单元，在语音识别中对音频文件做了音频分割和静音检测以及扩展农业专业词汇表工作。为了验证语音识别的正确率和探究基于自然语言处理、语义标注对视频索引的可行性，本文对100个视频样本分别进行机器标注和人工标注，对标注后的文本进行词频统计，通过对比计算两者高频主题词汇，得出两者相似度达到98.4％的结论，进而可以说明语音识别达到了很好的效果且基于自然语言处理、机器标注视频进行索引具有可行性。
　　(2)针对(1)得到的视频内容文本文件，在分布式计算环境下，并行构建倒排索引表。利用Mapreduce并行计算模型并基于TF-IDF算法，根据索引词出现的位置不同而设置不同的权重系数来计算rank值;依据业务逻辑对Mapreduce框架进行性能调优，为了使数据尽量分散开，避免大数据倾斜，将业务逻辑写成多个Mapreduce串;从减少数据传输过程中网络流量的角度，在数据量大的情况下，开启了可插拔的Combiner。并在此基础上，采用同样的词库和分词算法，对单机和集群环境下构建索引的效率进行了对比分析，得出在随着数据量的增长，单机执行效率急剧增长，而集群的执行效率呈一定的线性增长的结论。
　　(3)对系统进行了架构设计和原型系统开发。架构设计主要包括离线的视频数据处理和在线的视频检索服务。其中离线的视频数据处理包括数据预处理模块和并行构建倒排索引模块;在线的视频检索主要基于Web Api为用户提供检索界面，构建分布式检索系统，为用户提供基于语义的实时的、准确的检索服务。
　　本文通过对自然语言处理得到的视频内容文本文件构建分布式的索引系统和分布式检系统，对整合分散的农业知识类视频资源，实现的资源的共享和农业科技信息的传播有着重要意义并为农业视频网站的构建提供核心技术支持。

著录项

作者
石艳艳;
展开▼
作者单位

河南农业大学;

展开▼
授予单位河南农业大学;
学科农业信息化
授予学位硕士
导师姓名席磊;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
音视频合成文件; 农业知识; 分布式索引系统; 软件设计; 自然语言处理; 语音识别; 特征提取;

相似文献

中文文献
外文文献
专利

1. 面向搜索引擎的分布式文件系统性能分析 [J] . 董守斌 ,赵铁柱 . 华南理工大学学报（自然科学版） . 2011,第004期
2. 面向海量数据的分布式用户态文件系统研究与设计 [J] . 龚恒 ,李小勇 . 通信技术 . 2020,第002期
3. 面向闪存类存储设备嵌入式文件系统研究与实现 [J] . 王宏强 ,王太勇 ,邓辉 . 计算机应用研究 . 2008,第003期
4. 面向智能家居的音视频文件安全传输方法研究 [J] . 王顺业 ,杜彦辉 ,芦天亮 . 现代电子技术 . 2020,第012期
5. 面向智能家居的音视频文件匿名通信系统 [J] . 王顺业 ,芦天亮 ,杜彦辉 . 计算机工程与应用 . 2020,第015期
6. 虚拟机映像存储系统中面向文件级重复数据删除的稀疏索引技术 [C] . Shang YingDan ,尚颖丹 ,Li Huiba . 第十九届全国网络与数据通信学术会议 . 2012
7. 分布式面向对象文件系统研究 [A] . 邓万禧 . 2009

面向农业知识类音视频合成文件的分布式索引系统研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅