长春工业大学

基于内容的视频分割与检索技术研究

作者:
马永波

关键词:
多媒体信息视频分割镜头边界检测镜头分割

摘要:
随着计算机多媒体技术的发展和多媒体信息处理需求的不断增长,基于内容的视频检索技术CBVR(Content-based Video Retrieval)越来越受到人们的广泛关注,相关的视频处理研究成为当前一个重要的研究领域。 视频数据可用幕、场景、镜头、帧等描述。视频分割的一般做法是基于帧的分割,其任务主要集中于镜头(Shot)边界检测,从而将视频在时间轴上分成镜头的集合。镜头分割是视频处理的第一步,是随后的高层语义分析、分类、索引和检索的基础,其准确性将直接影响到后续处理的结果。镜头边界检测的关键是找到图像帧之间的差别,并在此基础上提取出关键帧和运动信息以供浏览和检索之用。 视频检索就是要从大量的视频数据中找到所需的视频片断,传统的视频检索只能通过快进和快退等顺序的方法人工查找,因而是一件非常繁琐耗时的工作,这显然已无法满足多媒体数据库的要求。用户往往希望只要给出例子或特征描述,系统就能自动地找到所需的视频片断点,从而实现基于内容的视频检索。 本文首先介绍了基于内容的视频分割与检索的一般理论和一些典型算法,然后提出了一个新的视频分割和检索系统的概要描述模型,通过该模型可以指导各种层次化的视频数据的处理。接着通过对压缩域视频数据的研究,本文提出了一个多模式快速镜头边界检测算法,用以在基于MPEG标准的视频流数据上进行快速的镜头分割。之后本文讨论了视频数据的特征提取、描述与检索的一般理论与方法,最后对本文的理论算法进行了实验验证与性能评价。

在线下载

相关文章:
在线客服:
对外合作:
联系方式:400-6379-560
投诉建议:feedback@hanspub.org
客服号

人工客服,优惠资讯,稿件咨询
公众号

科技前沿与学术知识分享