基于局部信息融合的行为识别研究

下载本文档

阅读 155
下载 2
格式 docx
大小 1.2 MB
约36页
2025-04-13 发布于山西
收藏
评论
点赞(0)
海报
举报

1/36页

2/36页

3/36页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/36

文本预览下载提示常见问题

基于局部信息融合的行为识别研究Research on Behavior Recognition Based on Local Information Fusion摘要人类视觉和行为识别技术是计算机科学、视觉技术和人工智能视频技术领域的重要学术研究主题。在这个信息时代，人们的日常生活和工作离不开一个具有强大的人眼视觉和运动识别功能的设备，先进的人机交互，无人驾驶，智能视频和监控，在移动机器人领域具有非常的重要。对诸如定位和卫星导航，虚拟现实以及此类人工智能产品之类的智能设备的需求也在不断增长。因此，对于人工智能视频技术中人体行为识别技术的研究与开发具有重要的学术研究价值和意义。目前的人体行为识别方法对短视频的人体行为识别处理效果较好，例如双流神经网络、3d 卷积神经网络、时空卷积神经网络等识别方法。这些行为识别网络的视频输入或是随机选择的一个原始的 RGB 图像，或是选择堆叠一组密集的 RGB 图像，或是一组光流图。但是对于长视频而言，密集的选择一组图像帧无法比较客观的表示全局信息。因此本文从短视频的理论与技术实际的角度出发，针对长视频的人体行为识别提出了一种基于关键帧的局部信息融合的分段视频识别网络(Key Frame Segment Network，KFSN)，该方法将长视频分为等长的多段视频分别进行人体行为的识别，再把分段的短视频的识别结果进行融合。这种网络是基于长时间建模的思想，它很好的结合了稀疏时间视频采样的策略，使整个动作视频能高效学习。本文中所提出的识别方法已在公共数据集 UCF101 和 HMDB51 上进行了多次实验。得出的实验结果表明，本文提出的 KFSN 网络能够取得较好的行为识别效果，在 UCF101 可以达到 95.0％的识别率，在 HMDB51 上可以达到 70.1%的识别率。优于一些现有的行为识别网络性能。关键词：行为识别；关键帧提取；局部信息；信息融合 IIAbstractHuman vision and behavior recognition technology are important academic research topics in the fields of computer science, visual technology, and artificial intelligence video technology. In this information age, people's daily life and work are inseparable from a device with powerful human eye vision and motion recognition functions, advanced human-computer interaction, unmanned driving, intelligent video and monitoring, which are very import...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

基于局部信息融合的行为识别研究

基于局部信息融合的行为识别研究Research on Behavior Recognition Based on Local Information Fusion摘要人类视觉和行为识别技术是计算机科学、视觉技术和人工智能视频技术领域的重要学术研究主题

在这个信息时代，人们的日常生活和工作离不开一个具有强大的人眼视觉和运动识别功能的设备，先进的人机交互，无人驾驶，智能视频和监控，在移动机器人领域具有非常的重要

对诸如定位和卫星导航，虚拟现实以及此类人工智能产品之类的智能设备的需求也在不断增长

因此，对于人工智能视频技术中人体行为识别技术的研究与开发具有重要的学术研究价值和意义

目前的人体行为识别方法对短视频的人体行为识别处理效果较好，例如双流神经网络、3d 卷积神经网络、时空卷积神经网络等识别方法

这些行为识别网络的视频输入或是随机选择的一个原始的 RGB 图像，或是选择堆叠一组密集的 RGB 图像，或是一组光流图

但是对于长视频而言，密集的选择一组图像帧无法比较客观的表示全局信息

因此本文从短视频的理论与技术实际的角度出发，针对长视频的人体行为识别提出了一种基于关键帧的局部信息融合的分段视频识别网络(Key Frame Segment Network，KFSN)，该方法将长视频分为等长的多段视频分别进行人体行为的识别，再把分段的短视频的识别结果进行融合

这种网络是基于长时间建模的思想，它很好的结合了稀疏时间视频采样的策略，使整个动作视频能高效学习

本文中所提出的识别方法已在公共数据集 UCF101 和 HMDB51 上进行了多次实验

得出的实验结果表明，本文提出的 KFSN 网络能够取得较好的行为识别效果，在 UCF101 可以达到 95

0％的识别率，在 HMDB51 上可以达到 70

1%的识别率

优于一些现有的行为识别网络性能

关键词：行为识别；关键帧提取；局部信息

文章天下 + 关注: 实名认证
内容提供者

各种文档应有尽有

收藏店铺进入空间

基于局部信息融合的行为识别研究

基于局部信息融合的行为识别研究

您可能关注的文档

相关文档

热门下载

相关标签