基于局部信息融合的行为识别研究

下载本文档

阅读 61
下载 14
格式 docx
大小 1.26 MB
约36页
2025-04-23 发布于山西
收藏
评论
点赞(0)
海报
举报

1/36页

2/36页

3/36页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/36

文本预览下载提示常见问题

基于局部信息融合的行为识别研究Research on Behavior Recognition Based on Local Information FusionII摘要人体视觉和行为识别技术目前是计算机科学和视觉技术领域以及人工智能视频技术领域中的一个重要的学术研究课题。在信息时代，人们的日常生活和工作中，具有较强的人体视觉和行为识别能力的人体智能识别设备在高级人机交互、无人驾驶、智能视频与监控、移动机器人定位与卫星导航、虚拟与现实等人工智能领域中都具有重要的应用，同时人们对于此类人工智能产品的需求也与日俱增。因此，对于人工智能视频技术中人体行为识别技术的研究和发展具有重要的学术研究价值和意义。目前的人体行为识别方法对短视频的人体行为识别处理效果较好，例如双流神经网络、3d 卷积神经网络、时空卷积神经网络等识别方法。这些行为识别网络的视频输入或是随机选择的一个原始的 RGB 图像，或是选择堆叠一组密集的 RGB 图像，或是一组光流图。但是对于长视频而言，密集的选择一组图像帧无法比较客观的表示全局信息。因此本文从短视频的理论与技术实际的角度出发，针对长视频的人体行为识别提出了一种基于关键帧的局部信息融合的分段视频识别网络(Key Frame Segment Network，KFSN)，该方法将长视频分为等长的多段视频分别进行人体行为的识别，再把分段的短视频的识别结果进行融合。这种网络是基于长时间建模的思想，它很好的结合了稀疏时间视频采样的策略，使整个动作视频能高效学习。本文提出的识别方法在公开的数据集 UCF101 和 HMDB51 上分别进行了实验，对比实验结果表明本文提出的 KFSN 网络能够取得较好的行为识别效果，在 UCF101 上达到了 95.0%的识别率，在 HMDB51 上达到了 70.1%的识别率，优于一些现有的行为识别网络性能。关键词：行为识别；关键帧提取；局部信息；信息融合 IIAbstractHuman vision and behavior recognition technology is currently an important academic research topic in the field of computer science and visual technology and artificial intelligence video technology. In the information age, people ’s daily life and work, human body intelligent recognition devices with strong human vision and behavior recognition capabilities include advanced human-computer interaction, unmanned driving, intelligent vid...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

基于局部信息融合的行为识别研究

基于局部信息融合的行为识别研究Research on Behavior Recognition Based on Local Information FusionII摘要人体视觉和行为识别技术目前是计算机科学和视觉技术领域以及人工智能视频技术领域中的一个重要的学术研究课题

在信息时代，人们的日常生活和工作中，具有较强的人体视觉和行为识别能力的人体智能识别设备在高级人机交互、无人驾驶、智能视频与监控、移动机器人定位与卫星导航、虚拟与现实等人工智能领域中都具有重要的应用，同时人们对于此类人工智能产品的需求也与日俱增

因此，对于人工智能视频技术中人体行为识别技术的研究和发展具有重要的学术研究价值和意义

目前的人体行为识别方法对短视频的人体行为识别处理效果较好，例如双流神经网络、3d 卷积神经网络、时空卷积神经网络等识别方法

这些行为识别网络的视频输入或是随机选择的一个原始的 RGB 图像，或是选择堆叠一组密集的 RGB 图像，或是一组光流图

但是对于长视频而言，密集的选择一组图像帧无法比较客观的表示全局信息

因此本文从短视频的理论与技术实际的角度出发，针对长视频的人体行为识别提出了一种基于关键帧的局部信息融合的分段视频识别网络(Key Frame Segment Network，KFSN)，该方法将长视频分为等长的多段视频分别进行人体行为的识别，再把分段的短视频的识别结果进行融合

这种网络是基于长时间建模的思想，它很好的结合了稀疏时间视频采样的策略，使整个动作视频能高效学习

本文提出的识别方法在公开的数据集 UCF101 和 HMDB51 上分别进行了实验，对比实验结果表明本文提出的 KFSN 网络能够取得较好的行为识别效果，在 UCF101 上达到了 95

0%的识别率，在 HMDB51 上达到了 70

1%的识别率，优于一些现有的行为识别网络性能

关键词：行为识别；关键帧提

您可能关注的文档

冬哥小店 + 关注: 实名认证
内容提供者

各类学术资料交流学习

收藏店铺进入空间

基于局部信息融合的行为识别研究

基于局部信息融合的行为识别研究

您可能关注的文档

相关文档

热门下载

相关标签