マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティツクインデクシング

井上　中順; 上嶋　勇祐; 篠田　浩一

首页> 外文期刊>電子情報通信学会技術研究報告 >マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティツクインデクシング

【24h】

マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティツクインデクシング

机译：使用多模态多帧方法的TRECVID语义索引

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，我々の提案するマルチモーダル・マルチフレームなセマンティツクインデクシング手法の，TRECVID2010ワークショップにおける評価結果を報告する．セマンティツクインデクシングの目的は，映像の中から「人が歌っている」・「飛行機が飛んでいる」など，意味を持った場面を検出することであり，様々な検出対象に対応できる汎用的なシステムが求められる．提案手法は，単純かつ高精度な検出器を目指し，画像特徴のSIFT特徴と音響特徴のMFCC特徴をGaussian Mixture Model（GMM）supervectorによりモデル化したマルチモーダルな手法である．SIFT特徴をショット中の複数のフレームから抽出を行うことで検出精度の向上を図った．TRECVID2010のデータセットで評価実験を行った結果，総合評価のMean Inferred Average Precisionは7．36%となった．%We propose a multi-modal, multi-frame approach for semantic indexing in the TRECVID 2010 workshop. The goal of the semantic indexing is to develop a method for indexing many concepts that will be useful for video search. In this study, we implement a simple and accurate system by using Gaussian Mixture Model (GMM) supervectors with SIFT and MFCC features. The SIFT features are extracted not only from key-frames but also from many image frames in a shot in order to get the most out of multi-frame information. Our best result on the TRECVID 2010 dataset was 7.36% in terms of Mean Inferred Average Precision.

机译：在本文中，我们在TRECVID2010研讨会上报告了我们提出的多模式多框架语义索引方法的评估结果。语义索引的目的是从视频中检测出有意义的场景，例如“一个人正在唱歌”或“一架飞机正在飞行”，它是一种通用设备，可以处理各种检测目标。系统是必需的。所提出的方法是针对简单且高精度的检测器的多模式方法，其中通过高斯混合模型（GMM）超向量对图像特征的SIFT特征和声学特征的MFCC特征进行建模。通过从镜头中的多个帧中提取SIFT特征，提高了检测精度。使用TRECVID2010数据集进行评估实验的结果是，总体评估平均推断平均精度为7.36％。我们在TRECVID 2010研讨会上提出了一种用于语义索引的多模式，多框架方法，其目的是开发一种对许多概念进行索引的方法，这些方法将对视频搜索有用。通过使用具有SIFT和MFCC功能的高斯混合模型（GMM）超向量，可以实现一个简单而准确的系统。SIFT功能不仅要从关键帧中提取，而且还要从镜头中的许多图像帧中提取出来，以最大程度地利用多重图像。就平均推断平均精度而言，我们在TRECVID 2010数据集上的最佳结果是7.36％。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第414期|p.25-30|共6页
作者
井上　中順; 上嶋　勇祐; 篠田　浩一;
展开▼
作者单位

東京工業大学大学院　情報理工学研究科　計算工学専攻;

東京都目黒区大岡山2-12-1;

東京工業大学　情報工学科;

東京都目黒区大岡山2-12-1;

東京工業大学大学院　情報理工学研究科　計算工学専攻;

東京都目黒区大岡山2-12-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
セマンティツクインデクシング; マルチモーダル; マルチフレーム; GMM supervector;

机译：语义索引;多模式;多帧;GMM超向量;
入库时间 2022-08-18 00:30:06

相似文献

外文文献
中文文献
专利

1. マルチモーダル·マルチフレームな手法を用いたTRECVIDセマンティックインデクシング [J] . 井上中順, 上嶋勇祐, 篠田浩一電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2010,第414期

机译：使用多模式，多帧技术的TRECVID语义索引
2. マルチモーダル·マルチフレームな手法を用いたTRECVIDセマンティックインデクシング [J] . 井上中順, 上嶋勇祐, 篠田浩一電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2010,第414期

机译：使用多模式多帧方法的TRECVID语义索引
3. NTTら業界団体を設立光通信技術を研究日本電信電話(株)(NTT、東京都千代田区)、米インテル、ソ二ー(株)(東京都港区)の3社は、新たな業界団体を設立する。光電融合技術を活用したフォトニクス関連技術の研究開発などを推進し、超大容量通信に対応できる光ネットヮーク技術の確立などを目指してハる。3-3プロセッシング領域狙う国内DRAM大手のェルピーダメモリを買収し、大きく飛躍を遂げた米マイクロンテクノロジー。2017年にはサンディスク共同創業者の1人である、Sanjay Mehrotra (サンジエイ·メイロトラ)氏を招聘。経営体制も刷新され、大きく生まれ変わった「新生マイクロン」を全面に押し出した。米サンフランシスコで開催されたプライベートイベント「MlicronInsight 2019」(現地10月24日開催)では、同社のあるべき将来像に対するメッセージが随所に散りばめられていた。 [J] . 半導体産業新聞 . 2019,第2372期

机译：成立了NTT和其他工业集团研究光通信技术的日本电报电话公司（NTT，东京千代田区），英特尔，索尼公司（东京都港区）是三个新的工业集团。建立。促进利用光电子融合技术的光子相关技术的研究和开发，并致力于建立可支持超高容量通信的光网络技术。 3-3处理领域美国Micron Technology在收购了国内主要DRAM公司Elpida Memory之后取得了巨大飞跃。 2017年，我们邀请了Sanjay联合创始人Sanjay Mehrotra。管理系统也进行了改进，我们推出了完全脱胎换骨的“新Micron”。在旧金山举行的私人活动“ Mlicron Insight 2019”（10月24日举行）上，有关公司未来愿景的信息四处散布。
4. RGB-Dカメラを用いたデジタルヒューマンモデルに対するインタラクティブ教示システム（第一報）―距離場と物理シミュレーションを用いた製品モデルに対する姿勢フィット手法 [C] . 久澤大輝, 金井理, 伊達宏昭, 精密工学会大会学術講演会 . 2015

机译：使用距离场和物理仿真，使用RGB-D相机（第1次报告）的数字人体模型的互动教学系统使用距离场和物理仿真
5. ローダミンサルコーマのクロマチンによるラット肝臓のピルビン酸キナーゼアイソザイムの変動について [D] . 中村, 敏一 -1

机译：罗丹明肉瘤染色质对大鼠肝脏丙酮酸激酶同工酶的影响
6. チホウジチタイノガイコクジンシサクニオケルシミンキョウドウノカノウセイオサグルマチダサガミハラニオケルコウイキレンケイノモサクキョウドウジッセンケンキュウワタドセキケンキュウハンプレフォーラムチホウジチタイノガイコクジンシサクニオケルシミンキョウドウノカノウセイオサグルマチダサガミハラニオケルコウイキレンケイノモサク [O] . 塩原良和, シオバラヨシカズ, Shiobara Yoshikazu 2008

机译：Chiho Dichitaijin shikaku Nioker shimin Kyodou No Kanousei O sagle machida sagamihara Nioker Kouiki Renkei No mosaku Kyoudo Jisen

マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティツクインデクシング

摘要

著录项

相似文献

相关主题

期刊订阅