大規模データに対する識別子独立型の特徴選択

柳堀　慎吾; 工藤　峰一

首页> 外文期刊>電子情報通信学会技術研究報告 >大規模データに対する識別子独立型の特徴選択

【24h】

大規模データに対する識別子独立型の特徴選択

机译：标识符无关的特征选择，可用于大规模数据

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this study, we attempt to perform classifier-independent feature selection (CIFS) for large-scale data such as text classification. Under the restriction of two-class and binary features, we propose an efficient method that selects a few valid features by using confidence bounds. In comparative experiments for dataset with over 100,000 features and over 100,000 samples, the proposal method obtained a near optimal feature subset.%本研究では，文書分類などの大規模データに対して，実用的な時間で行える識別子独立型の特徴選択を検討する．ニクラス，二億特徴に限定して，有効な少数の特徴の組み合わせを信頼区間を考慮して求めることで比較的効率の良い方法を提案する．特徴数およびサンプル数がともに十万を越える規模の文書分類問題に対して行った比較実験では，提案手法により最適な特徴集合に近い特徴集合が得られることが示された．

机译：在这项研究中，我们尝试对诸如文本分类之类的大规模数据执行与分类器无关的特征选择（CIFS）。在两类和二进制特征的限制下，我们提出了一种有效的方法，该方法通过使用选择一些有效特征置信范围：在具有100,000个以上特征和100,000个以上样本的数据集的比较实验中，该提议方法获得了接近最佳的特征子集。％在本研究中，可以在实际时间内识别出大规模数据，例如文档分类考虑独立的特征选择。通过考虑Niclas和2亿个特征（考虑置信区间），找到少量特征的有效组合，我们提出了一种相对有效的方法。在对特征数量和样本数量超过100,000的文档分类问题进行的比较实验中，表明所提出的技术产生的特征集接近最佳特征集。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第330期|p.73-78|共6页
作者
柳堀　慎吾; 工藤　峰一;
展开▼
作者单位

北海道大学大学院情報科学研究科　〒060-0814札幌市北区北14条西9丁目;

北海道大学大学院情報科学研究科　〒060-0814札幌市北区北14条西9丁目;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
特徴選択; 識別子独立型; 大規模データ; 信頼区間; 文書分類;

机译：特征选择;与标识符无关;大规模数据;置信区间;文档分类;
入库时间 2022-08-18 00:34:28

相似文献

外文文献
中文文献
专利

1. 大規模データに対する識別子独立型の特徴選択 [J] . 柳堀慎吾, 工藤峰一電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2010,第330期

机译：大规模数据的与标识符无关的特征选择
2. 大規模データに対する識別子独立型の特徴選択 [J] . 柳堀慎吾, 工藤峰一電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2010,第330期

机译：用于大规模数据的标识符独立特征选择
3. 飼料収穫作業における機械体系間の作業効率の比較とコントラクタ一における技術選択に関する考察—GPS 口ガーによるデータ収集と圃場区画規模別の作業、機械体系間比較一 [J] . 農業経済研究 . 2020,第1期

机译：通过GPS故障和基于工作的工作，机械系统对料理收集和技术选择的机械系统中工作效率的比较。
4. 格子状通路を有する大規模道駅の空間的特徴が避難行動に与える影響 :大規模鉄道駅の火災避難時における利用者の避難経路選択方略に関する研究その1 [C] . 藤井皓介, 西宮竜也, 山本昌和, 日本建築学会年度大会 . 2012

机译：大型公路站空间特征与晶格形态通道对疏散行为的影响：大规模火车站火灾疏散时疏散路径选择策略研究1
5. 医療離散列データからの一貫性に基づく特徴選択と相互依存重集合抽出に関する研究 [D] . 嶋村翔 2019

机译：基于一致性的医学离散序列特征选择和互相关多集提取研究
6. 金融時系列の独立成分によるパターンの認識と特徴点抽出 : 人工市場モデルにおいて生成された金融時系列への適用に関する一考察 (不確実性の下での意思決定の数理) [O] . 奥原浩之, 柴田淳子, 泉本圭介, 2003

机译：金融时间序列的独立组成部分进行模式识别和特征点提取：在人工市场模型（不确定性下的数学决策）中产生的金融时间序列的应用研究

大規模データに対する識別子独立型の特徴選択

摘要

著录项

相似文献

相关主题

期刊订阅