首页> 外文会议> >共起単語中の特異的頻出単語数を用いた用語のrepresentativeness計測尺度
【24h】

共起単語中の特異的頻出単語数を用いた用語のrepresentativeness計測尺度

机译:使用共现单词中特定常见单词的数量来衡量术语的代表性

获取原文

摘要

用語Tを含む文書集合D(T)に対して「D(T)中で特異的に高頻度で現れる単語の異なり数N_p(D(T))」を考え,N_pをBaseline法で正規化したrepresentativeness尺度B(·,N_p)を提案した。「D(T)中で特異的に高頻度で現れる单語」は,バラメータpを用いて,「D(T)内のHGS尺度がpより大である(すなわち,vが全文書中とD(T)中に出現する確率が同一で,単語の出現が互いに独立であると仮定した場合,vがD(T)に実際に出現している回数だけ出現する確率が2~(-p)より小さい)単語と定義する。
机译:考虑到包含术语T的文档集D(T)的“在D(T)中特别出现的不同单词N_p(D(T))的数量”,N_p用基线法进行了归一化。 ,N_p)。 “在D(T)中经常出现的单语”使用参数p,并且“ D(T)中的HGS比例大于p(即v在所有文档和D中都是)。假设在( T)是相同的,并且单词的出现彼此独立,v在D(T)中出现的概率为2〜(-p)。定义为单词(小于)。

著录项

  • 来源
    《》|2001年|2.7-2.8|共2页
  • 会议地点
  • 作者

    久光 徹; 丹羽 芳樹;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号