首页> 外国专利> SYSTEM AND METHOD FOR WORD CLASSIFICATION BASED ON HYPERLINK OF WEB TEXT

SYSTEM AND METHOD FOR WORD CLASSIFICATION BASED ON HYPERLINK OF WEB TEXT

机译:基于Web文本超链接的单词分类系统和方法

摘要

The present invention relates to a system which uses the hyperlink information of a web document consisting of hypertext to classify the type of natural language words in the web document based on the hyperlink classification. Hyperlinks are reference links representing videos, URLs, text, tags, music, pictures, programs, and files for specific words and are implemented in markup languages of web documents such as HTML. Such information enables classifying the type of the object names for words configuring hyperlinks without using a high-level natural language processing model. Utilizing the metadata information of hyperlinks enables a large amount of information to be used more easily than by an analysis using natural language processing due to the properties of the web data built by the collaboration of users.
机译:本发明涉及一种系统,该系统使用由超文本组成的网络文档的超链接信息来基于超链接分类对网络文档中的自然语言单词的类型进行分类。超链接是表示特定单词的视频,URL,文本,标签,音乐,图片,程序和文件的参考链接,并以Web文档的标记语言(例如HTML)实现。这样的信息可以对配置超链接的单词的对象名称类型进行分类,而无需使用高级自然语言处理模型。由于用户协作建立的网络数据的属性,与使用自然语言处理进行分析相比,利用超链接的元数据信息可以更轻松地使用大量信息。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号