中文网页
中文网页的相关文献在1997年到2019年内共计104篇,主要集中在自动化技术、计算机技术、贸易经济、体育
等领域,其中期刊论文70篇、会议论文14篇、专利文献16522篇;相关期刊57种,包括西部广播电视、中学科技、集邮博览等;
相关会议14种,包括第三届全国社会计算会议、平行控制会议、平行管理会议、2009年全国开放式分布与并行计算学术年会、2008年全国理论计算机科学学术年会等;中文网页的相关文献由145位作者贡献,包括王攀、卞小丁、孙立远等。
中文网页—发文量
专利文献>
论文:16522篇
占比:99.49%
总计:16606篇
中文网页
-研究学者
- 王攀
- 卞小丁
- 孙立远
- 张顺颐
- 曹骋
- 袁睿翕
- 何小鹏
- 俞永福
- 冯多
- 冯源
- 刘杰
- 刘清堂
- 刘艳民
- 卢艳宏
- 向丹丹
- 吴林静
- 垄成龙
- 姚蓓丽
- 孙雁飞
- 张云
- 彭宏
- 掌明
- 木伟民
- 朱顺炎
- 李芳芳
- 杨瑞
- 梁久祯
- 梁捷
- 王伟平
- 田文
- 葛斌
- 邵明博
- CETO
- Chen Fangshu
- Chen Jin
- DIY@Fan
- FLP
- Hellen
- Labs.SC
- Lin Huaizhong
- Littlewing
- Sweet
- TBMan
- Xu Duanqing
- fly
- 严桂夺
- 乔鸿毅
- 于铁军
- 任开兴
- 余一骄
-
-
-
-
酸樱桃
-
-
摘要:
除亚马逊之外,各个国家还有很多知名的购物网站,由于中国的购物金额每年都在飙升,全球商家都分外重视中国消费者体验。动作较快的购物网站早已经具备中文网页。 信息爆棚的时代中,海淘达人婷婷不仅自己在网上查各种折扣信息,与时俱进了解新产品新性能,还有好几个一起海淘的QQ群和微信群,大家经常互相交流最新情况,还可以了解别人都在买什么。让我们跟随诸位达人的脚步,盘点一下大家的购物目标。
-
-
-
曹骋
-
-
摘要:
英属马恩岛邮政为庆祝今年7月5日~27日举行的2014年环法自行车赛,特于2014年6月24日以《从约克郡出发—通往巴黎之路》为主题发行一系列丰富多彩的邮品,值得中国集邮者关注(中国集邮者可通过马恩岛邮政集邮局中文网页www.ukiompoststamps.com获取更多马恩岛新邮发行信息)。环法自行车大赛是世界上最著名的自行车公路赛,今年是该赛事的第101届。
-
-
黎明
-
-
摘要:
笔者采用一种笨拙的办法,探查某时段中国互联网上环保词汇的发生频率,试试能发现点什么。健康接轨,民意不承认特色环保2013年8月5日,笔者在百度搜索输入"2010 PM2.5",结果只有7个网页,几个中文网页分别提到PM2.5口罩和滤网。输入"2011PM2.5",找到相关结果约357万个;输入"2012 PM2.5",找到相关结果约471万个;输入"2013PM2.5",找到相关结果约515万个。"2010 PM2.5"条目下,无任何官方信息,没有包含PM2.5字样的中文学术信息,无报刊报道涉及此项指标,没有网民议论提及。实际上,
-
-
余一骄;
刘芹
-
-
摘要:
Semantic-based Chinese Web page retrieval is a premising application. The existing semantic retrieval mechanisms are categorized into three types, which are based on ontology,natural language understanding,and text classification and clustering respectively. The three technologies were reviewed and examined in detail. Semantic-based Chinese Web page retrieval system should focus on popular fields to draw great attention from Web users. Moreover, Web pages should be indexed with words rather than Chinese characters. Advanced Chinese information processing technologies should be integrated into semantic retrieval systems. Some directions for future research were finally presented, including semantic relevance ranking, ontology definition and instance automatic extraction, semantic-based indexing, and large-scale semantic training collections construction.%用户期望搜索引擎能提供基于语义的网页信息检索.基于本体、基于自然语言理解、基于文本统计分析的方法是实现中文网页语义检索的主要途径.分析了它们的实现方法、技术挑战和优、缺点;建议中文网页语义检索系统的开发应选择与普通用户联系紧密的应用领域,并以汉语词汇为索引单元,适量地采用中文信息处理技术.基于语义的中文网页检索应在以下方面加强研究:语义相关性评价方法、本体构建和实体抽取算法、基于语义的索引、大规模语义标注样本集开发等.
-
-
-
李芳芳;
葛斌;
毛星亮;
汤大权
-
-
摘要:
提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题词权重进行建模;最后选取权值较高的名词作为主题词.实验结果表明,相比未建立语义关联的主题词提取方法,本方法在查准率、召回率和F1测度值上均有一定的提高,当提取主题词个数为7时,本方法召回率和F1测度值达到最大值,且分别较传统方法最大值提高了12.5%和9.53%.%This paper proposed a new thematic words extraction method based on semantic relations.Firstly,used sliding window and HowNet to calculate semantic similarity between words, to form the candidate noun pairs.Then generated undirected graph based on these noun pairs to show the semantic links between them, and based on the graph to model the weight of words.Finally,selected the terms with higher weight as thematic words.Experimental results show that the proposed method substantially outperforms the traditional method in precision rate, recall rate and F1-measure, especially when the number of thematic words extracted is 7, the accurate rate is increased by 12.5% percent, and the F1-measure is increased by 9.53% percent.
-
-
-
-
-
- 《2008年全国理论计算机科学学术年会》
| 2008年
-
摘要:
本文探讨基于关联规则挖掘的中文网页体裁模式发现问题。通过链表结构,将文档集转换为适用于关联规则挖掘的事务数据库,保证了事务数据库出现的词条项按照在文本中出现的顺序排列,实现了Apriori关联规则算法。实验结果表明,这对于某些类别的体裁模式发现有比较好的效果.
-
-
-
魏小比
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
在日本域名网站里虽然存在不少中文网页,但实际上大多都没被有效利用。如果能从中准确地抽取出来,一定能为使用中文的用户带来许多方便.本研究利用自然语言处理技术,首先对日本早稻田大学和中国北京大学的网页作了全面分析,找出中文句子的特征,然后应用于日本域名1000万网页的解析,最终得到良好结果。
-
-
王会燃;
梁颖;
陈宏伟
- 《2006年中国西部地区信息技术学术研讨会》
| 2006年
-
摘要:
中文网页与外文网有很大的差别,中文网页的设计比外文网页多很多图片或声音剪辑,也就是所说的包含的网页对象不一样.所以在打开中文网页后,等待服务器传送完整网页的时间相对外文网页较长,原因就是所含网页对象的数量较多.由于设计风格不同,在做网络模拟仿真时不能照搬国外已建好的HTTP模型.本文通过对捕获的实际中文网页流量进行了分析,建立了符合中国的HTTP流量模型.该模型基于对中国网页大小的分析及根据实际流量的特点,对网页对象的大小,网页对象的间隔时间和一个网页中所包含对象的数量进行了研究,并对该模型所讨论的内容进行了可靠性分析,证明具有较好的准确性,为网络今后网络模拟仿真奠定了基础.
-
-
Chen Jin;
陈劲;
Lin Huaizhong;
林怀忠;
Chen Fangshu;
陈方疏;
Xu Duanqing;
许端清
- 《第29届中国数据库学术会议》
| 2012年
-
摘要:
网页信息抽取旨在从网页中抽取出结构化信息,网页中不仅仅包含由自然语言构成的自由文本,同时也包含如表格、列表等半结构化文本,之前相关研究大多仅针对单种文本进行抽取,提出了一种同时从自由文本和半结构化文本中抽取信息的综合方法.采用启发式规则,从页面中筛选出自由文本和半结构化文本,之后针对自由文本采用分词、词性标注、命名实体识别等自然语言处理技术和基于规则进行信息抽取,同时采用包装器归纳的方法归纳出单槽规则用于半结构化文本信息抽取,最终将从两种文本中抽取出的信息进行整合.通过将此综合方法应用于企业注册信息的抽取,并对其抽取效果进行评估,实验数据表明综合方法信息抽取的F1值比单独采用自由文本或半结构化文本信息抽取方法都有了非常显著的提高.
-
-
董静;
林鸿飞;
杨志豪
- 《第三届学术计算语言学研讨会》
| 2006年
-
摘要:
传统的网页分类大都基于内容,这种方式采用字词特征项匹配的方法,没有考虑网页的结构信息.为了充分挖掘网页的结构特征,本文提出了网页按形式分类的机制.以往关于形式分类的研究大都基于普通文本,但是网页文本不同于普通文本,它具有URL和HTML标签等对网页结构有较大影响的特征.本文从URL和网页的HTML标签中提取特征,并借用了普通文本形式分类中使用的部分特征项作为网页形式分类的特征集合,最后使用SVM分类器进行分类训练测试.
-
-
张东娜;
彭宏;
吴铁峰
- 《中国计算机学会第一届全国Web信息系统及其应用学术会议》
| 2004年
-
摘要:
本文针对网页分类问题提出一种结合粗集理论和贝叶斯分类器的方法.该方法针对贝叶斯分类器存在的属性间独立性限制问题和在大量样本情况下的分类效率问题,采用粗集的属性约简方法对描述网页类别的特征向量空间进行了约简,改善了属性间的独立性限制,减少了属性的数量,再使用约简后的数据训练贝叶斯分类器,提高了贝叶斯分类器的性能.实验结果表明该方法用于网页分类问题具有较好效果.
-