首页>中文会议>工业技术>自动化技术与计算机技术>第七届社会计算会议
第七届社会计算会议

第七届社会计算会议

  • 召开年:2015
  • 召开地:福州
  • 出版时间: 2015-12-11

主办单位:中国自动化学会

会议文集:第七届社会计算会议论文集

会议论文

热门论文

全部论文

全选(0
  • 摘要:本文使用根据年龄组变化预测人口的Leslie模型预测未来的人口结构,以山东省为例,根据人口普查数据、生育意愿调查及独生子女所占比例,分别估计出在独生子女政策下和单独二胎政策下的总和生育率,以统计学中的伽马分布来估计生育模式建立模型.通过建立的基于单独二胎的人口预测模型和基于计划生育单胎政策的人口预测模型,预测在计划生育政策调整和未调整下2020年的山东省分年龄人口数量和结构.
  • 摘要:RDF数据规模随着语义网的发展不断增长,大规模RDF数据的查询处理面临巨大的挑战.为了解决当前RDF数据查询效率低下的问题,提出了Spark平台上一种新的分布式RDF数据查询算法RQCCP.该算法按照主语所属的类,谓语,宾语所属的类分割存储RDF数据,同时建立类间属性关联的索引文件:查询时利用索引文件缩小查询数据输入的范围、提前过滤无关三元组,查询中间结果缓存在内存中减少磁盘I/O,从而提高查询效率.通过在大规模RDF数据集上进行的实验证明了本算法具有较高的查询效率.
  • 摘要:本文从物理过程和信息过程各选取一个领域,物理过程的交通信号控制和信息过程的互联网问诊,初探了可实现知识自动化的方法。总结而言,主要是两种方法或技术:协同过滤和词嵌入。仔细分析,对于物理过程中大量的难捕捉、难描述、难量化的因素,在有大数据的情况下,可通过协同过滤方法,利用相似群体的信息,以结果为导向,建模时忽略其因素本身却保证不丢弃其影响。从这一层面来讲,可以对很多物理过程的情况利用协同过滤实现知识自动化,而无需过多的人工介入,去收集信息、处理信息、分析信息、建模信息、实施控制。对于信息过程,由于描述的多样性,一般算法很难自动智能认知;在大数据量的情况下,很多机器学习算法都表现出了一定的自动化特性,但一般研究中监督学习居多,而监督学习则需要标记,现实生活中的大部分数据又是没有标记的。词嵌入无需标记,从表层看是一种无监督学习;深入洞察其原理可发现,其实词嵌入是一种自监督的学习过程。因为大量的文本,大量的上下文信息,和独特的训练技巧,使得它可利用自身的信息作为标记进行内在自监督外在无监督的学习,从而实现了互联网问诊平台的知识自动化,其方法、思想可尝试用于实现其他更多信息过程的知识自动化。
  • 摘要:多标签学习是处理每个样本同时属于多个标签的数据.在多标签学习中,数据降维是一项重要而又具有挑战性的任务.特征选择是通过保持最大相关信息选取一个特征子集,它是一种高效的数据降维技术.考虑样本相似性的最小偏差,提出一种新的多标签特征选择方法.首先,由于多标签结构的特殊性可以得出一个样本相似性矩阵;其次,通过标签空间和特征空间的依赖关系构造优化目标函数;继而,提出特征排序算法和贪婪算法;最后,实验结果表明,提出的算法具有很好的特征选择性能.
  • 摘要:本文基于美国旧金山真实的路网和大量GPS轨迹数据,在完成地图匹配算法构建的基础上,对路段旅行时间进行计算和分析.实验所使用的ST-Matching算法,是一种在低采样频率下也能具有较高的匹配精度的算法地图匹配算法,本文首先对该算法的原理、构建方法和构建难点进行了详细的介绍分析,之后实现了该算法在旧金山路网的应用,在此基础上,计算在所采集的样本时间段内的旧金山路网交通的路段平均速度和路段旅行时间,运用TransCAD、GIS等软件对实验所得结果进行分析.
  • 摘要:本文采用手机数据和真实路网数据,构建了一个车联网信息网络模型,对模型的性质参数进行了测量,提出了模型的优化方法并进行了检验。本项工作可以对车联网发展的效益进行预估,提出的一种具体的基站加设方案,对现实中车联网设施建设具有一定指导作用。对前面获得的结论进行总结,①随着车联网的发展,信息覆盖的范围越来越广,提供信息越来越多,车联网能够更加有效地为用户服务;②车联网发展越成熟,少量的技术改善或者使用率的提高就可以使效率大量的增长;③车车通讯距离,车联网市场使用率能够对车联网覆盖范围起到主要影响;④通过加设基站可以大大地提升系统的信息传输效率。
  • 摘要:布雷斯悖论现象是一种在输运网络中广泛存在的现象.本篇论文研究基于实际出行需求的大规模交通网络中的布雷斯悖论现象,发现关闭低效边组相比关闭单条低效边可能会进一步提高运输效率.而低效边组的数量不容易估量,因此,本篇论文引入遗传算法,采用旧金山城市道路网络,利用遗传算法定位该城市道路网络中的低效边组,研究低效边组在旧金山路网中的分布规律,探索低效边组中边的组成情况,研究表明,关闭低效边组确实能够比关闭单条低效边更加优化现实路网运输效率,节省出行者的出行时间,在一定的交叉、变异概率下,能够得到基于该条件的相对满意解,这将为城市交通规划和城市交通控制提供有用的信息。
  • 摘要:随着中国经济的高速增长以及城市化的稳步推进,交通设施兴建和改善的速度远远赶不上人们日益增长的交通需求,交通拥堵问题日益突出.本文研究了一种基于执行依赖启发式动态规划(Action-Dependent Heuristic Dynamic Programming,ADHDP)的交通信号控制方法,并详细描述了ADHDP的算法原理,对基于ADHDP的交通信号控制器进行了设计,阐述了控制器的离线训练和在线学习的方法.在此基础上,本文对一个有4个入口通道,每个通道有2个车道,每个入口车道均放置有车辆检测器的两相位交叉口进行了仿真实验.实验结果表明,该方法与传统的定时控制方法相比,具备在线学习的能力,能够有效提高车辆平均速度,缓解交通拥堵.
  • 摘要:核心成员对网络社区中话题发展趋势及其参与者的舆论倾向具有十分重要的影响.本文提出一种识别网络社区中核心成员的方法,以此为基础构建基于核心成员行为的话题发展趋势预测模型.首先跨越社区中的板块限制构建话题的主题空间,基于个体的时空行为特征及其引发的后续行为对个体的影响力进行计算,并引入时间衰退因子平衡影响力的权重,可有效的解决传统意见领袖影响力模型受到话题、板块等时空领域限制的问题.然后对社区中的核心群体成员的行为进行分析,快速发现领域内的新生热点话题进而预测话题发展趋势及参与群体行为倾向性.从天涯各大社区中抽取自2004年到2013年6月份出现的所有关于油价讨论的话题构成本文数据集,对比分析本文提出的社区核心群体成员模型和典型意见领袖模型在人员识别及话题预测能力上的差异,并基于核心群体成员的行为特征对主题空间内的话题发展趋势进行预测.实验证明,本文提出的社区内核心群体能够跨越话题和板块的限制在较长时间周期内有效的帮助引导和预测话题走向;而意见领袖往往会因话题不同而发生变动,并不具备推动热点话题产生及预测话题趋势的能力.
  • 摘要:目前存在RDF图数据关键字查询研究主要集中在构造包含查询关键字的最小树/子图的图搜索算法,忽略了RDF数据间关联的语义信息,此外集中式处理方式也难以适应不断增长的RDF数据的查询要求.本文提出了一种基于语义关联的RDF关键字并行查询方法KPQRSA(Keyword parallel query over RDF data based on semantic association),结合本体OWL和概率模型设计评分函数来度量语义关联度,分布式数据库Hbase作为存储媒介,利用MapReduce计算框架并行查询:在Map阶段查询关键字节点得到语义关联密切的子簇,在Reduce阶段执行连接操作,并构造一系列关联的联通簇作为查询结果.实验验证,KPQRSA算法有助于提高查询结果的内容与关键字的相关度,保证结果的查准率,同时分布式存储和并行计算查询具有较好的可扩展性.
  • 摘要:校园一卡通服务记录的签到信息是一种自动签到信息,比起传统签到信息具有用户群体广泛、签到信息充足、签到成本低等特点.本文利用统计学习、数据挖掘等方法对校园一卡通服务中记录的自动签到信息进行充分利用,以详尽的理论为基础,设计了一款具有创新及实用意义的校园数据分析系统,在该系统中,主要分为云端服务器和手机应用器两个方面,包括校园场所拥挤程度查询及预测,学生情况评估,学生异常信息提醒,好友推荐等功能模块。
  • 摘要:海量交通信息的获取是实现智能交通的基础和关键技术.随着移动互联网的发展,社交媒体将成为获取交通信息的重要媒介.首先介绍了两种基于社交媒体内容的交通信息采集方法.然后分析、归纳了基于社交媒体的交通信息获取领域的研究进展.最后,展望了基于社交媒体的交通信息获取的发展趋势,研究发现,在从社交媒体和网页中采集、分析交通信息时,需利用自然语言理解技术、机器学习方法等,这是信息领域学者的强项。事实上,当前也主要是信息领域的学者从事该方面的研究。他们往往把自然语言处理和机器学习方法拿过来直接或稍加改动用于交通领域,虽然取得了初步的成果,但是仍有很大的提升空间,比如交通事件提取精度。通过多学科交叉,针对交通领域、具体交通问题,构建面向交通的网络交通信息提取方法的特定自然语言理解和机器学习方法,提高网络开源交通信息的准确性,是未来的发展趋势。
  • 摘要:经过多年的发展,非负矩阵分解已经成为一个相对成熟的数据分析手段,在很多领域都得到了广泛应用.本文对非负矩阵分解的初始化进行研究,提出了一种新的非负矩阵初始化方法(基于网络中心性的交替最小二乘初始化方法),并与其他初始化算法在人工数据集和真实数据集进行实验对比,实验结果表明,该初始化方法优于其他初始化算法,不同程度的提高了各种非负矩阵分解算法的准确度.
  • 摘要:分析了语言对于文化安全的重要性和国内外相关工作.在此基础上,讨论了传统濒危语言保护方法的局限性.以社会计算为新的研究视角,构建了以ACP为框架,以模因理论、情景分析方法和Multi-Agents(多智能体)技术为核心方法的濒危语言保护的社会计算模式.阐述了建立语言跨文化演变安全预警和濒危语言保护的人工社会演化模型、濒危语言预警保护方案动态优选等研究重点.本文工作可为语言学家和文化学家对濒危语言进行定量分析提供清晰的技术路线.
  • 摘要:社区问答系统(CQA)逐渐成为人们在互联网上获取信息的重要来源之一,然而CQA最主要的缺点之一就是答案质量不可控,有高质量的答案,也有无用的垃圾信息.因为问题和答案之间存在着巨大的语义距离,现存直接对问题和答案之间相关性进行衡量的方法往往难以取得满意效果.针对这个问题,提出了一种基于历史知识的社区问答答案质量评估方法,首先在历史问题中检索相似问题,再把它们对应的高质量答案作为参考,通过计算候选答案与这些高质量答案的相似度来评估它们的质量,从而避免了直接对问题和答案之间的相关性进行计算.基于约50万组Yahoo!Answers历史数据的实验证明该方法在MAP与MRR两个指标上都比直接计算问题和答案相关性的方法有明显优势,说明了该方法具有更高的准确率.
  • 摘要:针对目前有向图聚类算法存在的时延高、资源损耗大、迭代式数据处理性能较差等问题,提出一种基于Spark的结构相似度聚类并行算法(SparkSCAN):考虑网络中节点间的有向交互性,将结构相似的节点聚集起来:针对有向图数据规模巨大的特点,结合Spark框架,设计了适于分布式图计算的数据结构:并提出了一种分布式并行聚类算法,在确保聚类结果正确性的前提下,提高处理性能.实验结果表明,SparkSCAN有着良好的表现,能够高效地处理大规模有向图聚类问题.
  • 摘要:为探讨交通流速度-占有率关系,从速度-占有率关系本质出发,建立速度变化率表达式,推导了一组符合交通流基本特性且模型参数物理意义明确的窗口模型.考虑交通流实际情况,改进速度变化率并引入速度上下确界,建立了一系列窗口模型;列出了模型参数单独变化对窗口模型速度-占有率曲线的影响,用Levenberg-Marquardt方法对模型参数进行取值;最后分别采集美国加州高速公路数据进行模型验证.结果表明:模型3对2组数据的拟合优度分别为0.9642和0.9651.该模型能够较好地刻画低占有率状态下的交通流特性.
  • 客服微信

  • 服务号