您现在的位置: 首页> 研究主题> 基因表达数据

基因表达数据

基因表达数据的相关文献在2001年到2022年内共计249篇,主要集中在自动化技术、计算机技术、预防医学、卫生学、基础医学 等领域,其中期刊论文203篇、会议论文8篇、专利文献646299篇;相关期刊115种,包括福州大学学报(自然科学版)、四川师范大学学报(自然科学版)、生物信息学等; 相关会议7种,包括2009全国博士生学术会议暨网络化控制系统新理论与新实践学术研讨会、2006年中国科学院智能计算与生物信息学学术研讨会、第一届Agent理论与应用学术会议等;基因表达数据的相关文献由540位作者贡献,包括王文俊、蔡瑞初、陆慧娟等。

基因表达数据—发文量

期刊论文>

论文:203 占比:0.03%

会议论文>

论文:8 占比:0.00%

专利文献>

论文:646299 占比:99.97%

总计:646510篇

基因表达数据—发文趋势图

基因表达数据

-研究学者

  • 王文俊
  • 蔡瑞初
  • 陆慧娟
  • 郝志峰
  • 陈晓云
  • 温雯
  • 张军英
  • 许柏炎
  • 赵宇海
  • 陈炳丰
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 秦喜文; 王芮; 张斯琪
    • 摘要: 乳腺癌基因数据的分类研究在临床医学上具有重要意义。针对基因数据的结构复杂、高维小样本等特点,提出一种最大相关最小条件冗余和深度级联森林结合的基因数据分类方法。选取博德基因研究所乳腺癌基因表达数据集,共98个数据作为样本,每个样本包含1 213个特征基因。首先对数据进行标准化处理,然后利用最大相关最小条件冗余选取特征子集,最后使用深度级联森林对特征子集进行分类。将随机森林、支持向量机和BP神经网络作为对比方法。结果表明,所提出的最大相关最小条件冗余和深度级联森林结合方法的最佳分类准确率达到93.78%,明显优于其他方法。该方法能有效提高乳腺癌基因数据的分类准确率,对基于基因数据的乳腺癌分类具有重要的理论意义与实用价值。
    • 摘要: 评“肿瘤免疫微环境中免疫细胞间通讯景观探究”邹权单细胞测序技术可同时获得组织在单细胞层面的细胞身份信息及基因表达数据。该技术特点为利用生物信息学手段系统预测细胞间信息交流网络提供了前所未有的机遇。因此,系统地推断组织及微环境中细胞之间信号通讯网络及功能机制迅速成为细胞生物学研究的热点。
    • 韩磊; 黄瑞龙; 范文静; 叶明全
    • 摘要: 肿瘤基因表达数据具有高维小样本、类别分布不平衡等特点,导致传统方法对其准确分类面临新的挑战。为此,本文提出一种基于Weka平台和代价敏感特征选择的基因表达数据分类方法。首先,对实验中所采用的6组肿瘤基因表达数据进行标准化预处理;然后,通过Weka平台中代价敏感特征选择方法和非代价敏感特征选择方法进行特征选择;最后采用4种分类器进行分类效果对比。实验结果表明,基于代价敏感特征选择的基因表达数据分类方法能够获取较高的分类性能。
    • 侯婧雯; 田野; 王宗辉; 郑睿; 李若锦; 刘艳
    • 摘要: DNA微阵列分类技术是近年来可以有效诊断癌症的重要手段,而随着生物信息学和分子生物学的快速发展,基因表达谱的维度上升呈现出了高冗余和高噪音的特点。在微阵列表达数据中只有少数相关基因在分类中是有意义的,不相关基因通过隐藏相关基因会导致分类准确率降低。因此,选择癌症特征基因的有效方法至关重要。本文总结了目前在癌症基因表达数据领域应用的自然启发式特征选择方法,进一步探讨其未来的发展趋势,增进读者对自然启发式特征选择方法的了解。
    • 马卫; 朱娴
    • 摘要: 基因表达数据是由DNA微阵列实验产生的大规模数据矩阵,双聚类算法是挖掘数据矩阵中具有较高相关性的子矩阵,能有效地提取生物学信息.针对当前多目标双聚类优化算法易于陷入早熟和局部最优解等问题,论文提出了基于逻辑运算的离散人工蜂群优化双聚类算法(LOABCB算法),一方面引入人工蜂群算法增强双聚类的全局寻优能力,另一方面通过逻辑运算邻域搜索策略寻找最优双聚类,提高搜索效率.采用基因表达数据的酵母细胞数据集进行实验,结果表明论文算法能够获得实验效果优的具有生物意义的双聚类.
    • 李婧惟; 刘艳; 陆震
    • 摘要: 目的 研究类不平衡是否会给基因表达数据的类别预测带来额外挑战,通过公开数据集评估7种分类器在不同类平衡比例数据上的表现,旨在为后续研究提供理论基础.方法 在真实数据集上按不同比例抽取样本组成训练集(阴性样本量Nn=10,阳性样本量Np=10,15,20,30,35;Nn=15,Np=5,10,15,25,30)和测试集(Nn=20,Np=20),组成10组新数据集,并选取常用7种分类算法(SVM、C4.5、NB、RF、KNN、AdaBoost、Bagging)对10组新数据集进行分析,比较单次抽样分类与100次抽样平均的分类效果.结果 随着数据集中阳性样本量的增加,分类算法整体灵敏度呈上升趋势,而特异度呈下降趋势.结肠癌数据集中,AdaBoost、NB和RF算法表现较好,支持向量机表现较差且不稳定.在白血病数据集中,NB算法整体表现最优且稳定,AdaBoost、C4.5和RF算法分类效果较好但波动较大.结论 基因表达数据集中类平衡比例、数据特征和分类算法类别均会影响类别预测结果,且单次分析结果具有偶然性,复现性较差,故分析类不平衡数据时应结合类分布比例谨慎选择适当的算法.
    • 陆震; 刘艳; 李婧惟
    • 摘要: 目的 对基于降噪风险基因网络的生存风险基因筛选算法CoxLASSO-ISIS-N的表现作出评价,并与其他5种算法进行比较,分析算法的优劣,以期为高维基因表达数据的生存风险基因筛选提供一种新的思路.方法 针对带有噪声的高维基因表达数据的生存风险基因筛选问题,分别利用模拟数据和真实数据,对6种算法(CoxLASSO、CoxLASSO-N、CoxLASSO-SIS、CoxLASSO-SIS-N、CoxLASSO-ISIS和CoxLASSO-ISIS-N)进行比较,分析算法的优劣.结果 算法Cox-LASSO-ISIS-N在模型的整体估计效果(LR和CS)、解释信息的比例(R2)以及一致性(CI)上均表现最优且最稳定.结论 基于降噪风险基因网络的生存风险基因筛选算法CoxLASSO-ISIS-N可以对带有噪声的高维基因表达数据实现降噪,从而更精确地筛选生存风险基因,较好地反映死亡或其他结局发生与高维基因表达数据之间的关系,为临床诊断以及预后管理提供依据.
    • 常巧珍; 曹隽喆; 顾宏; 李丹
    • 摘要: 针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准确度及聚类性能.在多个基因表达数据集上的实验结果表明,所提算法得到了更接近真实表达值的填补结果及更紧凑的聚类效果,且聚类结果具有统计显著性.
    • 崔衍; 薛源
    • 摘要: 基因表达数据隐藏着丰富的生物信息,双聚类算法是挖掘这些生物信息的有效手段.双聚类算法一直被认为是一个NP-hard问题,而蝙蝠算法在解决NP-hard问题上有很大的优势.本文在蝙蝠算法的基础上提出了一种基于改进蝙蝠算法的双聚类算法(Bi-clustering based on Improved Bat Algorithm,BIBA).通过在酵母细胞基因数据集上的实验表明BIBA算法能够得到MSR值更小、体积更大的双聚类.
    • 刘飞; 王天丽; 高红艳; 卫泽刚; 张磊; 钱郁
    • 摘要: 目的 提出一种利用共有基因模块构建大规模基因调控网络算法(Common Gene Mod-ules Network,CGMN),有效降低传统基因调控网络构建基因节点规模较大的基因调控网络(包含几百个,甚至几千个基因节点)时时间复杂度过大的缺陷.方法 CGMN算法从基因表达数据出发,采用6种常用聚类算法把基因表达模式相似的基因聚类成功能模块,找出6种聚类方法的共有模块,并将其作为功能模块基因节点,采用局部贝叶斯网络(Local Bayesian Network,LBN)算法构建功能模块基因-基因调控网络.结果 与结论 大规模细胞周期基因表达数据集上仿真实验结果表明,搜索共有模块压缩基因节点数目策略,能够有效降低大规模基因调控网络重构时间复杂度,且验证了CGMN算法构建大规模基因调控网络的有效性.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号