首页> 外文学位 >Biomedical literature mining for pharmacokinetics numerical parameter collection.
【24h】

Biomedical literature mining for pharmacokinetics numerical parameter collection.

机译:生物医学文献挖掘,用于药代动力学数值参数收集。

获取原文
获取原文并翻译 | 示例

摘要

Model-based drug studies have been developing very fast recently. They require high quality pharmacokinetics (PK) parameter numerical data. However, most parameter measurements are still buried in the scientific literature. Traditional manual data extraction is too expensive to handle the exponentially growing number of publications. This thesis focuses on the application of text mining (TM) and machine learning (ML) for drug pharmacokinetics parameter data collection from the published literature. First, we explore the feasibility of TM on the extraction of drug PK parameter data from PubMed abstracts. Our method achieves higher precision and obtains rich information content. For the test drug Midazolam, it extracts 10 times more PK clearance data than the manually constructed commercial Drug Interaction Database (DiDB). Similar performance is obtained on additional test drugs. Following the success of TM on abstracts; we extended the methodology to full text articles and developed a literature mining pipeline for PK parameter data extraction, which is the first working approach to extract numerical data from full text articles, capable of processing both plain text and tabular data. The specific contributions of this thesis include: 1) A new PK ontology for entity template construction; 2) Comparison of NLP and machine learning algorithms for PK information retrieval; 3) Tabular data extraction; 4) PK information extraction from full text literature; 5) Multivariate nonlinear mixed model for PK parameter transformation.
机译:基于模型的药物研究最近发展很快。他们需要高质量的药代动力学(PK)参数数值数据。但是,大多数参数测量仍然埋藏在科学文献中。传统的手动数据提取过于昂贵,无法处理数量呈指数增长的出版物。本文重点研究文本挖掘(TM)和机器学习(ML)在已发表文献中用于药物药代动力学参数数据收集的应用。首先,我们探讨了TM在从PubMed摘要中提取药物PK参数数据的可行性。我们的方法达到了更高的精度并获得了丰富的信息内容。对于测试药物咪达唑仑,其提取的PK清除率数据是手动构建的商业药物相互作用数据库(DiDB)的10倍。使用其他测试药物可获得类似的性能。跟随TM在摘要上的成功;我们将该方法扩展到全文文章,并开发了用于PK参数数据提取的文献挖掘管道,这是从全文文章中提取数值数据的第一种工作方法,能够处理纯文本和表格数据。本论文的具体贡献包括:1)一种新的用于实体模板构建的PK本体; 2)比较NLP和机器学习算法以获取PK信息; 3)表格数据提取; 4)从全文文献中提取PK信息; 5)用于PK参数转换的多元非线性混合模型。

著录项

  • 作者

    Wang, Zhiping.;

  • 作者单位

    Indiana University.;

  • 授予单位 Indiana University.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2013
  • 页码 121 p.
  • 总页数 121
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号