首页> 中文期刊>计算机应用 >PDF文件信息的抽取与分析

PDF文件信息的抽取与分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

PDF文件网络信息抽取的重要资源.通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论.这将有助于根据需要进一步抽取PDF文件信息.

著录项

来源
《计算机应用》|2003年第12期|145-147|共3页
作者
李珍; 田学东;
展开▼
作者单位

河北大学,数学与计算机学院,河北,保定,071002;

河北大学,数学与计算机学院,河北,保定,071002;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.43;
关键词
信息抽取; PDF文件; 文本信息分析;

相似文献

中文文献
外文文献
专利

1. 电子病历信息抽取可视化分析 [J] . 娄培 ,方安 ,赵琬清 . 医学信息学杂志 . 2021,第004期
2. 面向历史灾害地震的Web信息精确抽取与分析方法 [J] . 文鑫涛 ,郑通彦 ,王钟浩 . 中国地震 . 2021,第004期
3. 基于开放评测的临床信息抽取分析 [J] . 赵琬清 ,胡佳慧 ,娄培 . 医学信息学杂志 . 2020,第010期
4. 基于深度学习的社交媒体情感信息抽取及其在灾情分析中的应用研究 [J] . 杨腾飞 ,解吉波 ,闫东川 . 地理与地理信息科学 . 2020,第2期
5. 国内基于本体的信息抽取研究现状与热点分析 [J] . 阳广元 . 图书馆理论与实践 . 2017,第005期
6. 信息抽取的科学知识图谱分析 [C] . 李善青 . 第六届科技信息资源共享促进国际会议 . 2011
7. 基于非结构化文档数据的抽取与分析系统的信息抽取 [A] . 霍焰 . 2011

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号