首页> 中文学位 >基于Spark的会话语料库管理系统

【6h】

基于Spark的会话语料库管理系统

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

1 绪论

1.1 项目研究背景

1.2 研究目的和意义

1.3 国内外研究现状

1.3.1 国内研究现状

1.3.2 国外研究现状

1.4 论文结构

2 会话语料库特点与相关技术

2.1 会话语料库特点

2.2 Hadoop平台架构

2.2.1 技术背景

2.2.2 分布式文件系统HDFS

2.2.3 Map/Reduce计算框架

2.3 Spark计算框架

2.3.1 技术背景

2.3.2 集群模型

2.3.3 RDD计算框架

2.3.4 键值对操作

2.4 本章小结

3 系统需求分析和设计

3.1 需求分析

3.1.1 功能性需求

3.1.2 非功能性需求分析

3.2 架构设计

3.3 HDFS存储模块

3.3.1 原始语料存储模型概述

3.3.2 转换语料存储模型概述

3.3.3 HDFS存储模型概述图3.5 HDFS中结构图

3.4 查询模块

3.4.1 XPath查询解析

3.4.2 XQuery查询解析

3.4.3 XML编码方案

3.4.4 Spark RDD操作查询

3.5 本章小结

4 基于Spark的分布式查询

4.1 传统查询

4.1.1 传统查询概述

4.1.2 存在问题

4.2 分布式查询

4.2.1 分布式查询概述

4.2.2 分布式查询的Spark实现

4.2.3 分布式查询和传统查询对比

4.3 本章小结

5 系统的实现与测试

5.1 系统实现

5.1.1 Hadoop集群搭建

5.1.2 Spark集群搭建

5.1.3 HDFS存储模块实现

5.1.4 分布式查询模块实现

5.2 系统测试

5.2.1 集群容错性测试

5.2.2 查询模块功能测试

5.3 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

附录

致谢

展开▼

著录项

作者
王松;
展开▼
作者单位

河北师范大学;

展开▼
授予单位河北师范大学;
学科计算机技术
授予学位硕士
导师姓名董东;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 U46TV9;
关键词

相似文献

中文文献
外文文献
专利

1. 基于语料库的会话打断现象多因素分析 [J] . 张歆雅 ,杨潇然 ,田一洺 . 考试与评价:大学英语教研版 . 2021,第003期
2. 主体间性话语模式的重构——以基于语料库的医患会话为例 [J] . 张美云 ,刘艳茹 . 海南大学学报（人文社会科学版） . 2021,第001期
3. 基于语料库的学生会话中反馈语习得初探 [J] . 秦国丽 ,程玲 . 牡丹江教育学院学报 . 2018,第004期
4. 基于会话语料库的日语性别角色语言自动提取方法论 [J] . 孙昊 . 日语知识 . 2018,第001期
5. 基于医患会话语料库的模糊限制语研究 [J] . 吴会娟1 . 合肥学院学报 . 2018,第001期
6. 会话分析理论在口译语料库建设中的应用研究 [C] . 邹兵 ,杨冬敏 . 第十四届全国科技翻译研讨会 . 2011
7. 英语学术口语中的打断——基于密歇根英语学术口语语料库办公时间师生互动会话的研究 [A] . 王贤 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号