第一个书签之前
摘要
Abstract
Content
1 绪论
1.2 国内外研究现状
1.2.1 搜索引擎产品研究现状
1.2.2 搜索引擎架构研究现状
1.2.3 搜索引擎结果排序方法研究现状
1.3 本论文的主要工作和组织结构
1.3.1 主要工作
1.3.2 组织结构
2.1.1 Apache Lucene 介绍
2.1.2 Elasticsearch 介绍
2.2 Thrift 介绍
2.3 树模型介绍
2.3.1 CART 介绍
2.3.2 Boosting Tree 介绍
2.3.3 XGBoost 介绍
2.5 本章小结
3 基于 Elasticsearch 的移动搜索引擎
3.1 数据介绍
3.2 系统架构以及主模块介绍
3.3 接口设计说明
3.3.1 各模块参数介绍
3.3.2 接口介绍
3.4 召回模块
3.4.1 Elasticsearch 子模块
3.4.2 查询分析
3.4.3 索引建立
3.4.4 搜索结果召回
3.5 重排序模块
3.5.1 缓存设计
3.5.2 并行预测
4 基于 XGBoost 的搜索结果排序模型
4.2 特征工程介绍
4.2.2 人工选择特征
4.2.3 数据规范化简介
4.2.4 独热编码简介
4.2.5 用先验算法挑选特征
4.3 模型的评价标准
4.4 交叉验证介绍
4.5 模型参数调节
4.6 本章小结
5.1 实验环境以及设置
5.2 性能测试
5.2.1 Apache Bench 介绍
5.2.2 TP 指标介绍
5.3 算法效果
5.3.2 Elasticsearch 默认排序与加入模型加成后排序效果的对比
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
致谢
攻读硕士期间主要成果
参考文献
山东科技大学;