第1章 绪论
1.1. 选题背景及研究意义
1.2. 国内外研究现状
1.2.1 卷积神经网络的压缩
1.2.2 卷积神经网络的移动端部署解决方案
1.3. 目前存在的主要问题
1.4. 本文主要内容
第2章 卷积神经网络基础
2.1. 引言
2.2. 符号约定
2.3. 人工神经网络
2.3.1 单个神经元
2.3.2 人工神经网络的基本结构
2.4. 卷积神经网络
2.4.1 卷积层
2.4.2 池化层
2.4.3 非线性激活层
2.4.4 全连接层
2.5. 本章小结
第3章 BitStream: 二值神经网络的移动端加速算法
3.1. 引言
3.2. 二值神经网络简介
3.3. 二值卷积的加速
3.3.1 im2col卷积算法
3.3.2 二值内积的快速计算
3.4. 传统二值神经网络的实现及其问题
3.5. BitStream:二值神经网络的移动端加速算法
3.5.1 数据排布
3.5.2 比特压缩
3.5.3 二值卷积
3.5.4 二值池化
3.6. 算法分析
3.6.1 内存消耗
3.6.2 内存访问
3.6.3 计算复杂度
3.7. 实验结果
3.7.1 在不同卷积层上的实验
3.7.2 在不同网络上的实验
3.7.3 内存占用
3.8. 本章小结
第4章 量化神经网络的移动端加速方案
4.1. 引言
4.2. 算法整体框架
4.3. 矩阵A和B的打包算法
4.3.2packb:矩阵B的打包算法
4.4.micro_kernel算法
4.4.1 现代CPU中的SIMD技术
4.4.2 基于SIMD的micro_kernel计算算法
4.5. 实验结果
4.6. 本章小结
第5章 QEngine: 移动端深度学习前向推理框架
5.1. 引言
5.2. QEngine整体框架
5.3. QEngine中的计算图设计
5.3.1 计算数据流
5.3.2 节点和算子
5.3.3 计算图执行引擎
5.4. QEngine中的计算图优化
5.4.1 算子融合
5.4.2 内存管理
5.4.3 算法的自动化选择
5.5. 实验结果
5.6. 本章小结
结论
参考文献