Erlang（k）Bandit抽样过程

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

本文研究的对象是Bandit抽样过程，它包括两个基本模型：Bandit报酬过程和Bandit目标过程。Gittins对基于常见分布的Bandit抽样过程进行了研究，如BemouUi Bandit抽样过程和负指数Bandit抽样过程。本文在Gittins的基础上，利用动态规划向后归纳方法和贝叶斯方法，研究了目前在实际中应用更广泛的Bandit抽样过程。本文的主要研究内容如下：一、对几类特殊Bandit抽样过程的参数的后验分布、抽样值的条件分布和抽样报酬函数等进行了计算，讨论了它们的单调性质。二、研究了抽样值服从Erlang(k)分布的Erlang(k)Bandit报酬过程的最优决策问题，构造了计算描述最优选择的平衡值序列的算法，并研究了过程Gittins指数和平衡值序列的渐近性质，这有效解决了Erlang(k)Bandit报酬过程的最优决策问题。将Bandit报酬过程基于的分布从负指数分布推广至Erlang(k)分布，是对Bandit报酬过程的补充和推广。三、研究了抽样值服从Erlang(2)分布的Erlang(2)Bandit目标过程的最优决策问题，提出了计算描述最优选择的平衡值序列的算法。将Bandit目标过程基于的分布从负指数分布推广至Erlang2)分布，是对Bandit目标过程的补充和推广。四、到目前为止，大多数研究Bandit过程的文献没有考虑抽样时间间隔，均假设一致折扣或几何折扣，并不符合某些实际情况。本文对考虑实时折扣，抽样时间间隔服从负指数分布，抽样值服从Erlang(2)分布，允许在任意时刻跳转的Bandit报酬过程进行推导和计算，讨论了过程Gittins指数的单调性质，构造了计算过程最优停止时间的算法。考虑服从负指数分布的抽样时间间隔，能使Bandit报酬过程更符合实际应用。同时，将抽样值服从的分布从负指数分布推广至目前在实际中应用更为广泛的Erlang(2)分布，也是对Bandit报酬过程的补充和推广。

著录项

作者
梁友;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科概率论与数理统计
授予学位硕士
导师姓名邹捷中;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类抽样理论、频率分布;贝叶斯统计;
关键词
Bandit抽样过程; Gittins指数; 平衡值; 贝叶斯方法; Erlang分布; 抽样值; 抽样报酬函数;

相似文献

中文文献
外文文献
专利

1. 单臂Erlang(k) Bandit报酬过程 [J] . 邹捷中 ,邓倩 ,梁友 . 电力科学与技术学报 . 2006,第004期
2. 考虑抽样时间间隔的特殊单臂Bandit报酬过程 [J] . 邹捷中 ,梁友 . 铁道科学与工程学报 . 2006,第006期
3. 对新产品开发的最优价值分析--基于Bandit过程的模型研究 [J] . 谢武 ,陈晓剑 ,巩国顺 . 预测 . 2003,第004期
4. Bandit过程及其应用 [J] . 王熙逵 . 经济数学 . 2001,第004期
5. 带借贷利率和门槛分红策略的Erlang(n)盈余过程（英文） [J] . 赵一惠 ,罗葵 ,肖立群 . 应用数学 . 2018,第3期
6. 论审核过程中的合理抽样 [C] . Liu Fengxin ,刘凤新 . 第三十一届中国（天津）2017‘IT、网络、信息技术、电子、仪器仪表创新学术会议 . 2017
7. Erlang(2)风险模型在多发点过程上的推广 [A] . 徐浩 . 2015

Erlang（k）Bandit抽样过程

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅