検索
検索をクリア
検索終了
Google アプリ
メインメニュー
true

概要

参考文献(多腕バンディット)

[1] Berry、DA(2010 年)、「Adaptive clinical trials, the promise and the caution」、Journal of Clinical Oncology29、606-609

[2] Chapelle O、Li L(2011 年)、「An empirical evaluation of Thompson sampling」、Neural Information Processing Systems

[3] Kaufmann E、Korda N、Munos R(2012 年)、Thompson sampling: An asymptotically optimal finite time analysis

[4] May BC、Korda NL、Lee A、Leslie、DS(2012 年)、「Optimistic Bayesian sampling in contextual-bandit problems」、Journal of Machine Learning Research13 2069--2106

[5] Scott、SL、「A modern Bayesian look at the multi-armed bandit」、Applied Stochastic Models in Business and Industry26、639--658

[6] Whittle P(1979 年)、「Bandit processes and dynamic allocation indices」に関する考察、Journal of the Royal Statistical Society、Series B41、165

この記事は役に立ちましたか?
改善できる点がありましたらお聞かせください。