Visión general

Bibliografía (experimentos multi-armed bandit)

[1] Berry, DA (2010) "Adaptive clinical trials, the promise and the caution" (Ensayos clínicos de diseño adaptativo: promesas y precauciones). Journal of Clinical Oncology, 29, 606-609.

[2] Chapelle O, Li L. (2011) "An empirical evaluation of Thompson sampling" (Evaluación empírica del muestreo de Thompson). Neural Information Processing Systems.

[3] Kaufmann E, Korda N, Munos R (2012) Thompson sampling: An asymptotically optimal finite time analysis (Muestreo de Thompson: análisis de tiempo finito óptimo asintótico).

[4] May BC, Korda NL, Lee A y Leslie, DS (2012) "Optimistic Bayesian sampling in contextual-bandit problems" (Muestreo bayesiano optimista en problemas multi-armed bandit contextuales). Journal of Machine Learning Research, 13 2069--2106.

[5] Scott, SL "A modern Bayesian look at the multi-armed bandit" (Una mirada bayesiana moderna a los experimentos multi-armed bandit). Applied Stochastic Models in Business and Industry, 26, 639--658.

[6] Whittle P (1979) Discussion of "Bandit processes and dynamic allocation indices" (Debate sobre los procesos multi-armed bandit y los índices de asignación dinámica). Journal of the Royal Statistical Society, Series B, 41, 165.

¿Te ha sido útil este artículo?
¿Cómo podemos mejorar esta página?