Aprendizaje por refuerzo con opciones y función de refuerzo universal
Texto / recurso
Acceso abierto
Texto / recurso
RI ITBA
"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la ...
Idioma es
Acceso abiertoRuta libre sin proxy. Acceso recomendado cuando no hay suscripción activa.
Open Access