增强学习中,Agent可以通过不断的游走来发现未知环境,通过不断更新Q矩阵实现最终问题的解决
A.对
B.错
正确答案是A
扫描二维码免费使用微信小程序搜题/刷题/查看解析。
版权声明:本文由翰林刷题小程序授权发布,如需转载请注明出处。
本文链接:https://20230611.cn/post/10268122.html
上一篇:对公印鉴挂失到期处理,法人本人前往网点办理,需要上传的影像有( )
下一篇:手动火灾报警按钮比探测器报警更紧急,一般不需要确认