关于他
西部世界
西蒙的个人博客
首页
归档
关于
订阅
关于他
昵称:西蒙
教育:香港科技大学
工作:腾讯MIG-算法工程师
兴趣:机器学习、强化学习、量化投资等等
交流:cheersyouran[at]yeah[dot]net
分类
技术
5
标签
Alphago
强化学习
机器学习
凸优化
策略梯度
最近文章
TRPO
置信域算法
约束优化
Alphago的原理
强化学习——从随机策略梯度到确定性策略梯度
友情链接
site-name1
site-name2
site-name3