关于他

西蒙的个人博客

关于他

昵称：西蒙
教育：香港科技大学
工作：腾讯MIG-算法工程师
兴趣：机器学习、强化学习、量化投资等等
交流：cheersyouran[at]yeah[dot]net

技术5

Alphago 强化学习机器学习凸优化策略梯度

TRPO
置信域算法
约束优化
Alphago的原理
强化学习——从随机策略梯度到确定性策略梯度

Copyright © 2019 西部世界. Powered by Hexo. Theme by Cho.