应用Python进行强化学习实践,Hands-OnReinforcementLearning-SudharsanRavichandiran(带书签PDF+代码),434页材料。
2021/2/11 21:17:52 55.92MB python 强化学习 代码 带书签PDF
1
运用强化学习进行赛车的自动驾驶功能实现,具体运用DDPG算法
2021/6/22 4:31:53 14.31MB DQN RL
1
Sutton课本中的小车爬山例程,强化学习中的基础仿真实验程序。
2015/11/3 19:39:47 6KB 强化学习 C++ mountain car
1
强化学习中的一个重要里程碑就是Q学习算法,使用matlab进行单步Q学习无妨碍路径规划仿真,设学习次数为200.
2016/5/13 18:10:12 4KB matlab Q-learning 仿真 路径规划
1
Q-learning是一种模型有关的强化学习方法,本文档使用Q-learning做了一个简单的搜索任务,有助于初学者理解强化学习,理解Q-learning.
2017/9/19 12:06:16 3KB 强化学习 模型无关 Q-learning
1
深度强化学习是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL算法潜力无限,AlphaGo是目前该算法最成功的使用案例。
DRL算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。
深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,这本书共10章,首先以AlphaGo在围棋大战的伟大事迹开始,引起对人工智能发展和现状的引见,进而引见深度强化学习的基本知识。
然后分别引见了强化学习(重点引见蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。
最后引见了深度强化学习在不同领域的几个应用实例。
2019/3/8 21:17:23 145.91MB 深度强化学习
1
处理网格迷宫问题的MATLAB强化学习程序合集:包括使用Q_learing算法、Sarsa算法以及Sarsa-Lambda算法处理网格迷宫问题。
“IthoughtwhatI'ddowasI'dpretendIwasoneofthosedeaf-mutes,orshouldI?”
1
强化学习基础算法引见+Pytorch代码(相信我,绝对是你想要的)
2022/9/8 12:26:31 15.6MB 强化学习 pytorch
1
强化学习在自然言语处理中的应用,黄民烈老师的PPT文档!
2022/9/6 12:57:45 9.27MB 强化学习 NLP
1
摇臂硬币机-强化学习(greed贪婪算法,softmax更新算法)
2022/9/6 10:26:21 14KB 强化学习
1
共 79 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡