深度强化学习系列论文,包括最基础的DQN,DQN模型改进,DQN算法改进,分层DRL,基于策略梯度的深度强化学习等等,论文基本源自顶会
2024/6/6 11:12:06 69.27MB 深度强化学习 DQN
1
Python强化学习实战:应用OpenAIGym和TensorFlow精通强化学习和深度强化学习英文原版含代码Hands-OnReinforcementLearningwithPython:MasterreinforcementanddeepreinforcementlearningusingOpenAIGymandTensorFlowSudharsanRavichandiran
2023/11/6 13:14:17 56.06MB 强化学习 深度学习 Gym Python
1
DRL-网球统一项目详情这是Udacity深度强化学习纳米学位的最终项目。
在这种环境下,两名特工控制球拍在球网上弹跳球。
如果探员将球击中网,则得到+0.1的奖励。
如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。
因此,每个特工的目标是保持比赛中的球权。
观察空间由8个变量组成,分别对应于球和球拍的位置和速度。
每个代理都会收到自己的本地观察结果。
有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。
该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在连续两次情节达到最高分后,在两个特工中均取得了最高分)这些是此Unity环境的一些细节:INFO:unityagents:'Academy'startedsuccessfully!UnityAcademyname:AcademyNumb
2023/8/17 2:09:36 157KB JupyterNotebook
1
深度强化学习的基本操作的程序。
2023/7/10 5:27:28 14.03MB 深度学习
1
深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。
如何解释深度强化学习优势产生的原因是理解技术的基本方法。
2023/6/10 6:45:09 3.25MB 深度学习 强化学习
1
深度强化学习DQN训练FlappyBird源代码,可以直接运行FlappyBirdDQN.py使用。
2023/6/6 21:21:20 106.52MB DL
1
Nature资源,无关深度强化学习论文,可免费下载,资源同享
2023/4/15 14:42:16 4.2MB 强化深度学习
1
深度强化学习在通信和网络中的使用:一项调查
2023/1/20 10:47:24 3.12MB 研究论文
1
李宏毅深度强化学习PPT(含机械学习课程对RL的简介)
2017/2/20 21:52:50 159.36MB 深度强化学习 李宏毅
1
深度强化学习是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL算法潜力无限,AlphaGo是目前该算法最成功的使用案例。
DRL算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。
深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,这本书共10章,首先以AlphaGo在围棋大战的伟大事迹开始,引起对人工智能发展和现状的引见,进而引见深度强化学习的基本知识。
然后分别引见了强化学习(重点引见蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。
最后引见了深度强化学习在不同领域的几个应用实例。
2019/3/8 21:17:23 145.91MB 深度强化学习
1
共 15 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡