awesome-game-ai:多智能体强化学习的AwesomeGameAI材料
1
我搜集的电梯调度算法,论文。
包括:强化学习算法,LOOK调度算法,最短寻道算法,遗传算法,滚动优化算法,模糊控制,预定电梯群控算法,基于现场总线的算法。
希望免除大家搜索之苦。
2021/3/26 1:31:03 3.9MB 电梯调度算法 电梯算法 论文 资料
1
李宏毅深度强化学习PPT(含机械学习课程对RL的简介)
2017/2/20 21:52:50 159.36MB 深度强化学习 李宏毅
1
第二版答案,不是第一版拿来充数的,第二章到第十二章,只要这么多
2017/1/16 1:57:31 1.62MB 机器学习 强化学习
1
模仿学习此仓库包含一些强化学习算法的简单PyTorch实现:优势演员评论家(A2C)的同步变体近端策略优化(PPO)-最受欢迎的RL算法,,,策略上最大后验策略优化(V-MPO)-DeepMind在其上次工作中使用的算法(尚不起作用...)行为克隆(BC)-一种将某些专家行为克隆到新策略中的简单技术每种算法都支持向量/图像/字典观察空间和离散/连续动作空间。
为什么回购被称为“模仿学习”?当我开始这个项目并进行回购时,我认为模仿学习将是我的主要重点,并且无模型方法仅在开始时用于培训“专家”。
但是,PPO实施(及其技巧)似乎比我预期的花费了更多时间。
结果,现在大多数代码与PPO有关,但是我仍然对模仿学习感兴味,并打算添加一些相关算法。
当前功能目前,此仓库包含一些无模型的基于策略的算法实现:A2C,PPO,V-MPO和BC。
每种算法都支持离散(分类,伯努利,GumbelSoftmax)和连续(贝塔,正态,tanh(正态))策略分布以及矢量或图像观察环境。
Beta和tanh(Normal)在我的实验中效果最好(在BipedalWalker和Huma
2016/4/5 15:54:46 11.42MB
1
强化学习算法,完成强化学习对网络资源的分配,目的是频谱利用最大化
2018/10/6 14:56:49 6KB 强化学习算法
1
强化学习matlab源代码很少见的源代码,详细引见Q学习的编程过程。
2020/4/18 1:23:45 2KB 强化学习 matlab 源代码
1
MATLAB实现的强化学习程序,用于一级倒立摆控制。
程序调试正常运转,请放心下载。
2017/11/6 14:56:20 4KB MATLAB 强化学习 倒立摆 一级倒立摆
1
该框架利用多核CPU处理能力,用于训练和评估加强学习Agent。
Coach包含一些领先的加强学习算法的多线程实现,适用于各种游戏和机器人环境。
它能够在台式计算机上高效地训练强化学习Agent,而无需任何额外的硬件。
2016/10/25 7:50:55 41.85MB Python开发-机器学习
1
应用Python进行强化学习实践,Hands-OnReinforcementLearning-SudharsanRavichandiran(带书签PDF+代码),434页材料。
2021/2/11 21:17:52 55.92MB python 强化学习 代码 带书签PDF
1
共 68 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡