模仿学习此仓库包含一些强化学习算法的简单PyTorch实现:优势演员评论家(A2C)的同步变体近端策略优化(PPO)-最受欢迎的RL算法,,,策略上最大后验策略优化(V-MPO)-DeepMind在其上次工作中使用的算法(尚不起作用...)行为克隆(BC)-一种将某些专家行为克隆到新策略中的简单技术每种算法都支持向量/图像/字典观察空间和离散/连续动作空间。
为什么回购被称为“模仿学习”?当我开始这个项目并进行回购时,我认为模仿学习将是我的主要重点,并且无模型方法仅在开始时用于培训“专家”。
但是,PPO实施(及其技巧)似乎比我预期的花费了更多时间。
结果,现在大多数代码与PPO有关,但是我仍然对模仿学习感兴味,并打算添加一些相关算法。
当前功能目前,此仓库包含一些无模型的基于策略的算法实现:A2C,PPO,V-MPO和BC。
每种算法都支持离散(分类,伯努利,GumbelSoftmax)和连续(贝塔,正态,tanh(正态))策略分布以及矢量或图像观察环境。
Beta和tanh(Normal)在我的实验中效果最好(在BipedalWalker和Huma
2016/4/5 15:54:46 11.42MB
1
PCA结合马氏距离,还要必须大于50个字,凑合吧,次要是PCA结合马氏距离进行的。
2020/2/9 17:57:42 1KB PCA 马氏距离
1
禁忌搜索算法处理旅行商问题(TSP),求解全国31个省会城市的一次历遍的最短距离
2017/6/6 20:53:18 332KB 禁忌搜索 旅行商
1
用sinc插值和最近领域插值完成距离弯曲校正的完整程序和几篇弯曲校注释章
2020/4/18 1:23:45 1.43MB 距离弯曲 sinc插值 校正
1
测试驱动开发》(中文版)设想把编程看成是转动曲柄从井里提一桶水上来的过程。
如果水桶比较小,那么仅需一个能自由转动的曲柄就可以了。
如果水桶比较大而且装满水,那么还没等水桶全部被提上来你就会很累了。
你需要一个防倒转的装置,以保证每转一次可以休息一会儿。
水桶越重,防倒转的棘齿相距越近。
测试驱动开发中的测试程序就是防倒转装置上的棘齿。
一旦我们的某个测试程序能工作了,你就知道,它从现在开始并且以后永远都可以工作了。
相比于测试程序没有通过,你距离让所有的测试程序都工作又近了一步。
现在我们的工作是让下一个测试程序工作,然后再下一个,就这样不断进行。
分析表明,要编程解决的问题越难,每次测试所覆盖的范围就应该越小。
2020/6/15 1:32:45 35.27MB 测试驱动开发 带书签 完整中文版
1
基于物联网的智能家居监控系统设计,宋晓娜,李沛,为实现智能家居,设计了一种基于物联网的智能家居监控系统。
该系统在硬件设计上采用模块化设计,可实现远距离射频通信和近程控制
2019/1/26 12:32:10 463KB 物联网
1
为了满足供应链物流的不同需求,考虑多种车型、车辆容量、车辆油耗、车辆最大配送距离等约束条件,以最小油耗、最短配送距离为目标,建立多车型供应链物流运输调度模型(Multi-TypeVehicleRoutingProbleminSupplyChain,MTVRPSC),并提出一种混沌烟花算法求解该模型。
该算法以烟花算法为核心,提出一种编解码策略实现连续空间到MTVRPSC离散空间的映射,重新定义算法的顺应度函数、顺应度值和顺应度的比较方法,并采用混沌初始化策略和混沌搜索策略来增强算法收敛效果。
实验结果表明,所提出的算法在求解MTVRPSC时具有较强的寻优能力和稳定性
2017/11/4 1:22:03 1.64MB 算法
1
android传感器运用的demo,包括光线传感器,加速度传感器,距离传感器和方向传感器。
2017/3/22 23:57:55 7.46MB android 传感器
1
PSO算法是从这种生物种群行为特征中得到启发并用于求解优化问题的,算法中每个粒子都代表问题的一个潜在解,每个粒子对应一个由适应度函数决定的适应度值。
粒子的速度决定了粒子移动的方向和距离,速度随自身及其他粒子的移动经验进举动态调整,从而实现个体在可解空间中的寻优。
2016/2/22 11:30:53 22KB pso-pid
1
第一讲:天文参数的计算。
计算日地距离、太阳赤纬角、真太阳时时差、太阳天顶角、太阳高度、太阳时角等第二讲:绝对于斜面的太阳位置计算第三讲:地外水平面辐射量计算第四讲:地外斜面辐射量的计算第五讲:地表斜面上辐射量的计算及两次问题解答
2017/2/15 11:54:20 542KB 太阳辐射计算
1
共 843 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡