模仿学习此仓库包含一些强化学习算法的简单PyTorch实现:优势演员评论家(A2C)的同步变体近端策略优化(PPO)-最受欢迎的RL算法,,,策略上最大后验策略优化(V-MPO)-DeepMind在其上次工作中使用的算法(尚不起作用...)行为克隆(BC)-一种将某些专家行为克隆到新策略中的简单技术每种算法都支持向量/图像/字典观察空间和离散/连续动作空间。
为什么回购被称为“模仿学习”?当我开始这个项目并进行回购时,我认为模仿学习将是我的主要重点,并且无模型方法仅在开始时用于培训“专家”。
但是,PPO实施(及其技巧)似乎比我预期的花费了更多时间。
结果,现在大多数代码与PPO有关,但是我仍然对模仿学习感兴味,并打算添加一些相关算法。
当前功能目前,此仓库包含一些无模型的基于策略的算法实现:A2C,PPO,V-MPO和BC。
每种算法都支持离散(分类,伯努利,GumbelSoftmax)和连续(贝塔,正态,tanh(正态))策略分布以及矢量或图像观察环境。
Beta和tanh(Normal)在我的实验中效果最好(在BipedalWalker和Huma
2016/4/5 15:54:46 11.42MB
1
自动合并动作如果已批准拉取请求且状态检查已通过,此操作将自动合并拉取请求。
GitHub的分支保护规则用于确定特定分支能否允许自动合并。
给定以下条件,将为分支启用自动合并:合并规则之前需要拉取请求复审,以及为分支启用了新的推入提交时的其他关闭过时的拉取请求批准。
这样可以确保在批准和自动合并之间不能更改拉取请求。
启用合并规则之前需要通过状态检查,并且至少选择了一个状态检查。
输入项姓名必需的描述token是的为了能够触发其他工作流程,需要指定默认GITHUB_TOKEN以外的GitHub令牌。
merge-method不指定要使用的合并方法。
默认情况下,将按以下顺序选择第一个可用的:merge,squash,rebasesquash-title不压缩时,使用拉取请求标题作为提交消息。
do-not-merge-labels不
2016/9/5 7:26:14 215KB TypeScript
1
自动合并动作如果已批准拉取请求且状态检查已通过,此操作将自动合并拉取请求。
GitHub的分支保护规则用于确定特定分支能否允许自动合并。
给定以下条件,将为分支启用自动合并:合并规则之前需要拉取请求复审,以及为分支启用了新的推入提交时的其他关闭过时的拉取请求批准。
这样可以确保在批准和自动合并之间不能更改拉取请求。
启用合并规则之前需要通过状态检查,并且至少选择了一个状态检查。
输入项姓名必需的描述token是的为了能够触发其他工作流程,需要指定默认GITHUB_TOKEN以外的GitHub令牌。
merge-method不指定要使用的合并方法。
默认情况下,将按以下顺序选择第一个可用的:merge,squash,rebasesquash-title不压缩时,使用拉取请求标题作为提交消息。
do-not-merge-labels不
2016/9/5 7:26:14 215KB TypeScript
1
RPA,做过几个rpa项目,罗列总结自己常用得一些uipath和vba常用方法机器人流程自动化(RoboticProcessAutomation,RPA)是一种新型的技术理念,它允许通过软件机器人基于一定规则的交互动作来模拟和执行既定的业务流程。
RPA机器人好像人类一样能够操作各种IT应用程序,如浏览器、Office软件、Java/.net等语言编写的程序、ERP软件(SAP/Oracle)等等
2020/7/3 13:30:03 294KB RPA uipath vba
1
Spark是Apache顶级项目里面最火的大数据处理的计算引擎,它目前是担任大数据计算的工作。
包括离线计算或交互式查询、数据挖掘算法、流式计算以及图计算等。
核心组件如下:SparkCore:包含Spark的基本功能;
尤其是定义RDD的API、操作以及这两者上的动作。
其他Spark的库都是构建在RDD和SparkCore之上的。
SparkSQL:提供通过ApacheHive的SQL变体Hive查询语言(HiveQL)与Spark进行交互的API。
每个数据库表被当做一个RDD,SparkSQL查询被转换为Spark操作。
对熟悉Hive和HiveQL的人,Spark可以拿来就用。
SparkStrea
1
手势游戏在这个游戏中:玩家必须在屏幕的特定区域快速做出特殊的手势。
游戏将使用网络摄像头读取用户的动作。
屏幕将被分成NBlock*NBlock区域。
(用户在游戏开始之前选择NBlock)将为玩家提供一系列手势,以及在何处放置手(仅在屏幕的一个区域)。
玩家应做链条的最早标志,除最早标志外,任何标志均不计算在内。
玩家的分数将被存储。
每个正确的手势都会加分,并且符号会消失。
没有时间限制或链条的结束,符号(链条)的速度将随着玩家点数的添加而添加。
如果玩家错过了MaxMiss标志,游戏将结束。
(用户在游戏开始之前选择MaxMiss)任何游戏的最终得分=ceil((点数*NBlock/MaxMiss)(2-步进)*100)。
2016/7/19 20:38:15 53.48MB game python image-processing faculty-project
1
用于控制电机的python程序,次要用于控制减速电机,通过电机自带的电子工具箱,由串口工具连接电脑,以python程序控制电机的动作
2016/7/16 18:56:50 24.2MB 机电
1
基于maven的ssm项目,完成账户的登陆、注册、修正;
设备激活以及传感器的添加、修正、删除;
传感器动作以及触发条件的设置
2017/11/9 21:22:42 1.24MB 开发
1
人类行为识别的目的是通过一系列的观察,对人类的动作类型、行为模式进行分析和识别,并使用自然语言等方式对其进行描述的计算机技术。
由于人类行为的复杂性和多样性,往往识别出的结果是多样性的,并且连带着行为类型的概率输出的。
随着信息技术的发展,各种移动设备和可穿戴设备正在以加速度的方式增长,其功能和嵌入的传感器也变的多样化,例如:高清相机、光传感器、陀螺仪传感器、加速度传感器、GPS以及温度传感器等。
各种各样的传感器都在时刻的记录着使用者的信息,这些记录信息不仅可以用于用户位置的预测,也可以进行用户行为的识别等。
本文使用了智能设备加速度传感器的数据,结合支持向量机的特性进行人类行为识别模型的设计和应用
1
基于maven的ssm项目,实现账户的登录注册、账户激活修正、设备的增删改查、分页显示以及添加传感器动作并触发动作的demo。
2020/3/4 17:44:22 1.78MB Java Java Web Spring/Sprin
1
共 347 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡