模仿学习此仓库包含一些强化学习算法的简单PyTorch实现:优势演员评论家(A2C)的同步变体近端策略优化(PPO)-最受欢迎的RL算法,,,策略上最大后验策略优化(V-MPO)-DeepMind在其上次工作中使用的算法(尚不起作用...)行为克隆(BC)-一种将某些专家行为克隆到新策略中的简单技术每种算法都支持向量/图像/字典观察空间和离散/连续动作空间。
为什么回购被称为“模仿学习”?当我开始这个项目并进行回购时,我认为模仿学习将是我的主要重点,并且无模型方法仅在开始时用于培训“专家”。
但是,PPO实施(及其技巧)似乎比我预期的花费了更多时间。
结果,现在大多数代码与PPO有关,但是我仍然对模仿学习感兴味,并打算添加一些相关算法。
当前功能目前,此仓库包含一些无模型的基于策略的算法实现:A2C,PPO,V-MPO和BC。
每种算法都支持离散(分类,伯努利,GumbelSoftmax)和连续(贝塔,正态,tanh(正态))策略分布以及矢量或图像观察环境。
Beta和tanh(Normal)在我的实验中效果最好(在BipedalWalker和Huma
2016/4/5 15:54:46 11.42MB
1
这是2018年秋季学期哈工大本科密码学课程的作业及解析(英文)。
大部分为李秋豪学长所写,少部分参考了张宇老师的课件和IntroductiontoModernCryptography(2ndedition),均已在解析中指出。
另外还有一篇PDF包含了课件中常出现的缩写/符号,供参考。
本人为哈工大2016级计算机学院学生,因密码学这门课实在是恶心,之前不断苦于找不到答案非常难受,此外历年的期末试题也买不到,(纸张记忆的垃圾题不要买不要买不要买太垃圾了害我挂科),因此找到了一份非常优秀的学长的答案作业分为5次,大致覆盖了总结PPT上列出的知识点。
老师并未发布标准答案,我也没有对答案进行审核,如您发现错误,请在评论区说明,感谢!(2019年1月密码学期末考试题型是四十个填空和八道答题,卷面八十分)
2020/1/11 18:09:03 763KB 哈工大 密码学 答案 密码学答案
1
这是我今年年初做练习时做的一个网上商城项目,基本上的功能都有主要实现用户网上购物。
主要提供了用户注册、登录、个人信息修改、查看商品(按全部、类型、点击率、销售排行)、查看商品详情、添加购物车、生成定单、论坛评论、赞扬等功能。
后台主要实现对商品、用户、订单、产品类型、管理员,以及付款方式等管理功能。
2015/3/16 20:58:01 13.44MB java毕设 网上商城 b2c
1
次要可以实现论坛的一切功能,可以发布动态、查看论坛、点赞评论.........很多很多的功能
2016/7/18 19:36:13 18.62MB android
1
爬取了jd上了文胸综合排名前150个商品,并爬取了接近25000条的数据,对数据的color和size进行了简略分析
2016/1/8 15:53:19 40.67MB python 数据分析 爬虫
1
基于word2vec扩展情感词典和SVM的情感分析方法,顾卓航,张笑燕,随着互联网的快速发展,用户的评论信息曾经成为各个商家用于优化产品、服务的重要信息源,如何对这些评论信息进行情感分类已成为
2018/9/1 10:40:25 243KB 情感分析
1
[WPF专业编程指南].李应保.高清扫描版带源码,送给那些没有积分的同窗,CSDN从评论不送分后都下不起资源了。
这本书适合想要WPF进阶的同窗,如果一点基础都没有建议先看一下WPF扫盲版"深入浅出WPF"。
2017/1/9 19:47:20 50.82MB WPF C#
1
爬取微博文章下面的评论,并可视化词云展现
2017/2/7 17:14:26 7KB 爬取微博文章评论 词云展示
1
首先是关于[评价可免费]的严正声明一、评价=评论加评价(评星星)二、评价必须是下载完了该资源后的评价,没下载评价无效三、如果正确评价了,返还积分可能需要等一会,因为系统需要反应。
评论时记得要评分。
然后会前往给你花费的分再加1分。
理论上有10分就可以下载所有资源。
一般人我不告诉他附加项目讲解PPT
1
NLPCC2014情感分类语料集+已经标注好+中文,次要是够购物相关的评论。
2016/10/20 21:27:42 10.71MB 情感分析 正负面 语料集
1
共 663 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡