递归神经网络(RNN)近些年来被越来越多地应用在机器学习领域,尤其是在处理序列学习任务中,相比CNN等神经网络功能更为优异。
但是RNN及其变体,如LSTM、GRU等全连接网络的计算及存储复杂性较高,导致其推理计算慢,很难被应用在产品中。
一方面,传统的计算平台CPU不适合处理RNN的大规模矩阵运算;
另一方面,硬件加速平台GPU的共享内存和全局内存使基于GPU的RNN加速器的功耗比较高。
FPGA由于其并行计算及低功耗的特性,近些年来被越来越多地用来做RNN加速器的硬件平台。
对近些年基于FPGA的RNN加速器进行了研究,将其中用到的数据优化算法及硬件架构设计技术进行了总结介绍,并进一步提出了未来研究的方向。
2017/3/13 16:19:19 1.39MB 递归神经网络 FGPA 加速器
1
ParaPIV是一种基于PIVlab的粒子图像测速(PIV)并行处理工具。
它旨在在大规模并行机或多核计算机上无效地处理PIV图像。
由于PIV利用图像相关性来获得速度场,后处理总是很耗时,特别是对于湍流。
得益于MATLAB和现代先进计算机的分布式计算工具箱,ParaPIV能够在几分钟或几秒钟内计算出一万个图像帧。
使用6核inteli7CPUPC,ParaPIV分别比PIVlab1.32和PIVlab1.41快38倍和6.7倍。
要激活并行计算功能,请在MATLAB中打开ParaPIV,单击Analysis->ParallelComputing,然后选择要使用的CPU核数。
单击开始按钮启动并行池并等待几分钟。
并行池启动后,照常点击分析所有帧按钮,图像将在多核上传输和分析。
可以通过任务管理器监控CPU
2020/4/15 10:44:26 9.75MB matlab
1
陈国良院士的并行计算系列丛书(全四部含源码)1并行计算+结构·算法·编程_(修订版2003)陈国良2陈国良并行计算机体系结构3并行算法的设计与分析第3版+陈国良编著+2009+源代码4并行算法理论附上源码打包
2021/8/17 11:49:45 42.92MB 陈国良 并行计算
1
本书引见了并行编程模式的相关概念和技术,主要内容包括并行编程模式语言、并行计算的背景、软件开发中的并发性、并行算法结构设计、支持结构、设计的实现机制以及OpenMP、MPI等。
2016/11/4 6:11:24 47.45MB 并行计算 计算机
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡