共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。
句粒度,但有不少长句,裁剪后5w对也够用。
原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。
另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。
如果又可以改善的地方,欢迎留言
2025/7/16 16:52:35 35.14MB 中英平行语料库 语料
1
这是一款按图像相似度排序的软件,可帮助查同。
首先浏览到指定目录,软件可自动搜索目录下的所有图片,进行预处理。
之后可分色查同,重点关注区域可调。
2025/7/5 16:53:06 46KB 图像 相似 排序 查同
1
ENVI软件Planet数据大气校正,再做预处理遇到的问题及解决办法,希望大家多交流
2025/7/4 16:17:41 450KB PL数据预处理
1
近红外光谱数据预处理的算法,包括mcs\msc\snv\sg等一些预处理算法
2025/7/3 0:12:17 18KB nir data process
1
MATLAB中AR模型功率谱估计中AR阶次估计的实现-psd_my.rar(最近看了几个关于功率谱的问题,有关AR模型的谱估计,在此分享一下,希望大家不吝指正)(声明:本文内容摘自我的毕业论文——心率变异信号的预处理及功率谱估计)(按:AR模型功率谱估计是对非平稳随机信号功率谱估计的常用方法,但是其模型阶次的估计,除了HOSA工具箱里的arorder函数外,没有现成的函数可用,arorder函数是基于矩阵SVD分解的阶次估计方法,为了比较各种阶次估计方法的区别,下面的函数使用了'FPE','AIC','MDL','CAT'集中准则一并估计,并采用试验方法确定那一个阶次更好。
)………………………………以上省略……………………………………………………………………假设原始数据序列为x,那么n阶参数使用最小二乘估计在MATLAB中实现如下:Y=x;Y(1:n)=[];m=N-n;X=[];%构造系数矩阵fori=1:m  forj=1:n      X(i,j)=xt(ni-j);  endendbeta=inv(X'*X)*X'*Y';复制代码beta即为用最小二乘法估计出的模型参数。
此外,还有估计AR模型参数的Yule-Walker方程法、基于线性预测理论的Burg算法和修正的协方差算法等[26]。
相应的参数估计方法在MATLAB中都有现成的函数,比如aryule、arburg以及arcov等。
4.3.3AR模型阶次的选择及实验设计文献[26]中介绍了五种不同的AR模型定阶准则,分别为矩阵奇异值分解(SingularValueDecomposition,SVD)定阶法、最小预测定误差阶准则(FinalPredictionErrorCriterion,FPE)、AIC定阶准则(Akaika’sInformationtheoreticCriterion,AIC)、MDL定阶准则以及CAT定阶准则。
文献[28]中还介绍了一种BIC定阶准则。
SVD方法是对Yule-Walker方程中的自相关矩阵进行SVD分解来实现的,在MATLAB工具箱中arorder函数就是使用的该算法。
其他五种算法的基本思想都是建立目标函数,阶次估计的标准是使目标函数最小化。
以上定阶准则在MATLAB中也可以方便的实现,下面是本文实现FPE、AIC、MDL、CAT定阶准则的程序(部分):form=1:N-1  ……    %判断是否达到所选定阶准则的要求  ifstrcmp(criterion,'FPE')    objectfun(m1)=(N(m1))/(N-(m1))*E(m1);  elseifstrcmp(criterion,'AIC')    objectfun(m1)=N*log(E(m1))2*(m1);  elseifstrcmp(criterion,'MDL')    objectfun(m1)=N*log(E(m1))(m1)*log(N);  elseifstrcmp(criterion,'CAT')    forindex=1:m1        temp=temp(N-index)/(N*E(index));    end    objectfun(m1)=1/N*temp-(N-(m1))/(N*E(m1));  end    ifobjectfun(m1)>=objectfun(m)    orderpredict=m;    break;  endend复制代码orderpredict变量即为使用相应准则预测的AR模型阶次。
(注:以上代码为结合MATLAB工具箱函数pburg,arburg两个功率谱估计函数增加而得,修改后的pburg等函数会在附件中示意,名为pburgwithcriterion)登录/注册后可看大图程序1.JPG(35.14KB,下载次数:20352)下载附件 保存到相册2009-8-2820:54上传登录/注册后可看大图程序2.JPG(51.78KB,下载次数:15377)下载附件 保存到相册2009-8-2820:54上传下面本文使用3.2.1实验设计的输出结果即20例经预处理的HRV信号序列作为实验对象,分别使用FPE、AIC、MAL和CAT定阶准则预测AR模型阶次,图4.1(见下页)为其中一例典型信号使用不同预测准则其目标函数随阶次的变化情况。
从图中可以看出,使用FPE、AIC以及MDL定阶准则所预测的AR模型阶次大概位于10附近,即阶次10左右会使相应的目标函数最小化,符合定阶准则的要求,使用CAT定阶准则预测的阶次较小,在5~10之间。
图4.2(见下页)为另一例信号的阶次估计情况,从中也可以得到同样的结论。
(注,实验信号为实验室所得,没有上传)登录/注册后可看大图图片1.JPG(28.68KB,下载次数:5674)下载附件 保存到相册2009-8-2820:54上传
2025/6/27 16:08:25 6KB matlab
1
这是faruto在libsvm基础上给出相应的辅助函数插件,方便用户来选取最佳的参数,包括:归一化函数:scaleForSVM;
pca降维预处理函数:pcaForSVM;
网格参数寻优函数(分类问题):SVMcgForClass;
网格参数寻优函数(回归问题):SVMcgForRegress;
利用PSO参数寻优函数(分类问题):psoSVMcgForClass;
利用PSO参数寻优函数(回归问题):psoSVMcgForRegress;
利用GA参数寻优函数(分类问题):gaSVMcgForClass;
利用GA参数寻优函数(回归问题):gaSVMcgForRegress
2025/6/26 0:56:16 1.48MB libsvm SVM 工具箱加强最
1
UI设计包括界面设计、菜单栏布局、进度条、结果展示和图片展示区域划分几个主要任务。
图像预处理包括图像的灰度化、二值化、反色处理、图形锐化、数字分割、归一化等主要任务。
特征提取为使用不同的特征提取方法,对于预处理过的图像,进行数字特征提取。
图像识别是对于数字图像,将特征提取出的数字矩阵数组,采用不同的识别方法,一个个地识别出他们对应的数字,最终显示在界面。
2025/6/24 19:37:25 206.13MB fisher knn svm recognition
1

LSTM(Long Short-Term Memory)是一种特殊的循环神经网络(RNN),专为解决传统RNN在处理长期依赖问题上的不足而设计。
在序列数据的建模和预测任务中,如自然语言处理、语音识别、时间序列分析等领域,LSTM表现出色。
本项目“LSTM-master.zip”提供的代码是基于TensorFlow实现的LSTM模型,涵盖了多种应用场景,包括多步预测和单变量或多变量预测。
我们来深入理解LSTM的基本结构。
LSTM单元由输入门、遗忘门和输出门组成,以及一个称为细胞状态的特殊单元,用于存储长期信息。
通过这些门控机制,LSTM能够有效地选择性地记住或忘记信息,从而在处理长序列时避免梯度消失或梯度爆炸问题。
在多步预测中,LSTM通常用于对未来多个时间步的值进行连续预测。
例如,在天气预报或者股票价格预测中,模型不仅需要根据当前信息预测下一个时间点的结果,还需要进一步预测接下来的多个时间点。
这个项目中的“多步的迭代按照步长预测的LSTM”可能涉及使用递归或堆叠的LSTM层来逐步生成未来多个时间点的预测值。
另一方面,单变量预测是指仅基于单一特征进行预测,而多变量预测则涉及到多个特征。
在“多变量和单变量预测的LSTM”中,可能包含了对不同输入维度的处理方式,例如如何将多维输入数据编码到LSTM的输入向量中,以及如何利用这些信息进行联合预测。
在多变量预测中,LSTM可以捕获不同特征之间的复杂交互关系,提高预测的准确性。
TensorFlow是一个强大的开源库,广泛应用于深度学习模型的构建和训练。
在这个项目中,使用TensorFlow可以方便地定义LSTM模型的计算图,执行反向传播优化,以及实现模型的保存和加载等功能。
此外,TensorFlow还提供了丰富的工具和API,如数据预处理、模型评估等,有助于整个预测系统的开发和调试。
在探索此项目时,你可以学习到以下关键点:1. LSTM单元的工作原理和实现细节。
2. 如何使用TensorFlow构建和训练LSTM模型。
3. 处理序列数据的技巧,如时间序列切片、数据标准化等。
4. 多步预测的策略,如滑动窗口方法。
5. 单变量与多变量预测模型的差异及其应用。
6. 模型评估指标,如均方误差(MSE)、平均绝对误差(MAE)等。
通过深入研究这个项目,你不仅可以掌握LSTM模型的使用,还能提升在实际问题中应用深度学习解决序列预测问题的能力。
同时,对于希望进一步提升技能的开发者,还可以尝试改进模型,比如引入注意力机制、优化超参数、或者结合其他序列模型(如GRU)进行比较研究。
2025/6/19 19:17:59 5.42MB
1
介绍了基于DSP的条码图像实时识别系统,对原图像进行预处理后,运用模板匹配法进行图像区域查找,在原图像上分割出条码区域。
DSP的强大运算功能克服了模板匹配法计算量大的缺点;
DSP控制还具有电路简单、可靠、应用灵活等特性。
2025/6/19 4:30:27 103KB
1

在MATLAB中,计算三维散乱点云的曲率是一项重要的几何分析任务,尤其是在计算机图形学、图像处理和机器学习等领域。
曲率是衡量表面局部弯曲程度的一个度量,可以帮助我们理解点云数据的形状特征。
曲率的计算通常涉及主曲率、高斯曲率和平均曲率三个关键概念。
主曲率是描述曲面在某一点沿两个正交方向弯曲的程度,通常记为K1和K2,其中K1是最大曲率,K2是最小曲率。
主曲率可以提供关于曲线形状的局部信息,例如,当K1=K2时,表明该点处的曲面是球形;
当K1=0或K2=0时,可能对应于平面区域。
高斯曲率(Gaussian Curvature)是主曲率的乘积,记为K = K1 * K2。
高斯曲率综合了主曲率的信息,能反映曲面上任意点的全局弯曲特性。
如果高斯曲率为正,表明该点在凸形曲面上;
若为负,则在凹形曲面上;
为零时,表示该点位于平面上。
平均曲率(Mean Curvature)是主曲率的算术平均值,H = (K1 + K2) / 2。
它提供了曲面弯曲的平均程度,对于理解物体表面的整体形状变化非常有用。
例如,平均曲率为零的点可能表示曲面的边缘或者尖锐转折。
在MATLAB中,计算这些曲率通常需要以下步骤:1. **数据预处理**:你需要加载散乱点云数据。
这可以通过读取txt文件(如www.pudn.com.txt)或使用特定的数据集来完成。
数据通常包含每个点的XYZ坐标。
2. **邻域搜索**:确定每个点的邻域,通常采用球形邻域或基于距离的邻域。
邻域的选择直接影响曲率计算的精度和稳定性。
3. **拟合曲面**:使用最近邻插值、移动最小二乘法(Moving Least Squares, MLS)或其他方法,将点云数据拟合成一个连续曲面。
在本例中,"demo_MLS"可能是一个实现MLS算法的MATLAB脚本。
4. **计算几何属性**:在拟合的曲面上,计算每个点的曲率。
这涉及到计算曲面的曲率矩阵、主轴和主曲率。
同时,高斯曲率和平均曲率可以通过已知的主曲率直接计算得出。
5. **结果可视化**:你可以使用MATLAB的图形工具,如`scatter3`或`patch`函数,将曲率信息以颜色编码的方式叠加到原始点云上,以直观展示曲率分布。
在实际应用中,曲率计算对于识别物体特征、形状分析和目标检测等任务具有重要价值。
例如,在机器人导航、医学图像分析和3D重建等领域,理解点云数据的几何特性至关重要。
总结来说,MATLAB中的算法通过一系列数学操作和数据处理,可以有效地计算三维散乱点云的主曲率、高斯曲率和平均曲率,从而揭示其内在的几何结构和形状特征。
正确理解和运用这些曲率概念,有助于在相关领域进行更深入的研究和开发。
2025/6/18 16:18:34 130KB
1
共 336 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡