现在我们回到LDA的原理上,我们在第一节说讲到了LDA希望投影后希望同一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大,但是这只是一个感官的度量。
现在我们首先从比较简单的二类LDA入手,严谨的分析LDA的原理。
    假设我们的数据集D={(x1,y1),(x2,y2),...,((xm,ym))}D={(x1,y1),(x2,y2),...,((xm,ym))},其中任意样本xixi为n维向量,yi∈{0,1}yi∈{0,1}。
我们定义Nj(j=0,1)Nj(j=0,1)为第j类样本的个数,Xj(j=0,1)Xj(j=0,1)为第j类样本的集合,而μj(j=0,1)μj(j=0,1)为第j类样本的均值向量,定义Σj(j=0,1)Σj(j=0,1)为第j类样本的协方差矩阵(严格说是缺少分母部分的协方差矩阵)。
    μjμj的表达式为:μj=1Nj∑x∈Xjx(j=0,1)μj=1Nj∑x∈Xjx(j=0,1)    ΣjΣj的表达式为:Σj=∑x∈Xj(x−μj)(x−μj)T(j=0,1)Σj=∑x∈Xj(x−μj)(x−μj)T(j=0,1)    由于是两类数据,因此我们只需要将数据投影到一条直线上即可。
假设我们的投影直线是向量ww,则对任意一个样本本xixi,它在直线ww的投影为wTxiwTxi,对于我们的两个类别的中心点μ0,μ1μ0,μ1,在在直线ww的投影为wTμ0wTμ0和wTμ1wTμ1。
由于LDA需要让不同类别的数据的类别中心之间的距离尽可能的大,也就是我们要最大化||wTμ0−wTμ1||22||wTμ0−wTμ1||22,同时我们希望同一种类别数据的投影点尽可能的接近,也就是要同类样本投影点的协方差wTΣ0wwTΣ0w和wTΣ1wwTΣ1w尽可能的小,即最小化wTΣ0w+wTΣ1wwTΣ0w+wTΣ1w。
综上所述,我们的优化目标为:argmaxwJ(w)=||wTμ0−wTμ1||22wTΣ0w+wTΣ1w=wT(μ0−μ1)(μ0−μ1)TwwT(Σ0+Σ1)wargmax⏟wJ(w)=||wTμ0−wTμ1||22wTΣ0w+wTΣ1w=wT(μ0−μ1)(μ0−μ1)TwwT(Σ0+Σ1)w    我们一般定义类内散度矩阵SwSw为:Sw=Σ0+Σ1=∑x∈X0(x−μ0)(x−μ0)T+∑x∈X1(x−μ1)(x−μ1)TSw=Σ0+Σ1=∑x∈X0(x−μ0)(x−μ0)T+∑x∈X1(x−μ1)(x−μ1)T    同时定义类间散度矩阵SbSb为:Sb=(μ0−μ1)(μ0−μ1)TSb=(μ0−μ1)(μ0−μ1)T    这样我们的优化目标重写为:argmaxwJ(w)=wTSbwwTSwwargmax⏟wJ(w)=wTSbwwTSww    仔细一看上式,这不就是我们的广义瑞利商嘛!这就简单了,利用我们第二节讲到的广义瑞利商的性质,我们知道我们的J(w)J(w)最大值为矩阵S−12wSbS−12wSw−12SbSw−12的最大特征值,而对应的ww为S−12wSbS−12wSw−12SbSw−12的最大特征值对应的特征向量!而S−1wSbSw−1Sb的特征值和S−12wSbS−12wSw−12SbSw−12的特征值相同,S−1wSbSw−1Sb的特征向量w′w′和S−12wSbS−12wSw−12SbSw−12的特征向量ww满足w′=S−12www′=Sw−12w的关系!    注意到对于二类的时候,SbwSbw的方向恒为μ0−μ1μ0−μ1,不妨令Sbw=λ(μ0−μ1)Sbw=λ(μ0−μ1),将其带入:(S−1wSb)w=λw(Sw−1Sb)w=λw,可以得到w=S−1w(μ0−μ1)w=Sw−1(μ0−μ1),也就是说我们只要求出原始二类样本的均值和方差就可以确定最佳的投影方向ww了。
2024/7/30 21:57:26 3KB MATLAB 人脸识别 LDA knn
1
具有非贪婪l(1)-范数最大化的块主成分分析
2024/7/28 18:46:51 1.27MB 研究论文
1
各位网友大家好,要运行此工具必需先设置好网页信息,点击菜单栏设置或用快捷键(Alt+E)进入到设置页面,设置页面其中包括三个Tab:基本配置、网页信息和数据库。
基本配置:如果要运行页面点击时自动刷新外网IP就要配置ADSL帐号,现在暂时只支持ADSL刷新外网IP。
单独页面执行是已Html中div的id为标志,意思是循环只执行此选中项,默认是所有项目。
IP数据表就是每执行一下点击网页都会记录下本次的IP,记录文件放在此工具的路径下的Data目录下的iptables.log文件,最小化启动程序就是启动此工具或最小化窗口后台托管运行,就像QQ一样挂着。
循环重启软件运行此项是为了和刷新ADSL一起配合产生独立IP,因为每个浏览器都有Cookies,关闭浏览器就可以彻底清除Cookies产生独立访客(UV)了。
如果同时选择了最小化启动程序可以用全局快捷键Ctrl+Alt+空格解除循环。
网页信息:是一个表格可以进行添加、修改和删除。
页面执行方式有两种:一是completed意思是等网页加载完毕后执行点击,二是thread多线程执行意思是加载页面3秒钟后再执行页面点击。
各有各自的优点,如果发现其中一种执行方式实现不了可以用另外一种试一下。
类型就是网页的链接返回类型,有两种一时纯url链接如:http://www.baidu.com,另一种是数据库SQL语句返回链接集。
用数据库名加@加地址标志,在数据库Tab中配置。
SQL语句一定要返回link结果集如:selectconcat('http://www.google.com/',url)linkfromtable,在SQL语句中不要用双引号,要用单引号,否则会出错。
现在支持MYSQL和MSSQL数据库。
链接就是类型对应的文本。
htmlID是html中div的id,这个是网站网页中要点击的定位点,是这个表的主键必须唯一。
偏移坐标就是htmlID的相对偏移点,用英文逗号隔开如0,0。
状态有两种Y和N,意思是是和否,默认是Y,就是如果您想停用此条记录不加入循环就改为N。
独立IP,默认是N,就是在Data/iptables.log文件中没出现过的当为独立ip。
双击单元格可以修改文本内容。
点击最后的删除可以删除此行记录。
修改或添加后可别忘记了按右下角的保存按钮哦。
数据库tab表格简单明了就不多加说明了。
如果有出现运行异常可以可以查看Data下的error.log错误日志文件。
如果对此工具有何意见或建议可以点击意见反馈发送你的宝贵信息。
此工具支持在线更新。
如收到您的来信,我会尽快的修改更新。
温馨提示:目标执行标签(htmlID)要保持在预览窗口显示,建议最大化窗口最小化后台托管运行。
希望此工具可以帮得了大家。
2024/6/24 5:04:28 144KB 模拟网页点击
1
主要功能是实现:用户在访问后台服务器访问失败时(登录和修改内容时会首先访问后台服务器,服务器访问失败时会读取本地文件,此处为json文件,进行登录),修改用户信息(修改本地的json文件内容)。
1
一种健壮的拜占庭容错(BFT)总订单广播协议,旨在最大化广域网上的吞吐量,以允许和禁止权益证明的区块链为目标。
Mir在WAN上实现了空前的吞吐量,而无需牺牲等待时间,对恶意行为的鲁棒性,不影响集群的性能。
Mir在广泛分布的100个节点,1GbpsWAN设置下,每秒订购超过60000签署比特币大小的交易,同时防止了包括请求复制性能攻击在内的一系列攻击。
2024/6/15 7:34:49 737KB BFT 共识 高吞吐
1
广告主设计和投放广告:广告生命周期开始广告主的目的获取目标用户,将ROI最大化系统将对广告进行学习训练,得到估计点击率(pCTR)广告通过pCTR、pCVR、CPC等feature计算出ecpm参与竞价广告展示在媒体(QQ/Qzone/微信)上,获用户点击,为广告主带流量用户在广告主网站的行为例如下单,也会回馈到系统当广告主引流达到预期,广告主会下线广告:广告生命周期结束和广告主相关的一些feature,对应的pCTR、pCVR会记录在系统,用于下一次广告优化
2024/5/29 14:52:34 1.26MB 计算广告
1
1、Python实现社交网络影响力最大化Linear_Threshold(线性阈值模型)算法。
2、对线性阈值模型算法进行优化改进,实现贪心算法。
3、代码中有详细注释说明,测试代码,测试节点数据集,并对数据集进行处理,输出测试结果。
4、代码实现环境:Python2.7,Anoconda2,Pycharm2017。
2024/4/29 12:50:25 9KB 社交网络
1
Lindo和Lingo是美国Lindo系统公司开发的一套专门用于求解最优化问题的软件包。
Lindo用于求解线性规划和二次规划问题,Lingo除了具有Lindo的全部功能外,还可以用于求解非线性规划问题,也可以用于一些线性和非线性方程(组)的求解,等等。
Lindo和Lingo软件的最大特色在于可以允许优化模型中的决策变量是整数(即整数规划),而且执行速度很快。
Lingo实际上还是最优化问题的一种建模语言,包括许多常用的函数可供使用者建立优化模型时调用,并提供与其他数据文件(如文本文件、Excel电子表格文件、数据库文件等)的接口,易于方便地输入、求解和分析大规模最优化问题。
由于这些特点,Lindo系统公司的线性、非线性和整数规划求解程序已经被全世界数千万的公司用来做最大化利润和最小化成本的分析。
应用的范围包含生产线规划、运输、财务金融、投资分配、资本预算、混合排程、库存管理、资源配置等等...Lindo/Lingo软件作为著名的专业优化软件,其功能比较强、计算效果比较好,与那些包含部分优化功能的非专业软件相比,通常具有明显的优势。
此外,Lindo/Lingo软件使用起来非常简便,很容易学会,在优化软件(尤其是运行于个人电脑上的优化软件)市场占有很大份额,在国外运筹学类的教科书中也被广泛用做教学软件。
2024/4/22 2:50:33 24.06MB lingo 数学规划 9.0 破解
1
设有最大化的整数规划问题A,与它对应的线性规划为问题B,从解问题B开始,若其最优解不符合A的整数条件,那么B的最优目标函数必是A的最优目标函数的上界,记作Z1;而A的任意可行解的目标函数值将是一个下界Z2。
分支定界法就是将B的可行域分成子区域(称为分支),逐步减小Z1和增大Z2,最终求到.
2024/4/18 9:09:41 41KB 分支定界法
1
大规模MIMO系统中的导频分配方法研究,孙旭耀,戚晨皓,本文研究了服务质量(QualityofService,QoS)约束下的大规模MIMO系统的导频分配。
结合了公平性准则与最大化和速率准则的优点进行导频��
2024/3/22 17:17:17 605KB 通信技术
1
共 100 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡