支持向量机svm

老牧童 • 2025-02-19 15:15 • 未分类

支持向量机svm对 aerfa 求导得到 aerfa1 1 5aerfa2 1 不符合条件

大家好，欢迎来到IT知识分享网。

线性可分(假设每一个点都分对了）

支持向量机的一个重要性质：训练完成后，大部分的训练样本都不需要保留，最终模型仅与支持向量有关。

支持向量：真正发挥作用的数据点，ɑ值不为0的点

（kkt就像求导一样，是取强对偶的必要条件，不过一般当成充要了）

感觉不满足ktt会使w变大

一个简单的例子

需要坐标点那个向量点乘

对aerfa求导，得到aerfa1=1.5 aerfa2=-1

不符合条件。

所以极值在每个aerfa取0时可能得到

最后aerfa1=aerfa3=0.25 aerfa2=0

即x1和x3来发挥作用

作用：选出来离雷区最远的决策边界（雷区就是边界上的点，要Large Margin）

已知如图超平面且线性可分

几何间隔：（对几维空间都成立）

（几何间隔）恒大于0，不用带绝对值符号。

y（i）是数据点的标签，取+1，或者-1

取几何间隔的最小值，这个距离就是我们所谓的支持向量到超平面的距离。因此，SVM模型的求解最大分割超平面问题可以表示为以下约束最优化问题

一通简单的变换：

得到一个新的式子：

第一个图的+1,-1两条线就是这么来的。这就是一个约束条件。

为了使几何间隔最大，需要w取最小值（很好理解：找到支持向量了，那么w越小，几何间隔就越大）

原问题就变成了：

每一个点都是约束条件

之后就可以对其使用拉格朗日乘子法得到其对偶问题（对偶问题变量是拉格朗日乘子，一定是凸优化，更加方便）

当样本点不满足约束条件时，将 aerfa设成无线大，所以thrta（w）也无限大

所以得到原函数分段形式

对偶问题：

p和d的联系呢？p>=d，当满足两个条件：

① 优化问题是凸优化问题

（凸优化问题：凸函数又是凸集

凸集交集也是凸集

所以对偶函数一定是凸优化问题

一般凸优化就是强对偶关系）

② 满足KKT条件

时，等号成立。

证明凸优化一定强对偶

也很好理解！（t是f（x） lamta是拉格朗日乘子）

或者公式来分析！

只有当 G2是一个凸集的时候，等号才会成立。（t是f（x） u是限制函数）

这里想象一下t和u都是一个三维曲面，它们都是凸集，所以交集也是凸集，然后从三维投影到二维

去掉x轴，仍是凸集。

凸集那么上图可知，一定是强对偶问题。

首先，本优化问题显然是一个凸优化问题

然后是KKT条件：（kkt就像求导一样，是取强对偶的必要条件，不过一般当成充要了）

把上图条件分别标号1-5

这是:4,1,5

松弛意味着lamta为0，该条件无效

这是：3（把w和b都看成x就好了，我觉得x是除了拉格朗日乘子的其他项）

带入拉格朗日目标函数中，消去w和b ，b自己就没了

把目标式子加一个负号，将求解极大转换为求解极小

smo优化算法，最后由aerfa得到结果：

b=y(j)-wx(j)

过渡

这里加平方主要为了不再引入新的约束条件，如果只引入a（i），会导致a（i）>0

KKT. 的公式推导。（感觉不如我的图直观）

线性不可分（hinge损失）

但是实际情况下几乎不存在完全线性可分的数据，为了解决这个问题，引入了“软间隔”的概念，即允许某些点不满足约束。

一个直观的理解：一万个数据，有一个分错了，那么如果线性可分模型，就会报错。但是如果用hinge损失的话，只会对目标函数有轻微的影响，最后模型会把这个点相当于是忽略了。

这个式子意味着每一个点都在边界线外。如果等于1，那就在边界线上了

以此类推，小于1大于0，意味着点可以分在边界线内部了

就是我们可以为了更大的决策边界来忽视一些边界点

之后为原函数加上惩罚项。

当C趋近于很大时：oumiga必须取很小，意味着分类严格不能有错误
当C趋近于很小时：oumiga可以取很大，意味着可以有更大的错误容忍

和

等价（好神奇，我想了好久）原来下面这个式子隐藏了一个条件：就是目标函数要取最小值

那么oumiga一定是最小的那个，瞬间就等价了

现在两种限制条件了，所以得两种拉格朗日乘子

之后就是求w和oumiga共同的最小值了。

之后做法差不多：

对oumiga求导，多了一个等式，就是c那个。

大于1，说明就和线性可分没区别了，即oumiga=0；

等于1，说明在决策边界上，和线性也没区别

小于1，在决策边界內部，此时，oumiga会把这个点拉回决策边界，需要对目标函数有一个惩罚项来平衡。

不难发现软间隔SVM只是在对拉格朗日乘子阿aerfa的约束上加上了一个上界C。来减少这个点对整体模型构建的影响。

核函数

低维空间映射到高维空间后维度可能会很大，如果将全部样本的点乘全部计算好，这样的计算量太大了。核函数的引入一方面减少了我们计算量，另一方面也减少了我们存储数据的内存使用量。

核函数的作用

高斯核函数意味着无限维度。

支持向量机svm — 左线性，右高斯

映射多了一个z轴，映射到了三维空间，然后切割

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/155434.html

赞 (0)

0

电子邮件中的密件抄送（密件抄送）是什么？

上一篇 2025-02-19 15:10

使用原生小程序组件Picker自定义日期时间选择器

下一篇 2025-02-19 15:15

发表回复

关注微信