支持向量机(sup维推作portvectormachines,SVM)是已获酸济城践兰密一种二分类模型,所谓二分类模型是指比如有很多特征(自变量X)对另外一个标签基十头义响项(因变量Y)的分类作用关系,比如当前有很多特征,包括身高、年龄、学历、收入、教育年限等共5项,因变量为‘是否吸烟’,‘是否吸烟’仅包括两项,吸烟和不吸烟。那么该5个特征项对于‘是否吸烟’的分类情况的作用关系研究,则称为‘二分类模型’,但事实上很多时候标签项(因变量Y)有很多个类别,比如某个标签项Y为‘菜系偏好’,中国菜系有很多,包括川菜、鲁菜、粤菜、闽菜、苏菜、浙菜360问答、湘菜和徽菜共计8类,此时则需要进行‘多分类决策函数’转化,简单理解为两两类别(8个中任意选择2)分别建立SVM模型,然后进行组合使用。
机器学习算法常见算法中包括决策树、随机森林、贝叶斯等,上述均有良好的可解释性,比如决策树是将特征按分割点不停地划分出类别,随机森林是多个决院队铁旧每承儿令系简区策树模型,贝叶斯模型是利用贝叶斯概率原理进行计算。与上述不同,支拉持向量机模型是利用运筹规划观财著约束求最优解,而此最优解是一个空间平面,此空间平面可以结合特征项,将‘吸固获欢阿委美顾生七经那烟’和‘不吸烟’两类完全地分开,寻找该空深依间平面即是支持向量机的核心算法原理。
支持向量机的计算原理复杂,但对其通俗地理解并不复杂,只热达海至城且需要知道其需要求买排粒套束西可抓什轴解出‘空间平面’,该‘空间平面’可以把不同的标签项(因变量Y)类别特别盟语明显的划分开即可。类似其它机器学习算法,支持向量机的构建步骤上,一般也需要先对数据矿友编太进行量纲化处理、设置训练数据和测试数据比例、设置相关参数调优,最终实现在训练数据上有着良好表现,并且测试数据上也有着良好表现即可。
支持向量机模型的原理上,其可见下图。
SPSSA叫掉宜U操作如下:
标签:SVM,mode