一、安装libsvm

（非 python 64版本这里不完全适应）

1、直接到官网下载 .zip包然后放到你喜欢的目录并解压

2、压缩后有个 windows 文件夹里面第一个就是 libsvm.dll 的动态链接库，把他复制放到 C:\Windows\System32下面

（因为我的是64bit的python 动态链接库也是64bit的所以我可以直接用，如果是32位的话需要重新编译一个新的.dll文件放到上面的那个路径下）

3、在Pycharm的使用

因为没有添加路径给pycharm,此时pycharm不能识别所以需要到setting -> Project interpreter -> 齿轮 -> Show All -> Show paths for the selected interpreter(右侧图标最下面一个) - > 添加libsvm下面的python 路径 (如: G:\libsvm\libsvm-3.23\python)

注意后来发现上面的那种并没有实际添加到sys.path 下面有两种可行的方法：

（1）手动添加搜索路径

import os,syspath = "G:\libsvm\libsvm-3.23\python"sys.path.append(path)

（2）

到libsvm把 python包复制到当前任意一个搜索路径下例如G:\virtualenv_home\py3\lib\site-packages 下面然后

from python.svmutil import *  导入 即可

至此安装已经完成

二、安装gnuplot

到官网找到download 然后注意在页面选择 file文件下面点进去找到 .exe 文件就可以一键式安装了

二、使用

1、使用 grid.py 进行参数选择（C， gamma）(需要安装python 我的是py3.64 64bit)

（1）到Libsvm的 tools文件夹下找到grid 用编辑器打开或者右键用python自带的 IDLE 打开会看到如下界面，

第一个是对非win32，其实是非windows而言（因为我win64用第二个也正常），看到else下面2个路径，第一个不用管（前提你没有改变原本libsvm的相对路径结构），修改第二个为你下载的 gnuplot.exe 路径(在 bin目录下)

python 如果加入全局path了的话可以直接在cmd 下面 python grid.py ../heart_scale (第一个参数为运行的文件，第二个参数为数据文件以相对路径给出) 这样就会看到cmd中飞速的出现数据，并且同时gnuplot汇出漂亮的图，并在最后给出选出的参数。

分别是 C，gamma，正确率

最后会发现在tools下面多出来 xxx.out ,xxx.png 就是刚才运行的结果。

2、使用easy.py 进行一站式操作（参数选择，预测）

（1）首先和刚才一样修改 gnuplot路径，然后就可以执行了

python easy.py ../heart_scale ../heart_test （第一个为原始数据，第二个为测试数据）

会发现 tools 中多出了好几个文件。。。

三、python （pycharm）下的使用

分为svmutil、svm.两个接口其中svmutil为高层接口，svm.py为底层接口

svm.py主要运用了四个数据结构svm_node, svm_problem, svm_parameter和svm_model。

svmutil中主要包含了以下几个函数：

svm_problem() : read_problem

svm_train() : train an SVM model

svm_predict() : predict testing data

svm_read_problem() : read the data from a LIBSVM-format file.

svm_load_model() : load a LIBSVM model.

svm_save_model() : save model to a file.

evaluations() : evaluate prediction results.

一、里面有两个关于读取problem的

（1）svm_problem()

y, x = [1,-1], [{0:1, 1:2, 2:-2}, {0:2, 1:-2, 2:2}]

prob = svm_problem(y, x)

(2)svm_read_problem()

y, x = svm_read_problem('../heart_scale')

可见两种区别：前者读取问题的标签，特征存储在prob里面自动转换为libsvm可以接收的数据格式（但是需要index连续，请参照libsvm数据集的格式），

后者直接从libsvm格式数据读取数据返回标签、特征

其中：l 为训练数据数量，y是存储标签的数组，x存储训练数据（指针的指针）

struct svm_problem

{

int l;

double *y;

struct svm_node **x;

};

二、svm_train()

Usage: svm-train [options] training_set_file [model_file]

options:
-s svm_type : set type of SVM (default 0)
   0 -- C-SVC       (multi-class classification)
   1 -- nu-SVC       (multi-class classification)
   2 -- one-class SVM
   3 -- epsilon-SVR   (regression)
   4 -- nu-SVR       (regression)
-t kernel_type : set type of kernel function (default 2)
   0 -- linear: u'*v
   1 -- polynomial: (gamma*u'*v + coef0)^degree
   2 -- radial basis function: exp(-gamma*|u-v|^2)
   3 -- sigmoid: tanh(gamma*u'*v + coef0)
   4 -- precomputed kernel (kernel values in training_set_file)
-d degree : set degree in kernel function (default 3)
-g gamma : set gamma in kernel function (default 1/num_features)
-r coef0 : set coef0 in kernel function (default 0)
-c cost : set the parameter C of C-SVC, epsilon-SVR, and nu-SVR (default 1)
-n nu : set the parameter nu of nu-SVC, one-class SVM, and nu-SVR (default 0.5)
-p epsilon : set the epsilon in loss function of epsilon-SVR (default 0.1)
-m cachesize : set cache memory size in MB (default 100)
-e epsilon : set tolerance of termination criterion (default 0.001)
-h shrinking : whether to use the shrinking heuristics, 0 or 1 (default 1)
-b probability_estimates : whether to train a SVC or SVR model for probability estimates, 0 or 1 (default 0)
-wi weight : set the parameter C of class i to weight*C, for C-SVC (default 1)
-v n: n-fold cross validation mode
-q : quiet mode (no outputs)

这是 svm_train（）的可选参数，其中比较常用几个是

-s 分类回归选择

-t 核函数类型

-c 惩罚系数

-g 核函数里面的一个参数

（1）直接传 libsvm格式的 label,feature, parameter

m = svm_train(y[:200], x[:200], '-c 4')

(2) 整体传参

prob = svm_problem(y, x)

param = svm_parameter('-t 0 -c 4 -b 1')

m = svm_train(prob, param)

m 是一个 ctype 类型指针指向svm_model