OpenCV 2.4+ C++ SVM线性不可分处理

  • 时间:
  • 浏览:0
  • 来源:大发uu快3_uu快3邀请码_大发uu快3邀请码

OpenCV 2.4+ C++ SVM线性不可分补救

2012-11-26 09:49  Justany_WhiteSnow  阅读(...)  评论()  编辑  收藏

目的

  • 实际事物模型中,不须所有东西有的是线性可分的。
  • 需用寻找一种方法 对线性不可分数据进行划分。

原理

上一篇文章,大家儿推导出对于线性可分数据,最佳划分超平面应满足:

    

现在大家儿想引入就是东西,来表示哪些地方地方被错分的数据点(比如噪点),对划分的影响。

要怎样来表示哪些地方地方影响呢?

被错分的点,离买车人应当居于的区域越远,就代表了,这就是“错”得越严重。

就是大家儿引入,为对应样本离类事区域的距离。

接下来的难题是,要怎样将你这种错的程度,转换为和原模型相同的度量呢?

大家儿再引入一个 常量C,表示和原模型度量的转换关系,用C对进行加权和,来表征错分点对原模型的影响,原先大家儿得到新的最优化难题模型:

    

关于参数C的取舍, 明显的取决于训练样本的分布情况报告。 尽管不须居于一个 普遍的答案,就是记住下面几点规则还是有用的:

  • C比较大时分类错误率较小,就是间隔也较小。 在你这种情况报告下, 错分类对模型函数产生较大的影响,既然优化的目的是为了最小化你这种模型函数,没人 错分类的情况报告必然会受到抑制。
  • C比较小时间隔较大,就是分类错误率也较大。 在你这种情况报告下,模型函数中错分类之和你这种项对优化过程的影响变小,优化过程将更加关注于寻找到一个 能产生较大间隔的超平面。

 说白了,C的大小表征了,错分数据对原模型的影响程度。于是C越大,优化时越关注错分难题。反之越关注可不需用产生一个 较大间隔的超平面。

结束了英语 使用

#include <iostream>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/ml/ml.hpp>

#define NTRAINING_SAMPLES   100         // 每类训练样本的数量
#define FRAC_LINEAR_SEP     0.9f        // 线性可分要素的样本组成比例

using namespace cv;
using namespace std;

int main(){
    // 用于显示的数据
    const int WIDTH = 512, HEIGHT = 512;
    Mat I = Mat::zeros(HEIGHT, WIDTH, CV_8UC3);

    /* 1. 随即产生训练数据 */
    Mat trainData(2*NTRAINING_SAMPLES, 2, CV_32FC1);
    Mat labels   (2*NTRAINING_SAMPLES, 1, CV_32FC1);
    
    RNG rng(100); // 生成随即数

    // 设置线性可分的训练数据
    int nLinearSamples = (int) (FRAC_LINEAR_SEP * NTRAINING_SAMPLES);

    // 生成分类1的随机点
    Mat trainClass = trainData.rowRange(0, nLinearSamples);
    // 点的x坐标在[0, 0.4)之间
    Mat c = trainClass.colRange(0, 1);
    rng.fill(c, RNG::UNIFORM, Scalar(1), Scalar(0.4 * WIDTH));
    // 点的y坐标在[0, 1)之间
    c = trainClass.colRange(1,2);
    rng.fill(c, RNG::UNIFORM, Scalar(1), Scalar(HEIGHT));

    // 生成分类2的随机点
    trainClass = trainData.rowRange(2*NTRAINING_SAMPLES-nLinearSamples, 2*NTRAINING_SAMPLES);
    // 点的x坐标在[0.6, 1]之间
    c = trainClass.colRange(0 , 1); 
    rng.fill(c, RNG::UNIFORM, Scalar(0.6*WIDTH), Scalar(WIDTH));
    // 点的y坐标在[0, 1)之间
    c = trainClass.colRange(1,2);
    rng.fill(c, RNG::UNIFORM, Scalar(1), Scalar(HEIGHT));

    /* 设置非线性可分的训练数据 */

    // 生成分类1和分类2的随机点
    trainClass = trainData.rowRange(  nLinearSamples, 2*NTRAINING_SAMPLES-nLinearSamples);
    // 点的x坐标在[0.4, 0.6)之间
    c = trainClass.colRange(0,1);
    rng.fill(c, RNG::UNIFORM, Scalar(0.4*WIDTH), Scalar(0.6*WIDTH)); 
    // 点的y坐标在[0, 1)之间
    c = trainClass.colRange(1,2);
    rng.fill(c, RNG::UNIFORM, Scalar(1), Scalar(HEIGHT));
    
    /* 设置分类标签 */
    labels.rowRange(                0,   NTRAINING_SAMPLES).setTo(1);  // Class 1
    labels.rowRange(NTRAINING_SAMPLES, 2*NTRAINING_SAMPLES).setTo(2);  // Class 2

    /* 设置支持向量机参数 */
    CvSVMParams params;
    params.svm_type    = SVM::C_SVC;
    params.C           = 0.1;
    params.kernel_type = SVM::LINEAR;
    params.term_crit   = TermCriteria(CV_TERMCRIT_ITER, (int)1e7, 1e-6);

    /* 3. 训练支持向量机 */
    cout << "Starting training process" << endl;
    CvSVM svm;
    svm.train(trainData, labels, Mat(), Mat(), params);
    cout << "Finished training process" << endl;
    
    /* 4. 显示划分区域 */
    Vec3b green(0,100,0), blue (100,0,0);
    for (int i = 0; i < I.rows; ++i)
        for (int j = 0; j < I.cols; ++j){
            Mat sampleMat = (Mat_<float>(1,2) << i, j);
            float response = svm.predict(sampleMat);

            if      (response == 1)    I.at<Vec3b>(j, i)  = green;
            else if (response == 2)    I.at<Vec3b>(j, i)  = blue;
        }

    /* 5. 显示训练数据 */
    int thick = -1;
    int lineType = 8;
    float px, py;
    // 分类1
    for (int i = 0; i < NTRAINING_SAMPLES; ++i){
        px = trainData.at<float>(i,0);
        py = trainData.at<float>(i,1);
        circle(I, Point( (int) px,  (int) py ), 3, Scalar(0, 255, 0), thick, lineType);
    }
    // 分类2
    for (int i = NTRAINING_SAMPLES; i <2*NTRAINING_SAMPLES; ++i){
        px = trainData.at<float>(i,0);
        py = trainData.at<float>(i,1);
        circle(I, Point( (int) px, (int) py ), 3, Scalar(255, 0, 0), thick, lineType);
    }

    /* 6. 显示支持向量 */
    thick = 2;
    lineType  = 8;
    int x     = svm.get_support_vector_count();

    for (int i = 0; i < x; ++i)
    {
        const float* v = svm.get_support_vector(i);
        circle( I,  Point( (int) v[0], (int) v[1]), 6, Scalar(128, 128, 128), thick, lineType);
    }

    imwrite("result.png", I);                      // 保存图片
    imshow("SVM线性不可分数据划分", I); // 显示给用户
    waitKey(0);
}

设置SVM参数

这里的参数设置可不需用参考一下上一篇文章的API。

CvSVMParams params;
params.svm_type    = SVM::C_SVC;
params.C              = 0.1;
params.kernel_type = SVM::LINEAR;
params.term_crit   = TermCriteria(CV_TERMCRIT_ITER, (int)1e7, 1e-6);

 可不需用就看,这次使用的是C类支持向量分类机。其参数C的值为0.1。

 结果

  • 分类 Computer Vision
  • 标签 OpenCV