织梦CMS - 轻松建站从此开始!

罗索

目标检测学习_1(用opencv自带hog实现行人检测)

落鹤生 发布于 2014-08-16 22:59 点击:次 
本文主要介绍下opencv中怎样使用hog算法,因为在opencv中已经集成了hog这个类。其实使用起来是很简单的,从后面的代码就可以看出来。本文参考的资料为opencv自带的sample。
TAG: 目标检测  行人检测  

本文主要介绍下opencv中怎样使用hog算法,因为在opencv中已经集成了hog这个类。其实使用起来是很简单的,从后面的代码就可以看出来。本文参考的资料为opencv自带的sample。

   关于opencv中hog的源码分析,可以参考本人的另一篇博客:opencv源码解析之(6):hog源码分析

  开发环境:opencv2.4.2+Qt4.8.2+ubuntu12.04+QtCreator2.5.

  实验功能:

  单击Open Image按钮,选择需要进行人检测的一张图片,确定后自动显示出来。该图片的大小没限制。

  单击People Detect按钮,则程序会自动对该图片进行行人检测,且将检测到的效果显示出来,即用1个矩形框将行人框出来。

  单击Close按钮,退出程序。 

  实验说明:

  1. hog描述子在opencv中为HOGDescriptor。

  2. 可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值,这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数,因为这些参数是用很多图片训练而来的。  

  3. 对输入图片进行行人检测时由于图片的大小不一样,所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下:

HOGDescriptor::detectMultiScale(const GpuMat& img, vector<Rect>& found_locations, doublehit_threshold=0, Size win_stride=Size(), Size padding=Size(), double scale0=1.05, int group_threshold=2)

  该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片;found_locations为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。

   4.  最后对检测出来的目标矩形框,要采用一些方法处理,比如说2个目标框嵌套着,则选择最外面的那个框。
   5.  因为hog检测出的矩形框比实际人体框要稍微大些,所以需要对这些矩形框大小尺寸做一些调整。

实验结果: 图片1效果:

  

 图片2效果:

  

 图片3效果:

  

 图片4效果:

  

实验主要部分代码(附录有工程code下载链接)

 

  1. #include "dialog.h" 
  2. #include "ui_dialog.h" 
  3. #include <QtCore> 
  4. #include <QtGui> 
  5.  
  6. Dialog::Dialog(QWidget *parent) : 
  7.     QDialog(parent), 
  8.     ui(new Ui::Dialog) 
  9.     ui->setupUi(this); 
  10.  
  11. Dialog::~Dialog() 
  12.     delete ui; 
  13.  
  14. void Dialog::on_openButton_clicked() 
  15.     QString img_mame = QFileDialog::getOpenFileName(this"Open img""../people"
  16. , tr("Image Files(*.png *.jpg *.bmp *.jpeg)")); 
  17.     img = imread( img_mame.toAscii().data() ); 
  18.     imwrite("../hog_test.jpg", img); 
  19.     ui->textBrowser->setFixedSize(img.cols, img.rows); 
  20.     ui->textBrowser->append("<img src=../hog_test.jpg>"); 
  21.  
  22. void Dialog::on_detectButton_clicked() 
  23.     vector<Rect> found, found_filtered; 
  24.     cv::HOGDescriptor people_dectect_hog; 
  25.     //采用默认的已经训练好了的svm系数作为此次检测的模型 
  26.     people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector()); 
  27.     //对输入的图片img进行多尺度行人检测 
  28.     //img为输入待检测的图片;found为检测到目标区域列表;参数3为程序内部计算为
  29. //行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离; 
  30.     //参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的
  31. //大小;参数6为比例系数,即测试图片每次尺寸缩放增加的比例; 
  32.     //参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起
  33. //了调节作用,为0时表示不起调节作用。 
  34.     people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2); 
  35.  
  36.     //从源码中可以看出: 
  37.     //#define __SIZE_TYPE__ long unsigned int 
  38.     //typedef __SIZE_TYPE__ size_t; 
  39.     //因此,size_t是一个long unsigned int类型 
  40.     size_t i, j; 
  41.     for (i = 0; i < found.size(); i++ ) 
  42.         { 
  43.             Rect r = found[i]; 
  44.  
  45.             //下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的 
  46.            //话,则取外面最大的那个矩形框放入found_filtered中 
  47.             for(j = 0; j <found.size(); j++) 
  48.                 if(j != i && (r&found[j])==r) 
  49.                     break
  50.             if(j == found.size()) 
  51.                found_filtered.push_back(r); 
  52.         } 
  53.  
  54.     //在图片img上画出矩形框,因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要 
  55.     //做一些调整 
  56.     for(i = 0; i <found_filtered.size(); i++) 
  57.         { 
  58.             Rect r = found_filtered[i]; 
  59.             r.x += cvRound(r.width*0.1); 
  60.             r.width = cvRound(r.width*0.8); 
  61.             r.y += cvRound(r.height*0.07); 
  62.             r.height = cvRound(r.height*0.8); 
  63.             rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3); 
  64.         } 
  65.     imwrite("../hog_test_result.jpg", img); 
  66.     ui->textBrowser->clear(); 
  67.     ui->textBrowser->append("<img src=../hog_test_result.jpg>"); 
  68.  
  69.  
  70. void Dialog::on_closeButton_clicked() 
  71.     close(); 


实验总结:
从实验的结果来看,图片检测的准确率一般,当人体遮挡情况比较严重,且背景比较复杂时,有些误检和漏检。不过程序的检查速度还行,因为源码中用做了些优化处理。

(tornadomeet)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://dev.open365.com.cn/a/201408/17025.html]
本文出处:博客园 作者:tornadomeet 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容