织梦CMS - 轻松建站从此开始!

罗索

基于图像的3d建模:部分历史与现状

落鹤生 发布于 2011-02-17 10:24 点击:次 
3d建模处于计算机视觉,计算机图形学,计算机辅助设计的核心。是很多领域的基础性工作,主流的3d建模技术分为三类
TAG:

3d建模处于计算机视觉,计算机图形学,计算机辅助设计的核心。是很多领域的基础性工作,主流的3d建模技术分为三类:

手工建模:即使用3d max,maya,pro/E ,Autocad等软件人工建模,这种方式的好处是准确地反映设计意图,可操控型高,缺点是需时长,需要较高技术能力人员,且在对已知物体(如建筑物,生物体)建模时缺乏精度,且需要额外的测量工作。

自动建模:即基于现实的物体,由计算机程序经一系列的机械步骤,形成3D模型的过程。

好处是速度快,操作方便,可实现自动化和序列化过程。

交互式建模:在自动建模的基础上,在建模的过程中加入一系列的可控性阶段,由技术人员参与建模,可以说是综合了以上两种建模的好处。

由此可见,自动建模技术,是3D建模的核心和主要发展方向,当前的大部分理论研究也集中于此,主要可分为如下两个方面:

1。基于实体的采样技术。即通过对实体的接触式测绘(红外,激光等)获得实体的形体数据的点云数据(通常在百万个点的规 模),再通过一系列的模拟和逼近方式以点重现曲线,以曲线重现曲面,进而构建出整个实体的模型。这种技术的好处是精度高,且难度主要在测绘上,建模本身技 术难度不大。缺陷是数据量大,且需要专门的仪器,同时对实体的表面形状有一定的要求。主要用于工业上的反向工程,医学上的组织模拟等等。技术已基本成熟, 当前发展点主要是快速处理大量数据。

2。基于图像的恢复技术。即基于实体的一幅或多幅位图图像,通过对图像的分析重建实体。整个过程与人类视觉重现过程相似。技 术的好处是数据量不大,不需要专门仪器,应用面很广,难处是图像的精度直接决定重建效果,且技术难度高,可靠性不如前者,适于对精度要求不高的方面,如动 作捕捉,地形测绘等等。也是目前发展的重点。

这一技术分为单幅图像和序列图像两个方面:

(1)基于单幅图像

单幅图像的基本思想是利用对比度,灰度等图像特征确定光照的反射,再由此进一步确定图像的深度,从而确定物体的形体信息。一般说来,主要是通过纹理,轮廓,阴影三种方面恢复形体信息。

纹理方法(shape from texture)把物体看作由一系列相同纹理元组成,在物体通过光照反射形成图像时,相同的纹理由于物体的形状形成不同的图像,于是反过来,在不同的图像中就包含了物体的形状信息。这种方法精度低,实用性不强,很少使用。

阴影方法(shape from shading)利用成像表面的明暗变化,解析出物体的表面深度信息,于七十年代早期由Horn提出,属于实际中应用较广的方法,此方法在理想光照条件下 有很好的效果,但是现实中物体,光照往往不能满足理想光照条件,于是便加上一些附加约束条件,从而形成如下几种方法:

①最小值算法

②演化算法

③局部分析法

④线性化算法

(2)基于序列图像

序列图像的好处是有效数据多,可通过线性方法确定光照,反射等不变量,在这方面主要有三种方法

1.光度立体学法 这种方法是通过一系列不同光照条件下物体的图像,确定与所给像素对应的物体表面的朝向。主要难点有两个:①基于光度立体学的法向计算②由梯度恢复三维信 息。其中后者在前面提到的最小值算法中也有。这种方法的好处是实现简单,但需要改变光照条件,需要可控器材,故运用不多。

2.立体视觉法 这种方法是最为传统的方法,发展时间也最久,主要思路是通过不同图像之间的匹配,得到摄像机矩阵和本质矩阵,从而反推出摄像机运动参数(当前讨论局限于线 性运动),然后通过经典的立体视觉方法恢复物体的三维形状。由于计算机图形学中此方面算法已经很成熟,此方法的难点就是不同图像之间的匹配问题。据查,主 要有两种匹配方式:

(1)区域匹配 即基于灰度的匹配,这种方法中心思想是假定图像序列间具有灰度的相似性,在一幅图像中以一点为中心选定一个区域,在另外一幅图像中寻找与该区域相似度最大 的区域,这样建立起两个区域中心的对应匹配关系。这种方法的优点是:可以得到稠密的匹配点集,便于后续的视差和深度计算,而且比较适合纹理丰富的区域和相 对运动较小的图像对。缺点是计算量大,对噪声敏感。

(2)特征匹配 即基于基元的方式,抽取出图像中独特的特征基元,如角点,边缘段,轮廓等,然后在两幅或者多幅图像中仅仅对这些基元进行匹配,于是把图像的匹配转化为基元 图(矢量点线图)的匹配。这种方法的效率比较高,因为只有一个很小的集合用于匹配,精度高,且基元可直接用于恢复物体形状,但是,一旦不能很好的监测出基 元,匹配效果就很差,在我们项目做设想的时候,主要就考虑的是特征匹配算法。

3光流法 也称运动法,其原理是利用图像中物体的运动,运动可用运动场描述,运动场是由图像中每个点的运动(速度)矢量构成的。当目标在相机前运动或相机在一个固定 的环境中运动时,所获得的对应图像的变化可用来恢复相机和目标间的相对运动及场景中多个目标的位置关系,当相机与场景目标间有相对运动时所观察到的亮度模 式运动称为光流,光流代表了目标的运动信息,可用来确定观察者相对目标的运动情况,并可根据像流解得物体的表面朝向。但这种方法缺点很明显:不能用于不变 动的物体。主要用于动作的捕捉和再现。

我的设想:以上所有的算法都是尽可能提取出各种模型参数,然后重建模型,那么,可不可以采用一种模型重用的方法,一开始就对物体的形状做一定的假定,再根据数据修改参数,即“轮廓加参数”方法,把交互式建模的好处吸收进来?这或许可以作为以后的发展方向。

文章:来源

(moonrose)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/201102/10909.html]
本文出处:blog.gkong.com 作者:moonrose
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容