织梦CMS - 轻松建站从此开始!

罗索

渲染状态管理

落鹤生 发布于 2013-06-09 11:06 点击:次 
我们知道,使用OpenGL或Direct3D渲染图像时,首先要配置渲染状态,渲染状态用于控制渲染器的渲染行为。应用程式能够通过改变渲染状态来控制OpenGL或Direct3D的渲染行为。比如配置Vertex/Fragment Program、绑定纹理、打开深度测试、配置雾效等。
TAG:

简介: 

  提高3D图像程式的性能是个很大的课题。图像程式的优化大致能够分成两大任务,一是要有好的场景管理程式,能快速剔除不可见多边形,并根据对象距相机远近选择合适的细节(LOD);二是要有好的渲染程式,能快速渲染送入渲染管线的可见多边形。 
  我们知道,使用OpenGL或Direct3D渲染图像时,首先要配置渲染状态,渲染状态用于控制渲染器的渲染行为。应用程式能够通过改变渲染状态来控制OpenGL或Direct3D的渲染行为。比如配置Vertex/Fragment Program、绑定纹理、打开深度测试、配置雾效等。 
  改变渲染状态对于显卡而言是比较耗时的操作,而假如能合理管理渲染状态,避免多余的状态转换,将明显提升图像程式性能。这篇文章将讨论渲染状态的管理。 

基本思想 
  我 们考虑一个典型的游戏场景,包含人、动物、植物、建筑、交通工具、武器等。稍微分析一下就会发现,实际上场景里很多对象的渲染状态是相同的,比如任何的人 和动物的渲染状态一般都相同,任何的植物渲染状态也相同,同样建筑、交通工具、武器也是如此。我们能够把具备相同的渲染状态的对象归为一组,然后分组渲 染,对每组对象只需要在渲染前配置一次渲染状态,并且还能够保存当前的渲染状态,配置渲染状态时只需改变和当前状态不相同的状态。这样能够大大减少多余的 状态转换。
    下面的代码段演示了这种方法: 
  1. // 渲染状态组链表,由场景管理程式填充  
  2. RenderStateGroupList groupList;  
  3.  
  4. // 当前渲染状态  
  5. RenderState curState;  
  6.  
  7. ……  
  8.  
  9. // 遍历链表中的每个组  
  10. RenderStateGroup *group = groupList.GetFirst();  
  11. while (group)  
  12. {  
  13. // 配置该组的渲染状态  
  14. RenderState *state = group->GetRenderState();  
  15. state->ApplyRenderState( curState );  
  16.  
  17. // 该渲染状态组的对象链表  
  18. RenderableObjectList *objList = group->GetRenderableObjectList();  
  19.  
  20. // 遍历对象链表的每个对象  
  21. RenderableObject *obj = objList->GetFirst();  
  22. while (obj)  
  23. // 渲染对象 
  24. obj->Render(); 
  25. obj = objList->GetNext(); 
  26.  
  27. group = groupList.GetNext(); 
  28.  
  29. 其中RenderState类的ApplyRenderState方法形如:  
  30. void RenderState::ApplyRenderState(RenderState &curState) 
  31. // 深度测试  
  32. if (depthTest != curState.depthTest)  
  33. {  
  34. SetDepthTest(depthTest);  
  35. curState.depthTest = depthTest;  
  36.  
  37. // Alpha测试  
  38. if (alphaTest != curState.alphaTest)  
  39. {  
  40. SetAlphaTest(alphaTest);  
  41. curState.alphaTest = alphaTest;  
  42. }  
  43.  
  44. // 其他渲染状态  
  45. ……  
  46. }  

  这些分组的渲染状态一般被称为Material或Shader。这里Material不同于OpenGL和Direct3D里面用于光照的材质,Shader也不同于OpenGL里面的Vertex/Fragment Program和Direct3D里面的Vertex/Pixel Shader。而是指封装了的显卡渲染图像需要的状态(也包括了OpenGL和Direct3D原来的Material和Shader)。 

  从字面上看,Material(材质)更侧重于对象表面外观属性的描述,而Shader(这个词实在不好用中文表示)则有用程式控制对象表面外观的含义。由于显卡可编程管线的引入,渲染状态中包含了Vertex/Fragment Program,这些小程式能够控制物体的渲染,所以我觉得将封装的渲染状态称为Shader更合适。这篇文章也将称之为Shader。 

  上面的代码段只是简单的演示了渲染状态管理的基本思路,实际上渲染状态的管理需要考虑很多问题。 
渲染状态管理的问题 

   消耗时间问题 
   改变渲染状态时,不同的状态消耗的时间并不相同,甚至在不同条件下改变渲染状态消耗的时间也不相同。比如绑定纹理是个很耗时的操作,而当纹理已在显卡的 纹理缓存中时,速度就会很快。而且随着硬件和软件的发展,一些很耗时的渲染状态的消耗时间可能会有减少。因此并没有一个准确的消耗时间的数据。 

  虽然消耗时间无法量化,情况不同消耗的时间也不相同,但一般来说下面这些状态转换是比较消耗时间的: 
Vertex/Fragment Program模式和固定管线模式的转换(FF,Fixed Function Pipeline) 
Vertex/Fragment Program本身程式的转换 
改变Vertex/Fragment Program常量 
纹理转换 
顶点和索引缓存(Vertex & Index Buffers)转换 

  有时需要根据消耗时间的多少来做折衷,下面将会碰到这种情况。 

渲染状态分类 
   实际场景中,往往会出现这样的情况,一类对象其他渲染状态都相同,只是纹理和顶点、索引数据不同。比如场景中的人,只是身材、长相、服装等不同,也就是 说只有纹理、顶点、索引数据不同,而其他如Vertex/Fragment Program、深度测试等渲染状态都相同。相反,一般不会存在纹理和顶点、索引数据相同,而其他渲染状态不同的情况。我们能够把纹理、顶点、索引数据不 归入到Shader中,这样场景中任何的人都能够用一个Shader来渲染,然后在这个Shader下对纹理进行分组排序,相同纹理的人放在一起渲染。 

多道渲染(Multipass Rendering) 
   有些比较复杂的图像效果,在低档显卡上需要渲染多次,每次渲染一种效果,然后用GL_BLEND合成为最终效果。这种方法叫多道渲染Multipass Rendering,渲染一次就是个pass。比如做逐像素凹凸光照,需要计算环境光、漫射光凹凸效果、高光凹凸效果,在NV20显卡上只需要1个 pass,而在NV10显卡上则需要3个pass。Shader应该支持多道渲染,即一个Shader应该分别包含每个pass的渲染状态。
      不同的pass往往渲染状态和纹理都不同,而顶点、索引数据是相同的。这带来一个问题:是以对象为单位渲染,一次渲染一个对象的任何 pass,然后渲染下一个对象;还是以pass为单位渲染,第一次渲染任何对象的第一个pass,第二次渲染任何对象的第二个pass。下面的程式段演示 了这两种方式: 

以对象为单位渲染 
  1. // 渲染状态组链表,由场景管理程式填充  
  2. ShaderGroupList groupList;  
  3.  
  4. ……  
  5.  
  6. // 遍历链表中的每个组  
  7. ShaderGroup *group = groupList.GetFirst();  
  8. while (group)  
  9. {  
  10. Shader *shader = group->GetShader();  
  11.  
  12. RenderableObjectList *objList = group->GetRenderableObjectList();  
  13.  
  14. // 遍历相同Shader的每个对象  
  15. RenderableObject *obj = objList->GetFirst();  
  16. while (obj)  
  17. {  
  18. // 获取shader的pass数  
  19. int iNumPasses = shader->GetPassNum();  
  20. for (int i = 0; i < iNumPasses; i)  
  21. {  
  22. // 配置shader第i个pass的渲染状态  
  23. shader->ApplyPass( i );  
  24.  
  25. // 渲染对象  
  26. obj->Render();  
  27. }  
  28.  
  29. obj = objList->GetNext();  
  30. }  
  31.  
  32. group = groupList->GetNext();  
  33. }  

以pass为单位渲染 
  1. // 渲染状态组链表,由场景管理程式填充  
  2. ShaderGroupList groupList;  
  3.  
  4. ……  
  5.  
  6. for (int i = 0; i < MAX_PASSES_NUM; i)  
  7. {  
  8. // 遍历链表中的每个组  
  9. ShaderGroup *group = groupList.GetFirst();  
  10. while (group)  
  11. {  
  12. Shader *shader = group->GetShader();  
  13.  
  14.  
  15. // 假如shader的pass数小于循环次数,跳过此shader  
  16. int iNumPasses = shader->GetPassNum();  
  17. if (i >= iNumPasses)  
  18. {  
  19. group = groupList->GetNext();  
  20. continue;  
  21. }  
  22.  
  23. // 配置shader第i个pass的渲染状态  
  24. shader->ApplyPass(i);  
  25.  
  26. RenderableObjectList *objList = group->GetRenderableObjectList();  
  27.  
  28. // 遍历相同Shader的每个对象  
  29. RenderableObject *obj = objList->GetFirst();  
  30. while (obj)  
  31. {  
  32. obj->Render();  
  33.  
  34. obj = objList->GetNext();  
  35. }  
  36.  
  37. group = groupList->GetNext();  
  38. }  
  39. }  

  这两种方式各有什么优缺点呢? 

   以对象为单位渲染,渲染一个对象的第一个pass后,马上紧接着渲染这个对象的第二个pass,而每个pass的顶点和索引数据是相同的,因此第一个 pass将顶点和索引数据送入显卡后,显卡Cache中已有了这个对象顶点和索引数据,后续pass不必重新将顶点和索引数据拷到显卡,因此速度会很快。 而问题是每个pass的渲染状态都不同,这使得实际上每次渲染都要配置新的渲染状态,会产生大量的多余渲染状态转换。 

  以pass为单位渲染则正好相反,以Shader分组,相同Shader的对象一起渲染,能够只在这组开始时配置一次渲染状态,相比以对象为单位,大大减少了渲染状态转换。可是每次渲染的对象不同,因此每次都要将对象的顶点和索引数据拷贝到显卡,会消耗不少时间。 
  可见想减少渲染状态转换就要频繁拷贝顶点索引数据,而想减少拷贝顶点索引数据又不得不增加渲染状态转换。鱼和熊掌不可兼得 :-( 
  由于硬件条件和场景数据的情况比较复杂,具体哪种方法效率较高并没有定式,两种方法都有人使用,具体选用那种方法需要在实际环境测试后才能知道。 

 多光源问题 
待续…… 

 阴影问题 
待续…… 

渲染脚本 
  现在很多图像程式都会自己定义一种脚本文档来描述Shader。 

  比如较早的OGRE(Object-oriented Graphics Rendering Engine,面向对象图像渲染引擎)的Material脚本,Quake3的Shader脚本,连同刚问世不久的Direct3D的Effect File,nVIDIA的CgFX脚本(文档格式和Direct3D Effect File兼容),ATI RenderMonkey使用的xml格式的脚本。OGRE Material和Quake3 Shader这两种脚本比较有历史了,不支持可编程渲染管线。而后面三种比较新的脚本都支持可编程渲染管线。 

      脚本                            特性                                                                范例 
      OGRE Material              封装各种渲染状态,不支持可编程渲染管线                >>>> 
      Quake3 Shader            封装渲染状态,支持一些特效,不支持可编程渲染管线  >>>> 
      Direct3D Effect File       封装渲染状态,支持multipass,支持可编程渲染管线   >>>> 
      nVIDIA CgFX脚本          封装渲染状态,支持multipass,支持可编程渲染管线   >>>> 
      ATI RenderMonkey脚本  封装渲染状态,支持multipass,支持可编程渲染管线   >>>> 

  使用脚本来控制渲染有很多好处: 
能够很方便的修改一个物体的外观而不需重新编写或编译程式 
能够用外围工具以所见即所得的方式来创建、修改脚本文档(类似ATI RenderMonkey的工作方式),便于美工、关卡设计人员设定对象外观,建立外围工具和图像引擎的联系 
能够在渲染时将相同外观属性及渲染状态的对象(也就是Shader相同的对象)归为一组,然后分组渲染,对每组对象只需要在渲染前配置一次渲染状态,大大减少了多余的状态转换
(SLegend)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/201306/16654.html]
本文出处:新浪博客 作者:SLegend 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容