11.1 几何着色器编程
若我们不使用曲面细分阶段,则几何着色器(geometry shader)阶段是一个可选阶段,它位于顶点着色器和像素着色器阶段之间。顶点着色器以顶点作为输入数据,而几何着色器以完整的图元作为输入数据。例如,当我们绘制三角形列表时,几何着色器处理的是列表中的每个三角形T:
for(UINT i = 0; i < numTriangles; ++i) OutputPrimitiveList = GeometryShader(T[i].vertexList);
注意,这里是将每个三角形的3个顶点作为几何着色器的输入数据,几何着色器的输出为图元列表。顶点着色器无法创建或销毁顶点,而几何着色器的主要优点就是它可以创建或销毁几何体;这样就可以在GPU上实现一些有趣的效果。例如,几何着色器可以将输入图元扩展为一个或多个其他图元,或者根据一些条件屏蔽某些图元的输出。注意,输出图元可以与输入图元的类型不同;例如,几何着色器的常见用途是将一个点扩展为一个四边形(即,两个三角形)。
几何着色器的输出图元由一个顶点列表来描述。在顶点离开几何着色器之前,顶点坐标必须变换到齐次裁剪空间。在几何着色器阶段之后,顶点列表描述的是齐次裁剪空间中的图元。与往常一样,这些顶点会被投影(齐次除法),随后进行光栅化处理。
学习目标
- 学习如何编写几何着色器。
- 理解如何使用几何着色器实现高效的广告牌算法。
- 了解自动生成的图元ID以及它的一些用途。
- 学习如何创建和使用纹理数组,以及纹理数组的一些用途。
- 理解alpha-to-coverage是如何改进alpha剪裁中的锯齿问题的。
几何着色器编程与顶点/像素着色器编程非常相似,只是略有一些差异。下面的代码展示了它的一般格式:
[maxvertexcount(N)] void ShaderName ( PrimitiveType InputVertexType InputName [NumElements], inout StreamOutputObject<OutputVertexType>OutputName) { // Geometry shader body... }
首先,我们必须指定每次调用几何着色器时所能输出的顶点的最大数量。这一工作通过在着色器定义之前指定maxvertexcount属性来实现:
[maxvertexcount(N)]
其中,N是每次调用几何着色器时所能输出的顶点的最大数量。几何着色器每次输出的顶点数量都可以不同,只要不超过指定的最大值就没问题。从性能方面考虑,maxvertexcount应尽可能小,[NVIDIA08]指出当GS的输出介于1-20个标量之间时性能最佳,在27-40个标量之间则性能损失50%。每次调用输出的标量大小是指maxvertexcount的生成和在输出顶点类型结构中的标量数量。有了这个限定,实际工作会非常困难,你要么接受性能的损失,要么选择不使用几何着色器而用别的方法代替;但是,我们必须要考虑到别的方法也会有缺点,可能几何着色器反而是个较好的选择。而且,[NVIDIA08]中的推荐设置发表于2008(几何着色器第一次发布),所以现在可能已经改进过了。
几何着色器有两个参数:一个输入参数和一个输出参数。(其实,它的参数不只两个,我们会在后面的11.2.4节专门讨论个话题。)输入参数总是一个顶点数组,它可以表示:单个顶点、由两个顶点构成的直线、由3个顶点构成的三角形、由4个顶点构成的带有邻接信息的直线、由6个顶点构成的带有邻接信息的三角形。输入的顶点类型与顶点着色器返回的顶点类型相同(例如,VertexOut)。输入参数必须加上一个图元类型前缀,描述将要输入到几何着色器的图元类型。可以使用的图元类型包括:
1.point:输入图元为点。
2.line:输入图元为直线(列表或线带)。
3.triangle:输入图元为三角形(列表或线带)。
4.lineadj:输入图元为带有邻接信息的直线(列表或线带)。
5.triangleadj:输入图元为带有邻接信息的三角形(列表或线带)。
注意:几何着色器的输入图元总是一个完整的图元(例如,由两个顶点构成一条直线、由三个顶点构成一个三角形)。这样,几何着色器就不需要区分列表和线带了。例如,在绘制三角形线带时,几何着色器会处理线带中的每个三角形,而且每个三角形的3个顶点都会作为输入数据传入到几何着色器中。这会导致额外的工作,因为几何着色器会重复处理被多个图元共享的顶点。
输出参数总是带有inout修饰符,并且是一个流类型(stream type)对象。流类型用于存储由几何着色器输出的几何体顶点列表。几何着色器使用内置的Append方法向输出流添加顶点:
void StreamOutputObject<Outputvertextype>::Append(OutputVertexType v);
流类型是一种模板类型(template type), 其中的模板参数用于指定输出顶点的类型(例如,GeoOUT)。这里有3种可以使用的流类型:
1.PointStream<OutputVertexType>:描述单个点的顶点列表。
2.LineStream<OutputVertexType>:描述直线线带的顶点列表。
3.TriangleStream<OutputVertexType>:描述三角形线带的顶点列表。
几何着色器以图元为单位输出顶点;输出图元的类型由流类型(PointStream、LineStream、TriangleStream)决定。对于直线和三角形来说,输出图元总是一个线带。不过,我们也可使用内置的RestartStrip方法模拟输出直线列表和三角形列表:
void StreamOutputObject<Outputvertextype>::RestartStrip();
例如,当你希望输出一个三角形列表时,你应该每输出3个顶点,调用一次RestartStrip方法(也就是,在每调用3次Append 方法之后,调用一次RestartStrip方法)。下面是一些几何着色器签名的例子:
// 例1: GS最多输出4个顶点。输入图元为一条线,输出为一个三角形线带。 // [maxvertexcount(4)] void GS(line VertexOutT gin[2], inout TriangleStream<GeoOut> triStream) { // Geometry shader body... } // // EXAMPLE 2: GS outputs at most 32 vertices.The input primitive is a triangle. The output is a triangle strip. // [maxvertexcount(32)] void GS(triangle VertexOut gin[3], inout TriangleStream<GeoOut> triStream) { // Geometry shader body... } // // EXAMPLE 3: GS outputs at most 4 vertices. The input primitive // is a point. The output is a triangle strip. // [maxvertexcount(4)] void GS(point VertexOut gin[1], inout TriangleStream<GeoOut> triStream) { // Geometry shader body... }
下面的几何着色器解释了Append和RestartStrip方法的用法;它输入一个三角形,对它进行细分(参见图11.1),并输出4个细分后的三角形:
struct VertexOut { float3 posL : POSITION; float3 normalL : NORMAL; float2 Tex : TEXCOORD; }; struct GeoOut { loat4 posH : SV_POSITION; float3 posW : POSITION; float3 normalW : NORMAL; float2 Tex : TEXCOORD; float FogLerp : FOG; } void Subdivide (VertexOut inVerts[3], out VertexOut outVerts[6]) { // 1 // * // / \ // / \ // m0*-----*m1 // / \ / \ // / \ / \ // *-----*-----* // 0 m2 2 VertexOut m[3]; // 计算每条边的中点 m[0].PosL = 0.5f*(inVerts[0].PosL+inVerts[1].PosL); m[1].PosL = 0.5f*(inVerts[1].PosL+inVerts[2].PosL); m[2].PosL = 0.5f*(inVerts[2].PosL+inVerts[0].PosL); // 投影到一个单位圆上 m[0].PosL = normalize(m[0].PosL); m[1].PosL = normalize(m[1].PosL); m[2].PosL = normalize(m[2].PosL); // 求得法线 m[0].NormalL = m[0]. Pos L; m[1].NormalL = m[1]. Pos L; m[2].NormalL = m[2]. Pos L; // 插值求得纹理坐标 m[0].Tex = 0.5f*(inVerts[0].Tex+inVerts[1].Tex); m[1].Tex = 0.5f*(inVerts[1].Tex+inVerts[2].Tex); m[2].Tex = 0.5f*(inVerts[2].Tex+inVerts[0].Tex); outVerts[0] = inVerts[0]; outVerts[1] = m[0]; outVerts[2] = m[2]; outVerts[3] = m[1]; outVerts[4] = inVerts[2]; outVerts[5] = inVerts[1]; } ; void OutputSubdivision(VertexOut v[6],inout TriangleStream<GeoOut> triStream) { GeoOut gout[6]; [unroll] for(int i = 0; i < 6; ++i) { // 转换到世界空间 gout[i].PosW = mul(float4(v[i].PosL,1.0f), gWorld).xyz; gout[i].NormalW = mul(v[i].NormalL,(float3x3)gWorldInvT ranspose); // 转换到齐次剪裁空间 gout[i].PosH = mul(float4(v[i].PosL,1.0f), gWorldViewProj); gout[i].Tex = v[i].Tex; } // 1 // * // / \ // / \ // m0*-----*m1 // / \ / \ // / \ / \ // *-----*-----* // 0 m2 2 // 我们可以使用两个线带绘制细分三角形: // 第一个:底部的三个三角形 // 第二个:顶部的一个三角形 [unroll] for(int j = 0; j < 5; ++j ) { triStream.Append(gout[j]); } triStream.RestartStrip(); triStream.Append(gout[1]); triStream.Append(gout[5]); triStream.Append(gout[3]); } [maxvertexcount(8)] void GS(triangle VertexOut gin[3], inout TriangleStream<GeoOut>) { VertexOut v[6]; Subdivide(gin,v); OutputSubdivision(v, triStream); }
注意:给定一个输入图元,几何着色器可以不对它进行输出。通过这一方式,几何着色器可以将输入的几何体“销毁”,这一功能在某些算法中非常有用。
注意:当几何着色器输出的顶点无法构成一个完整的图元时,这部分图元将被丢弃。
文件下载(已下载 1144 次)发布时间:2014/8/14 下午9:33:26 阅读次数:6181