在Directx11中采用DirectCompute进行GPU并行的数值计算,或者Debug DirectCompute的程序,一个最典型的问题就是将GPU中的计算结果读出来到CPU让我们也可以看结果是否正确。

  首先讲由于Directx11中用来存储结果的subresource(主要是指buffer)有不同属性:各种D3D11_USAGE,所以其GPU和GPU的读写权限也不一样。我们这里主要是针对D3D11_USAGE_DEFAULT的buffer。即假设我们GPU的计算结果输出到一个D3D11_USAGE_DEFAULT属性的buffer中。

  然后buffer是subresource的一种,计算结果一般用buffer来存储。下面有时说buffer有时说subresource,一般是一样的。

  将GPU中的数据读到CPU的方法总结。

  1:先将存有GPU计算结果subresource0(一般是buffer)拷贝到一份CPU也可以读写的subresource1(创建subresource1时标识其为D3D10_USAGE_STAGING,表示其是从GPU拷贝到CPU的数据;调用ID3D11DeviceContext::CopyResource将subresource0的东东拷贝到subresource1)。

  2:然后通过Map函数,Get a pointer*D3D11_MAPPED_SUBRESOURCE to the data contained in a subresource, and deny the GPU access to that subresource1(这句话不好翻译)

  3:将上面得到的(*D3D11_MAPPED_SUBRESOURCE).(void*)强制转换为CPU可以理解的struct或者class或者float等CPU类型的指针。

  4:对上面得到的CPU指针读写即可得到或者更改GPU中的数据。

  5最后Unmap()刚刚Map()Resource

  /*示例:

  1:我们想将GPU中的计算结果ID3D11Buffer* m_pTestBuffer读出来。我们先通过调用函数ID3D11Buffer *CreateAndCopyToDebugBuffer(ID3D11Buffer* sourceBuffer)得到一份它的CPU可以读写的拷贝buffer。*/

HRESULT hr=S_OK;

ID3D11BufferresultBuffer=NULL;

resultBuffer=CreateAndCopyToDebugBuffer(m_pTestBuffer);

   /*

  2:然后通过Map函数,Get a pointer (D3D11_MAPPED_SUBRESOURCE * to the data contained in a subresource, and deny the GPU access to that subresource。*/

D3D11_MAPPED_SUBRESOURCE resultResources;

ZeroMemory(&resultResources,sizeof(D3D11_MAPPED_SUBRESOURCE));

IFR(m_pContext->Map(resultBuffer,0,D3D11_MAP_READ,0,&resultResources));

   /*

  3:将上面得到的D3D11_MAPPED_SUBRESOURCE::VOID*强制转换为CPU可以理解的struct或者class或者float等类型的指针。*/

TestBufTypep=NULL;

p=(TestBufType*)resultResources.pData;

   /*

  4:对上面得到的CPU指针p读写即可得到或者更改GPUID3D11Buffer* m_pTestBuffer的数据。*/

    m_pGPUTestResult=new TestBufType[uNumSimpleElements];

for(int i=0;i<uNumSimpleElements;i++)

{

m_pGPUTestResult[i].pos.x=p[i].pos.x;

m_pGPUTestResult[i].pos.y=p[i].pos.y;

m_pGPUTestResult[i].velocity.x=p[i].velocity.x;

m_pGPUTestResult[i].velocity.y=p[i].velocity.y;

}

    /*

  5:最后Unmap()刚刚Map()Resource,使得这个resourceCPU指针无效,GPU重新获得对该resource的读写权限。*/

m_pContext->Unmap(resultBuffer,0);

 

  我们最后反过来看下最开始调用的将仅GPU读写的resource拷贝到CPUresource的函数CreateAndCopyToDebugBuffer(),里面用来描述拷贝出来的resourceD3D11_BUFFER_DESC有两个要注意的点,CPUAccessFlagsUsage。其中CPUAccessFlags根据需要可以设置为D3D11_CPU_ACCESS_READD3D11_CPU_ACCESS_WRITE。然后Usage就一定要设置为D3D11_USAGE_STAGING,它表明这个resource是从GPU拷贝到CPUCreateAndCopyToDebugBuffer()的实现如下:

ID3D11BufferDemoApp::CreateAndCopyToDebugBuffer(ID3D11BufferpSrcBuffer)

{

ID3D11BufferdebugBuffer=NULL;


D3D11_BUFFER_DESC bfDESC;

ZeroMemory(&bfDESC,sizeof(D3D11_BUFFER_DESC));

pSrcBuffer->GetDesc(&bfDESC);

bfDESC.BindFlags=0;

bfDESC.MiscFlags=0;

bfDESC.CPUAccessFlags=D3D11_CPU_ACCESS_READ;

bfDESC.Usage=D3D11_USAGE_STAGING;

if(SUCCEEDED(m_pDevice->CreateBuffer(&bfDESC,NULL,&debugBuffer)))

{

m_pContext->CopyResource(debugBuffer,pSrcBuffer);

}

return debugBuffer;

}

posted on 2011-03-18 16:36  Bester  阅读(603)  评论(0编辑  收藏  举报