分享一个 thrust 中的删除操作
分享一个 thrust 中的删除操作
工作需要,目前已知数据有400w,最终数据大小只有几w,如何将400w数据根据条件快速删除至w级别
参考:
copy_if()
remove_copy_if()
remove_if()
remove_if()
函数原型[2]
ForwardIterator thrust::remove_if(ForwardIterator first, ForwardIterator last, Predicate pred)
解释:remove_if
从[first, last) 范围内删除每一个使谓词 pred(x) 为真的元素,remove_if
是稳定的,意味着被删除的元素的相对顺序是不变的。值得注意的是: remove_if
不会破坏任何迭代器,不会改变迭代器范围。返回的迭代器是元素被移除后指向结果范围的末尾,此迭代器到末尾之间的元素将会是无意义的。
如果想真正删除,可以使用
S.erase(remove_if(S.begin(), S.end(), pred), S.end()))
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <thrust/remove.h>
#include <stdio.h>
#include <thrust/device_vector.h>
#define BLOCKSIZE 256
extern "C" {
class tmpvec3 {
public:
float x, y, z;
__host__ __device__
tmpvec3() :x(0.0), y(0.0), z(0.0) {}
__host__ __device__
tmpvec3(float tx, float ty, float tz) : x(tx), y(ty), z(tz) {}
};
}
struct is_empty_point
{
__host__ __device__
bool operator()(const tmpvec3 p)
{
return (p.x == 0 && p.y == 0 && p.z == 0);
}
};
__global__ void changeValue(tmpvec3* vertices, int start, int end, float val)
{
int index = blockIdx.x * blockDim.x + threadIdx.x;
int stride = blockDim.x * gridDim.x;
for (int tIndex = index; tIndex < end && tIndex >= start; tIndex += stride)
{
vertices[tIndex].x = val;
vertices[tIndex].y = val;
vertices[tIndex].z = val;
}
}
int main()
{
const int N = 6;
thrust::device_vector<tmpvec3> test_data(4000000);
tmpvec3* raw_ptr_data = thrust::raw_pointer_cast(&test_data[0]);
int start = 40000, end = 50000;
changeValue << <(end + BLOCKSIZE - 1) / BLOCKSIZE, BLOCKSIZE >> > (raw_ptr_data, start, end, 1.0);
printf("before erase data size : %d \n", test_data.size());
test_data.erase(thrust::remove_if(test_data.begin(), test_data.end(), is_empty_point()), test_data.end());
printf("data size : %d\n", test_data.size());
system("pause");
return 0;
}
remove_copy_if()
函数原型[2]
__host__ __device__
OutputIterator thrust::remove_copy_if(const thrust::detail::execution_policy_base<DerivedPolicy>& exec,
InputIterator first,
InputIterator last,
OutputIterator result,
Predicate pred
)
解释:remove_copy_if
将 [first, last) 范围内中,除了谓词为 true 的元素复制到结果中,这个操作是稳定的,也就是说顺序不会改变。
// 和上一个例子相比仅改变了 main 函数
int main()
{
const int N = 6;
thrust::device_vector<tmpvec3> test_data(4000000);
thrust::host_vector<tmpvec3> h_test_data(4000000);
thrust::device_vector<tmpvec3> res_data(10000);
thrust::host_vector<tmpvec3> h_res_data(10000);
tmpvec3* raw_ptr_data = thrust::raw_pointer_cast(&test_data[0]);
int start = 40000, end = 50000;
changeValue << <(end + BLOCKSIZE - 1) / BLOCKSIZE, BLOCKSIZE >> > (raw_ptr_data, start, end, 1.0);
thrust::copy(test_data.begin(), test_data.end(), h_test_data.begin());
printf("before erase data size : %d first data x: %f, y: %f, z: %f \n", test_data.size(), h_test_data[0].x, h_test_data[0].y, h_test_data[0].z);
thrust::remove_copy_if(test_data.begin(), test_data.end(), res_data.begin(), is_empty_point());
thrust::copy(res_data.begin(), res_data.end(), h_res_data.begin());
printf("data size : %d first data x: %f, y: %f, z: %f \n", res_data.size(), h_res_data[0].x, h_res_data[0].y, h_res_data[0].z);
system("pause");
return 0;
}
这次将数据打印出来,可以看到复制前的数据[0]号元素值均为0,复制后的数据[0]号元素值均为1
copy_if()
函数原型 [2/4]
OutputIterator thrust::copy_if(InputIterator first, InputIterator last, OutputIterator result, Predicate pred)
解释:这个版本的copy_if
将元素从[first,last)范围内复制到一个从结果开始的范围内,但是任何导致 pred 为false的元素都不会被复制。
int main()
{
const int N = 6;
thrust::device_vector<tmpvec3> test_data(4000000);
thrust::host_vector<tmpvec3> h_test_data(4000000);
thrust::device_vector<tmpvec3> res_data(3990000);
thrust::host_vector<tmpvec3> h_res_data(3990000);
tmpvec3* raw_ptr_data = thrust::raw_pointer_cast(&test_data[0]);
int start = 40000, end = 50000;
changeValue << <(end + BLOCKSIZE - 1) / BLOCKSIZE, BLOCKSIZE >> > (raw_ptr_data, start, end, 1.0);
thrust::copy(test_data.begin(), test_data.end(), h_test_data.begin());
printf("before erase data size : %d first data x: %f, y: %f, z: %f \n", test_data.size(), h_test_data[0].x, h_test_data[0].y, h_test_data[0].z);
thrust::copy_if(test_data.begin(), test_data.end(), res_data.begin(), is_empty_point());
thrust::copy(res_data.begin(), res_data.end(), h_res_data.begin());
printf("data size : %d first data x: %f, y: %f, z: %f \n", res_data.size(), h_res_data[0].x, h_res_data[0].y, h_res_data[0].z);
system("pause");
return 0;
}
看起来这个函数和 remove_copy_if()
对谓词操作是相反的