c - altivec 提取部分 vector ?

标签 c simd powerpc altivec

我正在尝试将一个 64 位值与一个 64 位值数组进行比较,比如

R_UINT64 FP; R_UINT64 输入[20000];

如果数组中的任何元素与 FP 的值匹配,则返回 true。

我必须遍历这个数组并找到一个匹配项,我试图通过一次查看 2 个元素而不是一个元素来提高效率。

在 Altivec 中, vector 长度是 128 位,所以我将把 FP 的两个副本, vector 中的两个元素。(我将每个 vector 元素都截断两个 8 位)

到目前为止一切顺利,但现在我遇到了一个问题。我找不到只查看 vector 的一半并查看是否匹配的 VMX 程序,为了返回 true,两个值都必须匹配,这不是我要找的。

所以我想知道是否有办法告诉编译器我每次只查看 vector 的一半?

提前致谢!

最佳答案

可能最好的办法是比较两个元素,然后使用 vec_mergeh/vec_mergel 测试结果的每一半,例如

size_t vec_search_u64(const uint64_t key, const uint64_t array[], const size_t len)
{
    const vector signed int vkey = { key >> 32, key & 0xffffffff, key >> 32, key & 0xffffffff };
    const vector bool int vk1 = { -1, -1, -1, -1 };

    for (i = 0; i < len - 1; i += 2)      // iterate two elements at a time
    {
        vector signed int v = vec_ld(0, (int *)&array[i]);
                                          // load 2 elements
        vector bool int vcmp = vec_cmpeq(v, vkey);
                                          // compare 2 elements with key
        if (vec_all_eq(vec_mergeh(vcmp, vcmp), vk1))
        {                                 // if high element matches
            return i;                     // return match found at element i 
        }
        if (vec_all_eq(vec_mergel(vcmp, vcmp), vk1))
        {                                 // if low element matches
            return i + 1;                 // return match found at element i + 1
        }
    }
    if (i < len)                          // if array size is odd
    {
        if (array[i] == key)              // test last element
        {
            return i;
        }
    }
    return (size_t)(-1);                      // match not found - return suitable value
}

(注意:未经测试的代码 - 仅供一般指导 - 可能需要转换和/或实际错误修复!)

关于c - altivec 提取部分 vector ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18837961/

相关文章:

c - 限制客户端连接

c++ - 基于双向链表的双端队列实现不起作用

x86 - 如何使用 SSE 计算某个范围内的字节数?

c++ - SSE版本的差平方和算法的累积计算误差

assembly - 这里的 .size 指令有什么作用吗?

c++ - 将 C int 数组重置为零 : the fastest way?

c - 无法为 CUDA C 程序创建工作 Makefile

c - 为什么我在使用行优先顺序时会看到性能下降?

c - 什么是 rlwinm 的 C 等价物(PPC 指令)

assembly - Power7 架构上的混合 assembly 标量/矢量