OpenMP在ARM-Linux以及NDK中的编译和使用

网友投稿 849 2022-05-30

OpenMP在ARM-linux以及NDK中的编译和使用

参考:http://blog.sina.com.cn/s/blog_602f87700102w1ki.html

以前对OpenCV在ARM-Linux,ARM-Android上的优化做了很多编译方面的努力,例如添加TBB支持,添加CUDA支持(NvidiaK1平台上)。这次突然听同事说增加了OpenMP选项后,在Windows+X86上有极大的优势,adaboost速度提高3倍。所以赶快在ARM-Android-NDK上测试一下。

0. OpenMP基础:

OpenMP(OpenMulti-Processing)是由OpenMPArchitecture Review Board牵头提出的,并已被广泛接受的,用于

共享内存

并行系统的

多线程

程序设计的一套指导性注释(CompilerDirective)。OpenMP支持的

编程语言

包括

C语言

C++

Fortran

;而支持OpenMP的

编译器

包括

Sun Studio

Intel

Compiler,以及

开放源码

GCC

Open64

编译器。OpenMP提供了对并行算法的高层的抽象描述,程序员通过在

源代码

中加入专用的

pragma

来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMP时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用

多线程

来加速程序执行。

1. OpenMP在X86 Linux上的展现:

例子代码:

#include

int main(int argc, char* argv[])

{

#pragma omp parallel

printf("Hello, world.\n");

return 0;

}

普通编译:

g++ OpenMP_Test.cpp -o test

运行:

# ./test

Hello, world.

增加OpenMP 编译选项的编译:

g++ -fopenmp OpenMP_Test.cpp -o test

运行:

#./test

Hello, world.

Hello, world.

Hello, world.

Hello, world.

证明-fopenmp在GCC下有效。代码的OpenMP能力得到支持。

#pragma ompparallel 仅在您指定了 -fopenmp 编译器选项后才会发挥作用。在编译期间,GCC会根据硬件和操作系统配置在运行时生成代码,创建尽可能多的线程。每个线程的起始例程为代码块中位于指令之后的代码。这种行为是 隐式的并行化,而OpenMP本质上由一组功能强大的编译指示组成,帮您省去了编写大量样本文件的工作。我的Linux机器为4核CPU。所有有4个thread.

2. OpenMP在ARM-Anrdoid-NDK上的展现:

代码不变。

Android.mk内容如下:

LOCAL_PATH := $(call my-dir)

include $(CLEAR_VARS)

LOCAL_ARM_MODE := arm

LOCAL_MODULE := test

LOCAL_SRC_FILES := OpenMP_Test.cpp

LOCAL_CXXFLAGS := -fopenmp

LOCAL_CFLAGS +=  -fopenmp

LOCAL_LDLIBS := -llog -fopenmp

include $(BUILD_EXECUTABLE)

Application.mk内容如下:

# Build both ARMv5TE and ARMv7-A machine code.

APP_PLATFORM = android-8

APP_ABI := armeabi-v7a

#APP_ABI := $(ARM_ARCH)

#Sam modify it to release

OpenMP在ARM-Linux以及NDK中的编译和使用

#APP_OPTIM := release

APP_OPTIM := debug

#APP_OPTIM = $(MY_OPTIM)

APP_CPPFLAGS += -fexceptions

APP_CPPFLAGS += -frtti

#sam modify it from gnustl_static to gnustl_shared

#APP_STL := gnustl_static

#APP_STL       := gnustl_shared

APP_STL := gnustl_shared

#APP_CPPFLAGS += -fno-rtti

#

APP_CPPFLAGS += -Dlinux -fsigned-char

APP_CFLAGS += -fsigned-char

#APP_CPPFLAGS += $(MY_CPPFLAGS) -Dlinux

#STLPORT_FORCE_REBUILD := true

编译后运行:

$./test

Hello, world.

Hello, world.

Hello, world.

Hello, world.

证明-fopenmp在NDK下有效。代码的OpenMP能力得到支持。

K1平台是4 Core的。所以有4个thread.

3. OpenCV4AndroidOpenMP支持:

#!/bin/sh

cd `dirname $0`/..

mkdir -p build_android_arm

cd build_android_arm

cmake -DCMAKE_BUILD_WITH_INSTALL_RPATH=ON-DHAVE_EIGEN=1  -DHAVE_CAMV4L2=ON -DBUILD_TBB=ON-DWITH_TBB=ON -DHAVE_OPENMP=1 -DBUILD_EXA

MPLES=1 -DANDROID_ABI="armeabi-v7a" -DCMAKE_TOOLCHAIN_FILE=../android/android.toolchain.cmake $@../..

只要如此编译,则OpenCV 支持OpenMP.

4. OpenMP 指令和库函数:

C/C++中,OpenMP指令的使用格式为:

#pragmaomp 指令 [子句[子句]…]

#pragma omp parallel for

for (int j = 0; j < 4; j++)

{

printf("j=[%d], ThreadId =[%d]\n", j, omp_get_thread_num());

}

#endif

如果报找不到符号,可以:-lgom

总结一下,在pc上,时间加倍,但是在arm多核上,效果可以,时间减少约50%。

ARM Linux

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java Review (二十五、集合----- Iterator接口)
下一篇:利用人工智能众包数据,加速药物发现
相关文章