有没有人用过SSE3或者AVX2指令集对Caffe进行加速?

按照我的理解,Caffe主要是乘法跟加法,但是没有使用指令集进行加速,如果使用SSE或者AVX指令集的话,那么CPU的计算速度跟显卡的计算速度是接近的,至少也能比原始版本的快1倍以上。
有没有人尝试过?
使用SSE加速,也就是用SSE指令对关键的运算进行重写。
已邀请:

li_yuanyuan - https://github.com/yuanyuanli85

赞同来自: mhaoyang

建议推荐使用intel加速后的caffe,https://github.com/intel/caffe,backend那边是用MKLDnn和OpenMP来加速的,应该是SSE/AVX最优的版本了。

要回复问题请先登录注册