有没有人用过SSE3或者AVX2指令集对Caffe进行加速?

按照我的理解,Caffe主要是乘法跟加法,但是没有使用指令集进行加速,如果使用SSE或者AVX指令集的话,那么CPU的计算速度跟显卡的计算速度是接近的,至少也能比原始版本的快1倍以上。
有没有人尝试过?
使用SSE加速,也就是用SSE指令对关键的运算进行重写。
已邀请:

要回复问题请先登录注册