最近几周开始学习caffe(convolutional architecture for fast feature embedding)卷积神经网络框架。最终目的是将其中部分并行计算代码移植到
FPGA中进行运算。
学习的原因及目的包括:对
人工智能的兴趣;软件算法研究者往往缺乏硬件和集成电路知识,他们习惯用GPU,
cpu解决问题,而FPGA和
asic的使用可能是学科交叉产生的新机遇;顺便补强自己的软硬件知识。
可以预见的困难包括:对C++,phyton的不熟悉造成阅读代码的困难;FPGA移植部分代码的选取及逻辑实现;以及是否需要新做板卡才能稍微体现出移植本身在功耗和性能上的优势?
现阶段的学习计划主要是以21天实战caffe为基础,通过网络和相关书籍理解caffe的功能和架构,本阶段学习完毕,再构思往后的移植部分。
2016.9.17