基于OCR的视觉注意(Visual Attention)

基于OCR的视觉注意(Visual Attention)。该模型首先在图像(调整图像为高度32,同时保持纵横比)上运行一个滑动CNN。然后在CNN顶端堆叠一个LSTM。最后,一个视觉模型作为解码器,用来生成最终结果

相关的项目 - 更多比较

120 6.6k 861

A 基于高度优化的OpenCV库的快速扩充 超级简单但功能强大的界面,适用于不同的任务,如(分割,检测等) 易于定制 易于添加其他框架
 
10.0 5.7
  4天前