阿里云人工智能“看图说话”揭秘

初入深度学习圈子,做点总结,上班时间先写个提纲,下班了再完善!
  1. 阿里云人工智能“看图说话”原视频(02:00 ~ 03:59) 
  2. 3岁小孩可以轻松看图说话案例,计算机却很困难,听到不等于听懂、看到不等于看懂 Understand
  3. 图片转为像素值,RGB(红、绿、蓝)
  4. 同样标签,视角变化/大小变化/形变/遮挡/光照条件/背景干扰/类内差异
  5. Deep Learning , computer vision history ,Scale Big data analysis 发展,促进人工智能重发第2春
  6. 不停改进算法,不如大数据分析,小孩不停从外界获取信息
  7. 数据驱动,训练集、测试集 众包 million 图片收集以及标注
  8. 识别Label,记忆形成短语(CNN、RNN、LSTM)
  9. 分类 KNN,及优缺点
  10. 线性分类,f = Wxi + b , W权重、b偏量
  11. 损失函数 Loss function ,评价Label与真实结果接近度,多类支持向量机SVM、softmax分类器
  12. 最优化,最短路径、梯度
  13. 神经网络
  14. 卷积神经网络(CNN) GoogleNet 有效减少权重参数个数
  15. LSTM
  16. GPU、Hadoop、Spark 并行计算
  17. 计算机看图说话、计算机拥有视觉可能应用领域
  18. But 不足:无法评估艺术相关、人物情感 0~3岁 difficult | 3 ~10岁 more difficult
  19. 华裔业界大牛:吴恩达(百度大脑)、周靖人(阿里人工智能)、李飞飞(斯坦福)... ...
  20. caffe | deeplearning4j 参考资料
  21. more... ...

0 个评论

要回复文章请先登录注册