OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 学习 > 实训 >

深度学习及TPU平台实践

深度学习及TPU平台实践

  • 来源:北京交通大学
  • 章节:10 单元:9

  • 算能

  • 郝晓莉

  • 人工智能组
进入实训课程

课程简介:

深度神经网络模型能很快地被训练、测试,然后被产业界部署从而有效完成现实世界中的任务,在小体积、低功耗的 AI 计算平台上部署这类系统很受产业界欢迎。本课程以实践驱动的方式带领大家直观学习、实战和掌握深度神经网络的知识和技术。
本课程主要包括三部分,第一部分介绍深度学习的基础知识,以及CPU、GPU和TPU的架构,相比我们熟知的 CPU、GPU通用计算平台,TPU是专用于加速神经网络计算的芯片,因此更适于深度学习计算;第二部分介绍了一款TPU芯片BM1684,这是算能研制的一款专用于加速神经网络运行的微型系统级芯片,课程主要介绍了这款芯片的架构和性能,以及配套的工具链;第三部分是实践部分,涵盖第三章至第十章,主要介绍了模型的训练,以及如何在BM1684平台上运行的流程。




课程章节:

第一章 深度学习基础

本章主要介绍深度学习的基础知识:人工智能主要是靠数据和算法来驱动,以及神经网络中感知积,卷积神经网络等基础知识介绍,以及CPU、GPU和TPU的架构。

第二章 深度学习AI平台

本章主要介绍SE5硬件平台,BM1684芯片架构和BMNNSDK工具链的架构。

第三章 深度学习及AI平台实践基础

本章主要是一些基础实验,Linux基本操作,Python的基础编程,以及TensorFlow和Pytorch入门实验。

第四章 图像分类

本章介绍图像分类概念和发展,几种典型的图像分类的神经网络,最后基于LeNet5(TensorFlow和Pytorch模型)和ResNet神经网络,完成模型的训练,转换和推理运行的整个过程。

第五章 目标检测

本章介绍目标检测的概念和发展,几种常见的目标检测网络模型,最后基于YOLOv5完成目标检测模型的训练,转换和推理。

第六章 时序序列预测

本章介绍循环神经网络的原理,包括循环神经网络,长短记忆网络和门控循环单元,最后通过基于LSTM的股票预测,来学习循环神经网络的训练,转换和推理的过程。

第七章 人脸检测与识别

本章分别介绍人脸检测,对齐和识别的神经网络,最后通过基于RetinaFace和InsightFace实现人脸识别的整个流程。

第八章 语义分割(进阶内容)

本章介绍语义分割的概念,语义分割的数据集和典型网络介绍,最后基于ICNet神经网络实现道路场景分割。

第九章 实例分割(进阶内容)

本章介绍实例分割的概念,实例分割的数据集和典型网络介绍,基于Mask R-CNN神经网络实现实例分割。

第十章 压缩感知和图像重建(进阶内容)

本章介绍压缩感知和图像重建,以及常见的压缩感知和图像重建的神经网络,最后基于ReconNet网络实现图像重建,包括模型的训练,转换和SE5实现推理的过程。