SharedMemocry优化矩阵乘法 发表于 2023-01-16 | 分类于 CUDA | 巧妙的使用共享内存Shared memory,能够减少线程对全局内存Global memory的访问,提升CUDA程序在访存方面的性能。本文以矩阵乘法为例,通过对比不使用共享内存的普通矩阵乘法实现和使用共享内存的矩阵乘法优化版本,展示共享内存对程序性能的提升,并分析使用共享内存的条件和注意点 普通矩 ... 阅读全文 »
TensorRT部署YOLOv5-03-TensorRT 发表于 2023-01-03 | 分类于 AI , Nvidia | TensorRT是本专栏中最重要的内容,绝大多数内容将围绕TensorRT来展开,本文对TensorRT进行一个基本的介绍,让不熟悉TensorRT的读者能够对TensorRT是什么,如何使用它有一个较为全面的认识 Nvidia TensorRT是一个用于Nvidia GPU上高性能机器学习推理的S ... 阅读全文 »
TensorRT部署YOLOv5-02-环境介绍 发表于 2022-12-19 | 分类于 AI , Nvidia | 本文对TensorRT部署YOLOv5模型的整体环境配置及软件包进行介绍。实验环境主要从主机和JestonNano两方面进行介绍,在主机端完成模型训练并转换为onnx中间模型表示,在JestonNano进行onnx模型转换为TensorRT引擎、图片/视频加载、编解码处理、模型推理、后处理等工作 主 ... 阅读全文 »
TensorRT部署YOLOv5-01-Overview 发表于 2022-12-14 | 分类于 AI , Nvidia | 本系列对在Nvidia边缘计算平台进行深度学习模型部署进行一个全面的介绍,主要围绕TensorRT深度学习推理框架,以YOLOv5目标检测任务为例,以Jeston Nano为目标计算平台,对环境搭建、模型量化、模型推理、性能评估、后处理优化等细节进行详细说明,并给出C++和Python分别进行模型部 ... 阅读全文 »
每月见闻202211 发表于 2022-11-11 | vscode注释插件Better Comments该插件能够帮助生成易于阅读的高亮形式代码注释 插件需要通过settings.json添加配置项,在settings.json中输入”better-comments.tags”,会自动生成默认配置 12345678910111213141516171 ... 阅读全文 »
Mosica数据增强 发表于 2022-11-11 | 分类于 AI | Yolov4中使用了Mosica数据增强方法,能够在有限数据集情况下极大程度的增加增强样本量。本文对Mosica数据增强方法进行Python代码实现介绍 数据准备本实现需要以下相关数据和文件准备 VOC数据集(本实验使用的是VOC2007) classes文件 将VOC数据集预先经过处理后, ... 阅读全文 »
VitisAI-07-模型部署 发表于 2022-08-27 | 分类于 AI | 本文以自定义模型为例,对使用VitisAI进行模型量化部署的流程进行介绍 Workflow 数据集为fashion_mnist 使用Tensorflow2搭建一个简单分类网络并进行训练,导出模型文件 使用VitsiAI docker中的vai_q_tensorflow2工具进行模型量化和校准,得 ... 阅读全文 »
VitisAI-06-DPU-Configuration 发表于 2022-07-31 | 分类于 AI , VitisAI | 本文对DPU的一些配置选项进行介绍。主要参考文档为pg338,”DPUCZDX8G for Zynq UltraScale+MPSoCs Product Guide” DPU配置文件对DPU配置的描述在Vitis工程中,以本系列使用的Vitis工程路径为例,在dpu_trd_system/dpu_t ... 阅读全文 »
每月见闻202207 发表于 2022-07-16 | Label Studio在研究目标检测任务时,必定需要了解如何对自定义的数据集做标注,网络上提到最多的就是labelme,然而我觉得labelme并没有那么好用,这是由于标注这块目前还是挺乱的,一方面目标检测数据集的格式各不相同,例如VOC数据集使用的是xml格式的标注images+annotati ... 阅读全文 »
VitisAI-05-Vitis Flow 发表于 2022-07-06 | 分类于 AI , VitisAI | 本文承接VitisAI-04-PetaLinux Flow,介绍使用Xilinx的Vitis工具利用Vivado生成的design_1_wrapper.xsa文件以及PetaLinux编译的rootfs和内核镜像,生成制作好的SD卡镜像文件sd_card.img PetaLinux工程准备编译好的各 ... 阅读全文 »