oldpan博客
-
快速提升性能,如何更好地使用GPU(上)
本篇根据HOW CUDA PROGRAMMING WORKS的讲解,整理下如何更好地使用GPU的一些细节,主要有三点:让GPU别闲着(Use it at all)把GPU中所有资源…
-
搞懂 NVIDIA GPU 性能指标 很容易弄混的一个概念: Utilization vs Saturation
翻译自 https://arthurchiao.art/blog/understanding-gpu-performance/ GPU 性能指标工具如 nvidia-smi,我们一…
-
更底层的算法部署工程师:机器学习系统与SysML&DL(二)
前言这篇文章继续介绍一下自动微分,需要提一句,这一部分是所有深度学习框架最重要也是最核心的一部分。正因为自动微分的存在,才使得深度学习框架可以根据我们设定的损失函数实现最重要的梯度…
-
炼丹炉买不起了:聊一聊这段日子的显卡行情
前言前一阵子突然有了配主机的想法。 想象一下,亲手买下自己心仪的配件,然后用心组装起来,闻着显卡的香气,啊,满满的成就感。 樱花显卡显卡预想着上RTX-3080或者3070,嗯,毕…
-
特殊的日子,想起了当年的双(1080TI)显卡装机实录
2021年3月份,还是下定决心配一台主机了。 原因在这里 炼丹炉买不起了:聊一聊这段日子的显卡行情花了11000大洋配了如下的主机: CPU:intel 十代10700F散片散热:…
-
主机回来以及,简单的环境配置(RTX3070+CUDA11.1+CUDNN+TensorRT)
紧接着前几天的事: 特殊的日子,想起了当年的双(1080TI)显卡装机实录炼丹炉买不起了:聊一聊这段日子的显卡行情之后,决定买一台整机玩玩。 而现在,主机终于回!来!了!主机回来干…
-
AI资料整理以及,简单地聊下动静态链接库
前言最近在整理收集一些资料,有关深度学习模型训练、模型部署优化,相关基础知识、编程工具,以及相关AI工作推荐的一些东东,都打算整合到一起,方便大家或者自己查阅。 整合起来的站点,就…
-
“软硬结合”的算法优化器,来看一哈Halide吧兄弟
前言前几天又用到了TVM,想着是否能够间接替代TensorRT作为GPU服务器部署的一个后端。TensorRT在自家的GPU上确实强大,也是老黄家重点关照的”开源项目“。但Tens…
-
(抛砖引玉)TensorRT的FP16精度问题?怎么办?在线支招!
老潘的部署踩坑血泪史之一。 问题的开始 前些天尝试使用TensorRT转换一个模型,模型用TensorFlow训练,包含LSTM+Transform+CNN,是一个典型的时序结构模…
-
从零开始的深度理解Pytorch源码(一):什么是Pytorch
Tricter是东南大学读研,研究方向为增强现实的一名研究生。之后会和老潘持续带来对Pytorch的源码分析以及深入理解。工欲善其事必先利其器,深入理解Pytorch源码还是很有必…