oldpan博客
-
4090 Ada Lovelace架构,关于AI部分的介绍
本文主要说下NVIDIA GeForce RTX 4090以及Ada Lovelace架构的特点。 在GTC 2022首发的Ada Lovelace架构产品一共包含三款,分别是Ge…
-
想要的前沿技术都在这里了!
不得不相信英伟达总能给我们惊喜,老潘作为一名深度学习从业者以及游戏爱好者,对于这种与AI、GPU、并行计算相关的话题一直都是比较感兴趣。作为深度学习第一大硬件平台的英伟达,我们自然…
-
想买个铁蛋
就在前两天8月10号的小米发布会,雷总发布了一系列小米的新品。 没看发布会直播的我,本来打算随便查查之前已经爆料的小米MIX4、小米平板5的新闻,看看配置咋样。没想到刷着刷着竟然刷…
-
Pytorch2.x时代,关于C++部署的讨论
Pytorch模型的高性能部署一直是大家讨论的问题,有两点比较重要: 高度优化的算子不用多说,TensorRT为什么那么快,因为engine在构建的时候,在每个平台(A10、A10…
-
你的模型能跑多快???
前言 回顾一下之前的文章吧!本篇也算是AI部署系列的一部分。 对于神经网络,我们更多谈的是其精度怎么样,有百分之零点几的提升。但是如果谈到速度的话,深度学习神经网络相比于传统的算法…
-
AI部署系列:你知道模型权重的小秘密吗???
今天简单聊聊模型权重,也就是我们俗称的weight。 深度学习中,我们一直在训练模型,通过反向传播求导更新模型的权重,最终得到一个泛化能力比较强的模型。同样,如果我们不训练,仅仅随…
-
复习一下卷积的核心操作:im2col大法!
im2col是什么? Rearrange image blocks into columns,即将图像转换为列,是干嘛的呢?这是深度学习卷积操作前最重要的一步。我们将图像转换为列之…
-
必看部署系列~懂你的神经网络量化教程:第一讲!
开篇 老潘刚开始接触神经网络量化是2年前那会,用NCNN和TVM在树莓派上部署一个简单的SSD网络。那个时候使用的量化脚本是参考于TensorRT和NCNN的PTQ量化(训练后量化…
-
聊聊阅读源码那件事儿
阅读源码本身就是一种学习,就像小时候写作文一样,看别人的好作文也就会模仿一些好的句子,一些好的段落。看源码也一样,不同大厂的源码写的风格也不一样,惯用的技巧也不一样,强调的规范也不…
-
AI算法工程师的一些含泪经验(一)
前一段时间一直在优化部署模型…快吐了555。这几天终于来了需求,又要开始重操训练一些新模型了。趁着这次机会总结了下之前的一些训练模型的笔记,可能比较杂,抛砖引玉!当然这…