oldpan博客

文档

4090 Ada Lovelace架构，关于AI部分的介绍

本文主要说下NVIDIA GeForce RTX 4090以及Ada Lovelace架构的特点。在GTC 2022首发的Ada Lovelace架构产品一共包含三款，分别是Ge…

oldpan博客
2023年12月18日
文档

想要的前沿技术都在这里了！

不得不相信英伟达总能给我们惊喜，老潘作为一名深度学习从业者以及游戏爱好者，对于这种与AI、GPU、并行计算相关的话题一直都是比较感兴趣。作为深度学习第一大硬件平台的英伟达，我们自然…

oldpan博客
2023年12月17日
文档

想买个铁蛋

就在前两天8月10号的小米发布会，雷总发布了一系列小米的新品。没看发布会直播的我，本来打算随便查查之前已经爆料的小米MIX4、小米平板5的新闻，看看配置咋样。没想到刷着刷着竟然刷…

oldpan博客
2023年12月13日
文档

Pytorch2.x时代，关于C++部署的讨论

Pytorch模型的高性能部署一直是大家讨论的问题，有两点比较重要：高度优化的算子不用多说，TensorRT为什么那么快，因为engine在构建的时候，在每个平台（A10、A10…

oldpan博客
2023年12月12日
文档

你的模型能跑多快？？？

前言回顾一下之前的文章吧！本篇也算是AI部署系列的一部分。对于神经网络，我们更多谈的是其精度怎么样，有百分之零点几的提升。但是如果谈到速度的话，深度学习神经网络相比于传统的算法…

oldpan博客
2023年12月9日
文档

AI部署系列：你知道模型权重的小秘密吗？？？

今天简单聊聊模型权重，也就是我们俗称的weight。深度学习中，我们一直在训练模型，通过反向传播求导更新模型的权重，最终得到一个泛化能力比较强的模型。同样，如果我们不训练，仅仅随…

oldpan博客
2023年12月8日
经验教程

复习一下卷积的核心操作：im2col大法！

im2col是什么？ Rearrange image blocks into columns，即将图像转换为列，是干嘛的呢？这是深度学习卷积操作前最重要的一步。我们将图像转换为列之…

oldpan博客
2023年12月7日
文档

必看部署系列~懂你的神经网络量化教程：第一讲！

开篇老潘刚开始接触神经网络量化是2年前那会，用NCNN和TVM在树莓派上部署一个简单的SSD网络。那个时候使用的量化脚本是参考于TensorRT和NCNN的PTQ量化（训练后量化…

oldpan博客
2023年12月6日
文档

聊聊阅读源码那件事儿

阅读源码本身就是一种学习，就像小时候写作文一样，看别人的好作文也就会模仿一些好的句子，一些好的段落。看源码也一样，不同大厂的源码写的风格也不一样，惯用的技巧也不一样，强调的规范也不…

oldpan博客
2023年12月3日
经验教程

AI算法工程师的一些含泪经验（一）

前一段时间一直在优化部署模型…快吐了555。这几天终于来了需求，又要开始重操训练一些新模型了。趁着这次机会总结了下之前的一些训练模型的笔记，可能比较杂，抛砖引玉！当然这…

oldpan博客
2023年12月1日

联系我们

联系我们

返回顶部