oldpan博客
用户有点忙,还未想好写什么
4
文章
-
大模型架构历史演进 – The Big LLM Architecture Comparison
FROM https://sebastianraschka.com/blog/2025/the-big-llm-architecture-comparison.html原始GPT架…
-
浅谈深度学习训练中数据规范化(Normalization)的重要性
前言 数据规范-Normalization是深度学习中我们很容易忽视,也很容易出错的问题。我们训练的所有数据在输入到模型中的时候都要进行一些规范化。例如在pytorch中,有些模型…
-
浅谈深度学习中超参数调整策略
前言 深度学习中,设计模型以及保证模型的正确性是首要需要考虑的。当模型设置完成时,理论上模型不存在问题,实现效果也通过计算可以复现出来。一切准备就绪后,那么接下来需要操作的就是——…
-
在pytorch中实现与TensorFlow类似的”same”方式padding
前言 TensorFlow中在使用卷积层函数的时候有一个参数padding可以选择same或者vaild,具体可以看之前的这篇文章:https://oldpan.me/archiv…
点击查看更多