oldpan博客
用户有点忙,还未想好写什么
3
文章
-
大模型架构历史演进 – The Big LLM Architecture Comparison
FROM https://sebastianraschka.com/blog/2025/the-big-llm-architecture-comparison.html原始GPT架…
-
浅谈深度学习中超参数调整策略
前言 深度学习中,设计模型以及保证模型的正确性是首要需要考虑的。当模型设置完成时,理论上模型不存在问题,实现效果也通过计算可以复现出来。一切准备就绪后,那么接下来需要操作的就是——…
-
在pytorch中实现与TensorFlow类似的”same”方式padding
前言 TensorFlow中在使用卷积层函数的时候有一个参数padding可以选择same或者vaild,具体可以看之前的这篇文章:https://oldpan.me/archiv…
点击查看更多