知识点发现
未读
linux中虚拟环境安装cuda和cudnn
可以参考这个链接,亲测几次都有效果: https://blog.csdn.net/qq_43705697/article/details/121618276
知识点发现
未读
Transformer掩码学习
之前感觉这个一直很难,不知道从哪里入手,看不懂这个掩码矩阵是什么。下面我给一个具体的例子。 也就是说它这个mask呀,一般是W和H它都表示token的数量,每行的一个元素都代表其中一个token,每列的一个元素也代表其中一个token,我们是将行看成query, 列(竖着看)就是key,也就是说图中
DETR系列
未读
DeformableDETR论文阅读梳理
DCN(Deformable Convolution Networks): 在卷积当中引入了学习空间集合形变的能力,不再是使用常规的领域矩阵卷积,而是让卷积自动的去学习需要卷积的周围像素,以此可以适应更复杂的几何形变任务。 作者想法:将DCN和DETR相结合,DETR不是收敛慢和计算量大麻,而且主要
DETR系列
未读
DETR论文阅读梳理
创新点 端到端: 去除NMS和anchor,没有那么多的超参,计算量也大大减少,整个网络变得很简单。 提出一种全新的基于集合的损失函数: 通过二分图匹配的方法强制模型输出一组独一无二的预测框,每个物体只会产生一个预测框,这样就将目标检测问题直接转换为集合预测的问题,所以才不用nms,达到端到端的效果
RGB目标检测
未读
LSKNet论文阅读梳理
论文的模型结构图 论文中说的就是我用两个串联的5×5、7×7的分组卷积来模拟大核卷积,这两个卷积串联它们的感受野就相当于23×23的卷积,至于用分组卷积主要是在空间维度上进行操作,通道维度不变。通过两个串联的卷积后,然后通过两个并行的1×1的卷积,将通道数减半,并将两个特征图沿着通道维度进行拼接。我