- 博客(32)
- 收藏
- 关注
原创 VAD 论文翻译
摘要: 自动驾驶需要全面了解周围环境才能进行可靠的轨迹规划。先前的研究依赖于密集的光栅化场景表示(例如,代理占用和语义地图)来进行规划,这需要大量的计算,并且会丢失实例级的结构信息。 本文提出了 VAD,一种用于自动驾驶的端到端矢量化方式,它将驾驶场景建模为完全矢量化的表示。所提出的矢量化范式具有两个显著的优势。一方面,VAD 利用矢量化的代理运动和地图元素作为显式的实例级规划约束,从而有效地提高了规划的安全性。另一方面,VAD 的运行速度比之前的端到端规划方法快得多,通过
2025-07-11 14:22:54
748
原创 UniAD论文翻译
现代自动驾驶系统的特点是按顺序执行模块化任务,即感知、预测和规划。为了执行各种各样的任务并实现高级智能,当前的方法要么为单个任务部署独立的模型,要么设计具有单独头部的多任务范式。然而,这些方法可能存在累积误差或任务协调不足的问题。相反,我们认为应该设计并优化一个可行的框架,以追求最终目标,即自动驾驶汽车的规划。基于此,我们重新审视了感知和预测中的关键组成部分,并对任务进行优先级排序,使所有这些任务都能为规划服务。我们引入了统一自动驾驶(UniAD),这是一个最新的综合框架,它将全栈驾驶任务整合在一个网络中。
2025-07-11 14:19:56
595
原创 SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation
本文提出了一种新型端到端自动驾驶范式SparseDrive,通过稀疏场景表示和并行运动规划器设计显著提升了系统性能与效率。核心创新包括:(1)对称稀疏感知模块,统一检测、跟踪与在线建图任务,采用完全稀疏的实例表示;(2)并行运动规划器设计,充分利用运动预测与规划的相似性,通过自我实例初始化和时空交互建模提升规划质量;(3)分层规划选择策略结合碰撞感知重评分模块,确保轨迹安全性。实验表明,在nuScenes基准测试中,SparseDrive在感知、预测和规划等所有任务上均超越现有方法,其中碰撞率降低71.4%
2025-07-11 14:18:45
412
原创 YOLOv12论文翻译
《YOLOv12:基于注意力机制的实时目标检测器》提出了一种创新性的YOLO框架YOLOv12,成功将注意力机制引入实时目标检测领域。研究通过三个关键改进:1) 设计高效区域注意力模块(A2)降低计算复杂度;2) 引入残差高效层聚合网络(R-ELAN)解决优化挑战;3) 对传统注意力架构进行适配性调整。实验表明,YOLOv12在保持与CNN模型相当速度的同时显著提升精度,如YOLOv12-N在40.6% mAP下仅需1.64ms推理时间,超越现有最佳模型2.1%。研究突破了CNN在YOLO系统中的主导地位,
2025-07-11 14:14:44
488
原创 pytoch 模型裁剪
1.目的是去掉fc层,只保留backbone网络for key in original_state_dict['state_dict']: print(key)updated_state_dict = {}for key in original_state_dict['state_dict']: #new_key = 'net.'+key[9::] if key=='fc.weight': continue new_key = key[16:]
2023-06-26 11:23:19
250
原创 windows10和ubuntu两种环境搭建YOLOX环境配置,并训练VOC数据集
一、Windows10安装Anaconda:流程较为简单,首次安装的可以参考:https://blog.csdn.net/weixin_42322256/article/details/122737706
2022-05-04 17:01:29
2971
1
原创 pytorch多卡训练nn.DataParallel和nn.DistributedDataParallel比较
本文来源于:Pytorch Distributed - 知乎Pytorch Distributed现在的模型越来越大,并行显得越来越重要,而众所周知,pytorch 的并行文档写的非常不清楚,不仅影响使用,甚至我们都不知道他的工作原理。一次偶然的机会,我发现了几篇在这方面写的很好的文章,因此也准备参考别人的(参考的文章在Reference部分列出)再结合自己的使用经验总结一下。nn.DataParallelPytorch的数据并行方式,是经常使用的单机多卡的并行方式。工作原理这种方式
2022-04-17 11:48:11
3782
2
原创 Pytorch tensor避免nan解决办法
使用pytorch处理数据运算是,如矩阵涉及乘除法,如矩阵中存在nan数据,则结果中存在nan,解决方案是使用torch.where()将nan值替换为0或其他值:torch.where(torch.isnan(a), torch.full_like(a, 0), a)
2022-02-17 14:45:42
7651
原创 Linux、Ubuntu系统读取(挂载)U盘
如果你的U盘是想在Windows和linux下通用的,那请将U盘初始化分区时设置为FAT32,且大小最好小于32G(貌似大于32G双系统U盘linux下无法识别)1、将U盘插入linux系统电脑后,输入以下命令查看U盘在设备上的路径和名称fdisk -l出现类似下图的状态,说明U盘路径为/dev/sdb12、在/mnt下创建一个待挂载的文件夹名称(确保这个名称和mnt下的其他名称不重复)mkdir /mnt/U3、执行挂载命令mount /dev/sdb1 /mnt.
2021-12-20 17:12:49
6248
原创 Full-Face Appearance-Based Gaze Estimation论文翻译
It’s Written All Over Your Face:Full-Face Appearance-Based Gaze Estimation论文翻译1.摘要眼睛注视是人类情感分析的重要非语言线索。 最近的注视估计工作表明,来自全脸区域的信息可以提高性能。 进一步推动这一想法,我们提出了一种基于外观的方法,与计算机视觉领域的长期工作相比,该方法仅将全脸图像作为输入。 我们的方法使用卷积神经网络对面部图像进行编码,空间权重应用于特征图,以灵活地抑制或增强不同面部区域的信息。 通过...
2021-08-16 17:05:56
805
原创 Driver Gaze Zone Estimation 翻译
使用卷积神经网络的驾驶员注视区域估计摘要:驾驶员注视已被证明是智能车辆中驾驶员注意力的绝佳替代品。随着最近高度自动驾驶汽车的激增,驾驶员凝视可用于确定与人类驾驶员的交接时间。虽然个性化驾驶员注视区域估计系统已经有了显着改进,但仍然缺乏对不同主题、视角和尺度保持不变的通用系统。我们使用卷积神经网络 (CNN) 朝着这个广义系统迈出了一步。我们为此任务微调了 4 个流行的 CNN 架构,并对它们的输出进行了广泛的比较。我们还对不同的输入图像块进行了实验,并检查了图像大小如何影响性能。为了训练和测试网络,
2021-07-20 16:07:24
556
2
原创 Dual Attention Guided Gaze Target Detection in the Wild论文翻译
野外双注意力引导注视目标检测摘要:凝视目标检测旨在推断场景中每个人正在看的位置。现有工作专注于 2D 凝视和 2D 显着性,但未能利用 3D 上下文。在这项工作中,我们提出了一种三阶段方法来模拟 3D 空间中的人类注视推理行为。在第一阶段,我们引入了一种从粗到细的策略来从头部稳健地估计 3D 凝视方向。预测的凝视被分解为图像平面上的平面凝视和深度通道凝视。在第二阶段,我们开发了一个双注意力模块(DAM),它利用平面凝视产生视野,并根据深度通道凝视屏蔽由深度信息调节的干扰对象。在第三阶段,我们使用生成
2021-07-19 20:32:30
483
原创 cvpr2021论文翻译:Weakly-Supervised Physically Unconstrained Gaze Estimation
弱监督物理无约束注视估计摘要:物理无约束注视估计的一个主要挑战是为野外和户外场景获取带有 3D 注视注释的训练数据。相比之下,在不受约束的环境中人类互动的视频非常丰富,并且可以更轻松地使用帧级活动标签进行注释。在这项工作中,我们解决了以前未探索过的问题,即从人类交互视频中进行弱监督注视估计。我们利用了当人们执行“互相看着”(LAEO)活动时存在与凝视相关的强几何约束的洞察力。为了从 LAEO 标签获得可行的 3D 凝视监督,我们提出了一种训练算法以及几个专为该任务设计的新颖损失函数。由于来自两个大规
2021-07-19 15:25:26
657
1
原创 docker 启动 挂载 删除 重启 常见命令
load docker :#两条效果一样docker load -i xxx.tgznvidia-docker load -i xxx.tgz#xxx.tgz为docker镜像文件,需要从官网下载如pytorch官方docker ,也可以自己封装,然后报保存成xxx.tgzrun docker:#非GPU状态docker run -d --name pytorch -v /root/:/root/ -it IMAGE_ID bash#GPU状态前提必须安装nvidia-dock
2021-07-09 14:42:47
742
1
原创 docker 报错 docker: Error response from daemon: Unknown runtime specified nvidia
重装显卡驱动是误删除nvidia-docker,导致更新驱动单无法run之前的docker,报错如标题解决方法:执行 sudo systemctl restart docker 重启docker服务完美解决
2021-07-09 14:16:11
488
1
原创 conda install 报错PackagesNotFoundError: The following packages are not available from current channel
使用conda install安装第三方包时经常遇到PackagesNotFoundError: The following packages are not available from current channels,如下图:解决方案:首先输入anaconda search -t conda xxxxx(你要安装的package名字),查看根据提示的内容调整你的环境,如...
2020-04-02 11:04:54
4532
1
原创 pip 清华镜像 豆瓣镜像 命令 win10 windows
豆瓣镜像:pip install tensorflow-gpu==1.14.0 -i https://pypi.doubanio.com/simple清华镜像: pip install -ihttps://pypi.tuna.tsinghua.edu.cn/simpletensorflow-gpu==1.14.0
2020-03-11 15:25:41
712
原创 Tenserflow保存模型加载模型的三种方法
方法1:只保存模型的权重和偏置这种方法不会保存整个网络的结构,只是保存模型的权重和偏置,所以在后期恢复模型之前,必须手动创建和之前模型一模一样的模型,以保证权重和偏置的维度和保存之前的相同。tf.keras.model类中的save_weights方法和load_weights方法,参数解释我就直接搬运官网的内容了。方法1:只保存权重,训练代码#方法1:只保存权重import te...
2020-02-27 14:45:01
478
转载 人体姿态估计的深度学习模型总结(附代码链接)
来源:Model Zoo编译:Bing姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测、姿态估计、分割等等。有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形、增强现实或者人机交互。姿态估计同样包含许多基于3D物体的辨认。在这篇文章中,Model Zoo的作者汇总了几种开源的深度学习模型以及针对姿态估计的代码,论智对其进行了编译...
2020-01-13 16:29:20
1332
1
转载 人体关键点检测综述
声明:本文主要内容来源于:https://blog.csdn.net/ls83776736/article/details/87991515转载引用附原文链接人体姿态估计(Human Pose Estimation)也称为人体关键点检测(Human Keypoints Detection)。对于人体姿态估计的研究,大致可做如下分类。1. RGB vs RGBD后者多一项Depth信...
2020-01-13 14:44:46
1981
原创 Pandas中apply函数 fillna()函数用法
1.apply函数是pandas里面所有函数中自由度最高的函数。该函数如下:DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)该函数最有用的是第一个参数,这个参数是函数,相当于C/C++的函数指针。这个函数需要自己实现,函数的传入参数根据axis来定,比如ax...
2020-01-10 15:36:26
3826
原创 Tensorflow构建自己的图片数据集TFrecords
TensorFlow提供了标准的TFRecord 格式,而关于 tensorflow 读取数据, 官网也提供了3中方法 :1 Feeding: 在tensorflow程序运行的每一步, 用python代码在线提供数据2 Reader : 在一个计算图(tf.graph)的开始前,将文件读入到流(queue)中3 在声明tf.variable变量或numpy数组时保存数据。受限于内存大小,适...
2019-10-12 11:34:49
334
原创 Could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED 报错解决方案
训练、测试Tensorflow、Keras代码时,出现could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED、error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows、could n...
2019-10-11 14:08:34
2412
原创 官宣,华为正式发布自有操作系统:鸿蒙
8月9日15时,华为正式发布全新自有操作系统:鸿蒙今天下午15:00(2019年8月9号)华为消费者业务今天在其全球开发者大会上正式向全球发布其全新的基于微内核的面向全场景的分布式操作系统——鸿蒙OS。鸿蒙OS具有四大技术特性:1.分布式架构首次用于终端OS,实现跨终端无缝协同体验2. 确定时延引擎和高性能IPC技术实现系统天生流畅3. 基于微内核架构重塑终...
2019-08-09 16:09:27
385
原创 OpenCV绘图函数:cv2.line、cv2.circle、cv2.rectangle、cv2.ellipse、 cv2.putText()、cv2.setMouseCallback
OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库。不管你是做科学研究,还是商业应用,opencv都能够作为你理想的工具,它可以运行在Linux、Windows、Android和Mac OS操作系统上。OpenCV轻量级而且高效,它是由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。...
2019-08-09 10:15:35
3535
原创 Anaconda用法:使用conda穿创建python的虚拟环境
1、conda常见的命令(1)conda list 查看安装了哪些包(2)conda env list 或 conda info -e 查看当前存在哪些虚拟环境(3)conda update conda 检查更新当前conda2、创建python虚拟环境(1)conda create -n your_env_name python=X.X(2)同事安装某些包conda create -...
2019-01-20 10:42:04
800
原创 ubuntu系统基本操作
1、修改用户密码passwd omniskyold passwdnew passwd2、配置环境变量sudo gedit ~/.bashrc3、更新源sudo apt-get -y update
2019-01-07 17:25:03
208
原创 使用python-opencv创建一个单通道数组,然后转化为三通道数组
import numpy as npimport cv2 as cvimg = np.zeros((3,3), dtype=np.uint8)print(img)print("\n")img = cv.cvtColor(img, cv.COLOR_GRAY2BGR)print(img)
2019-01-07 17:24:08
8161
4
原创 VNET原理与实现(1)
神经网络什么的早就不是新概念了,不过学了这么久,还一直在二维图像上打转,所以今天开始入手三维图像分割,先从可爱的VNET开始吧,从胖嘟嘟的外形看,这应该是个软柿子,那就试着捏一捏吧,Lets go!先看一下论文吧:点击链接摘要 卷积神经网络(CNNs)近年来被广泛应用于计算机视觉和医学图像分析领域。尽管它们很流行,但大多数方法只能处理二维图像,而大多数临床...
2018-12-28 17:05:32
26131
原创 制作OCR数据集
参考自链接:https://blog.csdn.net/meyh0x5vDTk48P2/article/details/79848753手写数据集:http://www.nlpr.ia.ac.cn/databases/handwriting/Offline_database.html 确定你要生成多少字体,生成一个记录着汉字与label的对应表。 确定和收集需要用到的字体文件。...
2018-12-28 11:01:15
3870
原创 centerline 找中心线
链接:https://github.com/jackyko1991/Vessel-Centerline-Extraction命令:CenterlineExtraction.exe lumen.stl jiang.stl,解释:执行文件 input 路径 output路径Interaction Keys:n - New inlet/outlet pointspace - loca...
2018-12-27 15:10:13
2568
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人