
疑难问题
文章平均质量分 71
解决工作中遇到的疑难问题
AI浩
2022年博客之星Top8,2021年博客之星Top6,博客专家,华为云云享专家,十佳博主,阿里云专家博主,拥有多项发明专利并参与过国家重大专项,拥有丰富的开发经验。注重理论与实践的结合,让AI学起来不再枯燥。如果大家在看文章的时候,发现了文章的错误,烦请指出,我会及时纠正。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ImportError: libhccl.so: cannot open shared object file: No such file or directory
注意:您需要有华为昇腾 NPU 硬件才能实际使用这些功能。如果您的服务器没有 NPU 硬件,即使解决了库路径问题,您也无法使用 NPU 加速。在这种情况下,建议使用标准的 PyTorch 安装(CPU 或 CUDA 版本)并修改代码以移除对。文件的位置,这很好!问题在于系统在运行时找不到这个库文件。虽然文件存在于文件系统中,但动态链接器不知道在哪里查找它。,我们告诉系统在哪里可以找到这些必要的库文件。系统会在预定义的路径中搜索这些库,而。要使设置永久生效,将以下内容添加到。不在默认搜索路径中。原创 2025-08-12 09:50:38 · 319 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘importlib_metadata‘
安装完成后,请重新运行您的程序,应该可以解决这个ModuleNotFoundError问题。如果仍然遇到问题,可能需要检查您的PyTorch和torch_npu版本是否兼容。这是一个常见的依赖问题,特别是在PyTorch分布式组件中。包(注意安装时使用连字符,但导入时使用下划线)。激活虚拟环境后安装此包即可解决错误。这是搜索结果中确认有效的解决方案。根据错误日志和搜索结果,您遇到了。这个错误是因为您的环境中缺少。原创 2025-08-12 09:46:45 · 208 阅读 · 0 评论 -
RuntimeError: Failed to load the backend extension: torch_npu. You can disable extension auto-loadin
根据您之前尝试运行的自注意力机制代码(来自知识库中的内容),这些是标准的 PyTorch 代码,不需要 NPU 支持。是 PyTorch 用于华为昇腾(NPU)处理器的专用后端。当您在没有 NPU 硬件的普通系统上运行代码时,经常会遇到此错误。是最简单有效的解决方案,它会告诉 PyTorch 不要尝试自动加载 NPU 后端扩展。完成上述任一操作后,您应该能够正常运行自注意力机制和其他标准 PyTorch 代码。这个错误表明您的系统尝试加载。原创 2025-08-11 17:17:47 · 198 阅读 · 0 评论 -
处理失败: module ‘fitz‘ has no attribute ‘open‘
【代码】处理失败: module ‘fitz‘ has no attribute ‘open‘原创 2025-08-07 13:55:53 · 171 阅读 · 0 评论 -
【已解决】WslRegisterDistribution failed with error: 0x80370114
点击启用或关闭Windows功能,然后勾选Windows虚拟机监控程序平台。原创 2025-08-03 07:30:14 · 186 阅读 · 0 评论 -
Could not locate zlibwapi.dll. Please make sure it is in your library path!
这个错误表明您的系统中缺少文件,这是 PyMuPDF (fitz) 库所需的依赖项。原创 2025-06-18 23:15:00 · 568 阅读 · 0 评论 -
RuntimeError: Directory ‘static/‘ does not exis
【代码】RuntimeError: Directory ‘static/‘ does not exis。原创 2025-06-18 07:16:11 · 263 阅读 · 0 评论 -
ImportError: libGL.so.1: cannot open shared object file: No such file or directory
【代码】ImportError: libGL.so.1: cannot open shared object file: No such file or directory。原创 2025-06-09 18:44:12 · 206 阅读 · 0 评论 -
error: subprocess-exited-with-error【已解决】
错误和文件找不到的问题。关键是确保安装所有构建依赖并预先构建扩展模块。如果不行可以从下面的方式中找解决方法。这些步骤应该能解决您遇到的。原创 2025-06-06 19:30:00 · 494 阅读 · 0 评论 -
ImportError: libGL.so.1: cannot open shared object file: No such file or directory
安装缺失的图形库 (推荐)原创 2025-06-03 21:30:00 · 250 阅读 · 0 评论 -
[Set][Options]OpCompileProcessor init failed![FUNC:ReportInnerError][FILE:log_inner.cpp][LIN
安装attrs,执行命令。原创 2025-06-03 21:45:00 · 280 阅读 · 0 评论 -
build op model failed, result = 500002[FUNC:ReportInnerError][FILE:log_inner.cpp][LINE:145]
安装缺少的第三方库,执行命令.原创 2025-06-03 22:00:00 · 299 阅读 · 0 评论 -
ImportError: libblas.so.3: cannot open shared object file: No such file or directory
系统未安装该库或版本不匹配会导致导入失败。错误,需确保系统已安装 BLAS 库。PyTorch 依赖 BLAS 库进行矩阵运算,而。原创 2025-05-28 21:00:00 · 296 阅读 · 0 评论 -
RuntimeError: Cannot find sufficient samples, consider increasing dataset size.
在使用LLaMA-Factory做增量PT预训练的时候,出现了上面的错误,原因是截断太大了,需要设置的小一些,如下图:原创 2025-05-21 18:44:26 · 253 阅读 · 0 评论 -
AttributeError: module ‘copy‘ has no attribute ‘deepcopy‘
新建脚本的时候,建了一个copy.py的脚本,影响到原来程序的执行。原创 2025-01-13 17:01:21 · 218 阅读 · 0 评论 -
RuntimeError_ one of the variables needed for gradient computation has been modified by an inplace o
这个错误信息表明在PyTorch中,用于梯度计算的一个变量被原地(in-place)操作修改了,这导致了梯度无法正确计算。在PyTorch中,原地操作指的是直接修改数据而不创建新副本的操作,例如使用。检查所有可能修改该张量的代码部分,特别是那些使用了原地操作的代码。),并且这个张量的版本已经更新到了3,而梯度计算期望的版本是0。在启用这个设置后,重新运行你的代码,PyTorch会抛出一个更详细的错误,指出哪个操作或哪一行代码导致了问题。是一个在CUDA上存储的张量,它是某个操作的输出(在这个例子中是。原创 2024-12-24 22:36:26 · 533 阅读 · 0 评论 -
send-pack: unexpected disconnect while reading sideband packet
【代码】send-pack: unexpected disconnect while reading sideband packet。原创 2024-12-12 09:53:09 · 285 阅读 · 0 评论 -
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:main.py FAILED
从 pytorch 1.9 开始,torch.distributed.launch 已被弃用,取而代之的是 torch.distributed.run。因此,在新版本中,继续使用旧的 launch 命令会引发错误。torch.distributed.launch 替换为新的 torch.distributed.run。原创 2024-11-27 06:16:16 · 627 阅读 · 0 评论 -
RuntimeError: The server socket has failed to listen on any local network address. useIpv6: 0, code:
这个错误表明,你尝试使用的网络端口已经被其他进程占用。在服务器环境中,特别是当多个用户或任务同时运行时,可能已经被其他DDP训练任务占用。在修改端口号之前,最好先检查你选择的端口是否已经被占用。通常,1024以下的端口号被系统保留或需要特权才能使用。因此,选择更高的端口号(如15000以上)通常更安全且不易冲突。为了避免端口冲突,你可以指定一个不同的端口号来启动你的DDP训练任务。为了使你的脚本更加灵活和可移植,建议不要在脚本中硬编码端口号。如果端口已经被占用,你需要选择一个不同的端口号。原创 2024-11-25 05:44:10 · 1545 阅读 · 0 评论 -
关于MMCV的奇葩错误
项目中用到了MMCV,Pytorch的版本是1.13.1,所以不能安装太高的版本。记录一下遇到的奇葩问题,大家有遇到的,可以按照我的方法试试,更换一下安装包的版本。如果解决不了,那我也没有办法!发现不能解决问题,反而一直在重启进程,被Killed后,显存还是被占用。后来,我觉得可能是MMCV版本的问题,我改成了新版本。这明明在本地都没有问题,为啥到服务器就有问题了呢?结果出现了版本不兼容的问题。安装完成后就可以正常运行。原创 2024-08-16 19:00:00 · 260 阅读 · 0 评论 -
UserWarning: On January 1, 2023, MMCV will release v2.0.0, in which it will remove components relate
在使用mmcv-full的时候出现了下面的警告,但是安装2.0以上版本又会出现不兼容的问题。原创 2024-08-14 06:13:01 · 764 阅读 · 0 评论 -
CUDA11.8安装pytorch1.13.0
记录一下,CUDA11.8是否可以安装pytorch1.13.0。本机环境是CUDA11.8,这个一个长期稳定环境。但是,有些库需要用低版本的pytorch,最高支持1.13.0。我直接安装pytorch1.13.0,可以安装,运行命令也没有问题!原创 2024-06-27 09:25:42 · 2966 阅读 · 0 评论 -
timm中模型更换huggingface模型链接
由于国内不能链接huggingface,可以更换成其他的代理链接,在import的位置加入。原创 2024-06-30 15:10:47 · 647 阅读 · 0 评论 -
attributeerror: ‘FreeTypeFont‘ object has no attribute ‘getsize‘
降低Pillow的版本,新版本中没有了getsize。原创 2024-05-03 07:13:11 · 499 阅读 · 0 评论 -
如何加载尺寸不匹配的权重?
加载预训练权重,或者别人训练的权重的时候,更改了类别的个数,导致尺寸不匹配。这种情况非常常见,那么如何解决呢?原创 2024-04-05 17:27:46 · 1300 阅读 · 1 评论 -
AttributeError: ‘list‘ object has no attribute ‘view‘
训练yolov9的时候遇到了下面的问题。原创 2024-03-01 21:00:00 · 855 阅读 · 0 评论 -
如何解决部分图片读取转化异常的问题
接触到一个数据集,有个别图片在读取转化的时候出现了异常,由于图片之间有关联,导致后续图片无法时候。原创 2024-02-04 21:45:00 · 576 阅读 · 0 评论 -
成功安装DCNv4
终于安装成功了。原创 2024-01-25 07:46:18 · 4352 阅读 · 10 评论 -
redis的一些操作
Windows环境下使用命令行进行redis缓存清理。原创 2023-11-21 14:16:38 · 899 阅读 · 0 评论 -
python按照windows或者Ubuntu的文件夹中文件的顺序读取文件
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-31 15:10:17 · 386 阅读 · 0 评论 -
UserWarning: grid_sampler_2d_backward_cuda does not have a deterministic implementation, but you set
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-29 21:51:24 · 3276 阅读 · 5 评论 -
CondaError: Downloaded bytes did not match Content-Length
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-28 15:49:30 · 984 阅读 · 0 评论 -
【已解决】AttributeError: module ‘cv2‘ has no attribute ‘bgsegm‘
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-26 15:22:05 · 3046 阅读 · 1 评论 -
_pickle.UnpicklingError: STACK_GLOBAL requires str
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-04 05:20:52 · 1384 阅读 · 0 评论 -
error: Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools“: h
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-10-02 17:18:15 · 3236 阅读 · 0 评论 -
【已解决】Input type (struct c10::Half) and bias type (float) should be the same
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-09-12 18:21:06 · 9078 阅读 · 3 评论 -
Can‘t call numpy() on Tensor that requires grad. Use tensor.detach().numpy() instead.
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-08-23 13:00:55 · 3063 阅读 · 2 评论 -
【已解决】RuntimeError: Queue objects should only be shared between processes through inheritance
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-08-11 14:47:26 · 746 阅读 · 0 评论 -
pip安装lap出现问题
本专栏是讲解如何改进Yolov8的专栏。改进方法采用了最新的论文提到的方法。改进的方法包括:增加注意力机制、更换卷积、更换block、更换backbone、更换head、更换优化器等;每篇文章提供了一种到N种改进方法。评测用的数据集是我自己标注的数据集,里面包含32种飞机。每种改进方法我都做了测评,并与官方的模型做对比。代码和PDF版本的文章,我在验证无误后会上传到百度网盘中,方便大家下载使用。这个专栏,求质不求量,争取尽心尽力打造精品专栏!!!!!原创 2023-07-31 16:15:01 · 1618 阅读 · 0 评论 -
【已解决】matrix contains invalid numeric entries,记录bug修改
在使用DeepSort做跟踪的时候,遇到了下面这个问题由于代码来源开源代码,没有太多的注释,所以只能一步步的分析。通过分析发现cost_matrix里包含nan。原创 2023-07-10 21:15:00 · 5528 阅读 · 4 评论