自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(346)
  • 资源 (4)
  • 收藏
  • 关注

原创 YOLO系列算法精讲:从yolov1至yolov8的进阶之路(2万字超全整理)

全网YOLO最详讲解,从v1到v10!从小白到大佬!

2020-07-30 17:16:43 334087 123

原创 阿里千问系列:Qwen3 强化学习新算法GSPO!

Qwen3提出最新强化学习算法GSPO!

2025-08-11 21:37:02 611

原创 阿里千问系列:Qwen2.5-VL-7B-Instruct 多模态模型本地部署

Qwen2.5-VL-7B大模型部署指南!

2025-07-24 01:12:24 495

原创 文心一言大模型4.5系列开源测评

百度开源多模态大模型ERNIE-4.5-VL-424B-A47B

2025-07-13 16:01:11 1310

原创 谷歌多模态系列:Gemma 3n 轻量级大模型解读与本地部署

谷歌 Gemma 3n 多模态大模型开源!轻量级,适用于边缘设备部署!

2025-06-29 20:54:42 1375

转载 强化学习:RL for LLM本质理解

本文探讨了监督学习在大型语言模型(LLM)发展中的局限性及其突破路径

2025-06-21 23:21:11 118

原创 MiniMax-M1开源!支持超长上下文大模型!

MiniMax-M1,是全球第一个开放权重、大规模混合注意力的推理模型。MiniMax-M1 采用了混合专家(MoE)架构,并结合了闪电注意力机制(Lightning Attention Mechanism)。该模型基于之前的 MiniMax-Text-01 模型 开发, 总共包含 4560 亿个参数,每个 token 激活 459 亿个参数。支持超长上下文:与 MiniMax-Text-01 一致,M1 模型原生支持 1 百万个 token 的上下文长度,是 DeepSeek R1 上下文大小的 8 倍。

2025-06-21 16:02:20 946

原创 小米MiMo系列:多模态 MiMo-VL-7B 技术报告解读

小米MiMo系列,多模态大模型MiMo-VL-7B开源!

2025-06-18 21:04:06 721

原创 小米MiMo系列:MiMo-7B-RL技术报告解读

小米MiMO开源!从预训练到后训练,解锁语言模型的推理潜力!

2025-06-15 19:21:01 960

原创 一文读懂 Qwen3 最新开源的 Embedding 和 Rerank 模型优势!

Qwen3 Embedding 与 Rerank 模型开源,助力搜索、排序技术革新!

2025-06-15 00:50:16 1407

转载 一文带你入门AI智能体(AI Agent)

AI小镇开源,含25个Agent,构建"西部世界"AI Town,模拟文明演进。OpenAI创始人Karpathy称AI Agent将颠覆未来。Agent源自拉丁语,意为“行动”,在LLM中指自主执行复杂任务的程序。Agent并非ChatGPT升级版,它不仅告诉你“如何做”,更会帮你去做。如果CoPilot是副驾驶,那么Agent就是主驾驶。一个精简的Agent决策流程,用函数表达式:感知(Perception)、规划(Planning)和行动(Action)。

2025-05-31 23:48:58 160

原创 阿里千问系列:Qwen3技术报告解读(下)

阿里千问系列最新模型Qwen3,核心训练过程揭秘!

2025-05-25 17:13:51 1275

原创 阿里千问系列:Qwen3技术报告解读(上)

通义千问大模型Qwen3技术报告全文概览!

2025-05-25 15:13:15 951

原创 阿里千问系列:Qwen大模型API调用(Python版)

官方参考链接:https://help.aliyun.com/zh/model-studio/vision?界面,找到需要授权的子业务空间后,单击其右侧的模型权限流控设置。3、选择需要的模型,编辑权限,并保存。,单击创建我的API-KEY。

2025-05-10 17:43:08 3005

原创 YOLOv11 解读

结构上的创新:引入了如C3k2模块、SPPF和C2PSA等新元素,增强了其特征提取和处理能力。这些改进使得模型能够更好地分析和解释复杂的视觉信息,在各种场景中可能提高检测精度。增强了注意力机制:集成了复杂的空域注意力机制,特别是C2PSA组件。使模型能够更有效地聚焦图像中的关键区域,增强了其检测和分析物体的能力。改进的注意力能力对于识别复杂或部分遮挡的物体尤为有利,解决了物体检测任务中常见的难题。多功能模型:YOLO11的多功能性超越了物体检测,包括实例分割、图像分类、姿态估计和定向物体检测等任务。

2025-04-12 21:06:05 2012

原创 ImportError: libGL.so.1: cannot open shared object file: No such file or directory 报错处理

OpenCV的某些依赖库缺失,比如libGL.so.1,而OpenCV在处理图像或视频时可能需要它。

2025-04-10 19:22:54 1174

原创 阿里千问系列:Qwen2.5大模型解读

2023年8月,阿里首次开源通义千问第一代模型Qwen-7B,这是一个有70亿参数的通用语言模型。

2025-03-19 19:23:59 1783

原创 基于GLM4大模型的Lora微调实战

手把手大模型微调实战教程:从免费GPU环境搭建、到模型微调与部署,轻松学会!

2025-03-16 00:20:12 1207

原创 浅读LLAMA2

2023年7月,Mata正式推出Llama 2,包含一系列预训练和微调的大型语言模型(LLMs),参数规模从7B到70B不等。

2025-03-13 15:37:10 714

原创 【经典算法】Leetcode-零钱兑换问题

动态规划,秒解零钱兑换问题!

2025-03-12 23:37:14 642

原创 【DeepSeek系列】05 DeepSeek核心算法改进点总结

DeepSeek系列核心算法总结:4大改进点+2个思考!

2025-02-24 23:36:11 3013

原创 【DeepSeek系列】04 DeepSeek-R1:带有冷启动的强化学习

DeepSeek-R1-Zero的提出,展现了其强大的推理能力,但是它也有一些缺点,例如可读性差和语言混用。为了解决这些问题并进一步提升推理性能,进一步推出了 DeepSeek-R1,它在 RL 之前引入了多阶段训练和冷启动数据。DeepSeek-R1 在推理任务上的表现与 OpenAI-o1-1217 相当。

2025-02-19 23:55:07 1076

原创 【DeepSeek系列】03 DeepSeek-R1-Zero:在基础模型上进行纯强化学习

DeepSeek-R1-Zero 是一个通过大规模强化学习(RL)训练的模型,而无需先进行有监督的微调(SFT),展示了显著的推理能力。通过强化学习,DeepSeek-R1-Zero 自然地涌现出许多强大且有趣的推理行为。

2025-02-19 02:01:22 851

原创 【DeepSeek系列】02 DeepSeek-V3 技术解读

一文快速了解DeepSeek-V3技术亮点!

2025-02-17 00:38:43 1114

原创 【经典算法】秒懂反转链表

经典链表反转问题秒懂解法!

2025-02-09 16:48:15 912

原创 【DeepSeek系列】01 DeepSeek-R1 快速入门

2024年底,DeepSeek 相继推出了其第一代推理大模型:DeepSeek-R1-Zero 和 DeepSeek-R1。是一个通过大规模强化学习(RL)训练的模型,训练过程中没有使用监督微调(SFT)作为初步步骤。该模型在推理任务上表现出色,通过强化学习,自然涌现出许多强大且有趣的推理行为。然而,DeepSeek-R1-Zero 也面临一些挑战,例如无休止的重复、可读性差以及语言混杂等问题。为了解决这些问题并进一步提升推理性能,进一步推出了,该模型在强化学习之前引入了冷启动数据。

2025-02-06 00:06:52 3294

原创 2024多模态大模型综述最新总结

多模态大模型(MLLM)综述!

2024-12-22 20:20:57 3682 3

原创 《多模态大型语言模型(MM-LLMs)的最新进展》解读

这本系统性总结了目前多模态大语言模型(MM-LLMs)的研究进展,不管是对于这个领域的初探者,还是“局中人”,我觉得这篇论文都是一个很值得学习的资料!

2024-11-29 01:13:05 1349

原创 YOLO-World:开启实时开放词汇目标检测的新篇章

YOLO-Word:检测任何目标!再也不用预定义目标类别!

2024-06-11 00:31:02 1690

原创 YOLOv10:实时端到端目标检测的新突破

清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜!

2024-06-03 01:33:31 2861 2

原创 文生图大模型三部曲:DDPM、LDM、SD 详细讲解!

文生图大模型Stable Diffusion的前世今生!

2024-03-27 22:22:05 11271 2

原创 YOLOv9解读

最新目标检测网络YOLOv9!

2024-03-23 21:41:52 2834

原创 CLIP解读

CLIP多模态模型详细解读!

2024-03-17 18:50:05 1882

原创 最强文生图跨模态大模型:Stable Diffusion

一文带你了解文生图大模型 Stable Diffusion !

2023-12-12 23:06:50 4908

原创 SMOTE 过采样,解决正负样本不均衡问题

通过SMOTE过采样,可以使得模型更好地学习到少数类别的特征,从而提高模型的泛化能力和准确性。此外,SMOTE过采样方法还可以减少模型的过拟合倾向,提高模型的稳健性(Robustness)。为了解决这个问题,一种常用的方法是过采样,其中SMOTE(SyntheticMinority Over-sampling Technique)是一种被广泛应用的技术。准备原始数据集: 假设你有一个包含特征和标签的PyTorch张量 X 和 y,其中 X 的形状是 (样本数, 特征数),y 的形状是 (样本数, )。

2023-12-12 22:12:48 3530

原创 【扩散模型之LDM】Latent Diffusion Models 论文解读

Latent Diffusion Model 论文解读

2023-10-06 19:04:47 7402

原创 【扩撒模型之DDPM】Denoising Diffusion Probabilistic Models论文解读

AI绘画初探:扩散概率模型(DDPM)

2023-09-23 18:42:01 2393

原创 C++中虚函数的作用?

虚函数简明理解!

2023-07-21 00:26:53 2278

原创 10分钟理解RNN、LSTM、Transformer结构原理!

RNN、LSTM、Transformer 经典结构解析!

2023-07-11 17:19:00 9138 2

原创 语言模型BERT理解

bert浅析

2023-07-09 18:34:26 8402 7

YOLOv11目标检测论文

YOLOv11目标检测论文

2025-04-12

CVPR2020-目标检测合集.7z

此资源整理和收集了2020年CVPR计算机视觉顶会发布的关于的目标检测等方面的论文,可供CV专业学生以及相关工作人员学习使用与参考。

2020-10-30

2020年中国研究生数学建模竞赛赛题.7z

本资料收集了2020年华为杯中国研究生数学建模竞赛全部赛题(包括A、B、C、D、E、F题),可供准备数模比赛的同学学习与参考。

2020-10-30

start.sh.txt

开机自启动shell文件

2021-06-07

Fashion-MINIST.zip

这个资源是经典的Fishion-MNIST数据集。如果你是深度学习小白新手,在学习之初想用一些单间的数据集来进行训练,可以使用这个经典的Fishion-MINIST数据集。

2020-04-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除