- 博客(357)
- 资源 (431)
- 收藏
- 关注
原创 人工智能|大模型——RAG——RAG从理论到实战
在当今人工智能技术飞速发展的时代,大模型已经成为各行各业关注的焦点。然而,如何将这些通用的大模型应用到我们的具体业务场景中,如何解决大模型在实际应用中的种种局限,这些都是我们需要深入思考的问题。RAG,也就是检索增强生成技术,正是解决这些问题的关键方案之一。 在接下来的分享中,我会从理论基础出发,逐步深入到技术细节和实践案例,帮助大家全面理解RAG,并掌握从0-1搭建RAG系统的核心流程及方法,以为大家在实际工作中应用这一技术提供支持。
2026-02-09 18:03:37
750
原创 人工智能|大模型——Agent Skills——Skills设计详解
AgentSkills是一种将可复用的AI协作流程封装为标准化任务的机制,通过Markdown文件定义任务名称、描述和执行步骤。OpenCode支持项目本地和全局两种Skill配置路径,采用渐进式三层加载机制(元数据、指令、资源)优化Token消耗。Skill包含核心SKILL.md文件和可选资源(scripts、references、assets),其创建可借助skill-creator元技能完成。这种设计通过模块化、标准化和按需加载,既提升了AI协作效率,又降低了资源消耗,实现了复杂工作流程的确定性执行
2026-01-30 14:48:25
1394
原创 人工智能|大模型——应用——详解ClawdBot(Moltbot)
最近,一个名为 ClawdBot 的项目在技术圈引起了广泛的讨论。许多人称其为“真正能做事的 AI”、“个人 AI 助理的未来形态”。它似乎不仅仅是一个聊天机器人,而是一个能接入我们日常生活、实际操作电脑的强大工具。那么,ClawdBot 究竟是什么?
2026-01-29 17:48:13
1382
原创 人工智能|大模型——部署——vLLM专家并行支持:MoE模型的高效部署方案
vLLM框架针对MoE模型部署提出创新解决方案,通过分组TopK路由算法、令牌重排对齐机制和混合精度专家计算三大核心技术,有效解决了计算资源碎片化、跨设备通信瓶颈和内存管理复杂性等核心挑战。该系统支持动态专家选择策略和多模态处理,在70B参数的MoE模型上实现75%以上的GPU利用率,显存占用降低40%,吞吐量较传统方案提升3倍。未来将发展自适应专家并行和异构专家部署等功能,为万亿参数模型提供高效推理支持。最佳实践包括模型权重优化、系统参数配置和性能指标监控等关键步骤。
2026-01-28 15:26:08
687
原创 人工智能|大模型 —— Agent Skills —— opencode与skills的安装与使用
本文介绍了AI编程代理OpenCode的安装配置与使用指南。主要内容包括:1) 常用Skill下载源和配置方法(手动下载/市场安装);2) OpenCode的安装方式(一键脚本/包管理器/桌面应用);3) 基础配置步骤(连接AI模型、项目初始化);4) 基本用法(切换代理、引用文件提问)。OpenCode作为开源AI编程助手,支持多模型接入,提供终端和图形界面两种操作方式,能帮助开发者更高效地理解和修改代码。
2026-01-27 14:35:01
1447
原创 人工智能|大模型——量化——Ollama模型量化参数设置全解析如何避免性能下降与显存溢出
在当今大语言模型(LLM)快速发展的时代,Ollama作为一款优秀的本地模型运行框架,为用户提供了便捷的模型部署和运行能力。然而,随着模型规模的不断增大,如何在有限的硬件资源下高效运行这些模型成为了一个重要问题。模型量化技术应运而生,它通过降低模型权重的数值精度来减少内存占用和提升推理速度。但量化并非简单的参数调整,不当的设置可能导致严重的性能下降甚至显存溢出问题。
2026-01-22 09:53:39
712
原创 人工智能|大模型 —— 量化 —— 一文搞懂大模型量化技术:GGUF、GPTQ、AWQ
本文系统探讨了大模型量化技术的理论基础与实现方法。首先介绍了对称量化(absmax方法)和非对称量化(零点量化)的基本原理,分析了量化误差的产生机制。随后重点讨论了GGUF分组量化方法,通过具体示例展示了4位量化过程。在优化方法方面,详细阐述了GPTQ的后训练量化技术,包括其Hessian-based误差补偿机制和LazyBatch-Updates加速策略。最后介绍了AWQ方法,该方法通过激活感知选择1%关键权重进行保护,结合缩放因子优化显著降低了量化误差。实验结果表明,AWQ与GPTQ相结合能进一步提升量
2026-01-21 15:13:38
611
原创 计算机硬件|计算机组成——计算机硬件的组成与协作
本文系统介绍了计算机硬件组成及协作机制。硬件主要包括CPU、存储系统、外部设备和互连总线四大类:CPU负责指令执行与协调;存储系统包含内存和固态/机械硬盘;外部设备涵盖各类I/O设备;总线实现组件间通信。文章详细解析了各部件功能,并通过文件读取排序和网页渲染两个实际案例,展示了硬件协作流程。最后指出性能瓶颈主要来自访问模式和延迟,建议编写程序时注意局部性、减少拷贝、善用DMA等技术优化硬件利用率。理解硬件协作原理有助于性能优化和架构设计。
2025-12-24 17:13:49
1179
原创 人工智能|大模型 —— 部署 ——Ollama 安装部署教程,一键搭建本地大模型
Ollama是一款支持在Windows、Linux和MacOS上本地运行大语言模型的工具,提供1700+预训练模型和自定义模型功能。安装方式包括直接下载安装包(Windows/Mac)或脚本/二进制安装(Linux)。用户可通过命令行管理模型,支持参数调整和多GPU加速。文章详细介绍了各平台安装步骤、环境变量配置、模型路径修改方法,以及如何从Huggingface导入模型。最新版本0.3.13新增支持直接从Huggingface Hub拉取GGUF量化模型的功能,并提供了具体操作命令示例。
2025-12-05 16:48:27
902
原创 环境配置|GPUStack安装——GPUStack安装与配置指南
GPUStack是一个开源的GPU集群管理工具,支持跨平台部署AI模型。它兼容多种硬件架构(NVIDIA CUDA/AMD ROCm/华为Ascend),提供分布式推理、用户管理、监控等功能,并通过Docker容器化部署。安装需预装Python 3.8+和Docker,支持Linux/macOS/Windows系统。配置完成后,可通过Web界面(默认8080端口)管理AI模型服务,集成vLLM等推理后端,实现高效的GPU资源调度和模型部署。
2025-12-05 16:19:16
775
原创 人工智能|大模型 —— GPU管理 —— GPUStack为大模型而生的开源GPU集群管理器
摘要:Seal团队发布开源GPU集群管理器GPUStack,支持企业快速部署私有大型语言模型。该平台可统一管理NVIDIA、Intel、AMD等异构GPU资源,提供模型部署、OpenAI兼容API、资源监控等功能。通过自动化调度算法,GPUStack能根据资源情况优化模型运行方式,支持从HuggingFace部署GGUF格式模型。平台还提供RBAC访问控制、性能监控等企业级功能,适用于边缘计算、数据中心等多种场景。安装过程支持Linux、macOS和Windows系统,可构建混合集群。
2025-11-07 16:48:28
1204
原创 编程语言|前端开发——WebAssembly 和 JavaScript 该怎么选?
本文对比了JavaScript与WebAssembly在浏览器运行时的性能表现。测试结果显示:在资源体积方面,JavaScript原始体积为1.8KB,优化后的WebAssembly为4.6KB;初始化时间上,JavaScript仅需34ms,而WebAssembly需要528ms;执行CPU密集型任务时,JavaScript耗时126ms,WebAssembly仅需28ms。结论是:JavaScript在加载速度和体积上更优,适合快速执行的轻量任务;而WebAssembly在执行效率上优势明显,更适合计算
2025-11-06 19:53:43
1191
原创 人工智能|强化学习——基于人类反馈的强化学习(RLHF)深度解析
基于人类反馈的强化学习(RLHF)是训练先进AI系统的核心技术,使ChatGPT等大语言模型能更好地对齐人类价值观。RLHF通过三阶段流程实现:监督微调初步训练模型,奖励模型学习人类偏好,强化学习优化模型输出。奖励模型是关键组件,通过偏好学习算法将人类判断转化为评分信号。尽管面临奖励欺骗、反馈偏差等挑战,RLHF正推动AI从单纯追求性能转向安全性和人类价值观对齐。随着DPO、RLAIF等新方法出现,RLHF持续推动AI系统向更有用、更安全的方向发展。
2025-10-15 21:27:46
1385
2
原创 在线机考|2025年华为暑期实习&春招&秋招编程题(最新)——第1题_物流运输
摘要:题目描述了一个树形结构的快递配送问题,需要计算完成所有快递任务的总路径长度。通过BFS建立树的拓扑序,后序遍历统计每个节点的寄件和收件数量,最后累加所有边权值乘以对应任务数。算法使用邻接表存储树结构,时间复杂度为O(N+M)。代码提供了C++、Python和Java三种实现,核心思路相似。
2025-06-12 11:53:06
803
原创 在线机考|2025年华为暑期实习&春招&秋招编程题(最新)——第2题_网络整改
题目要求计算从树中移除最少节点数,使剩余节点构成一棵所有叶节点深度相同的树。给定树结构,程序通过动态规划自底向上计算每个子树在不同目标叶深度时的最大保留节点数。核心思想是遍历所有可能的叶深度(0到最大深度),对于每个深度,验证保留节点数,最终输出总节点数减去最大保留节点数。 摘要(150字):本文解决树结构调整问题,要求移除最少节点使剩余树的所有叶节点深度相同。采用动态规划方法,预处理节点深度和子树结构,遍历每个可能的叶深度,计算相应最大保留节点数。程序通过后序遍历和分层处理优化计算,最终输出需要移除的最小
2025-06-12 11:09:32
667
原创 科研学习|科研软件——激活后的Origin导出图时突然出现了demo水印
摘要 解决导出图形带"demo"水印问题有两种方法:1) 右击软件图标选择"以管理员身份运行";2) 进入软件安装目录,双击运行Origin64.exe文件。这两种方式都可以去除导出图形中的演示版水印标记,确保输出干净的专业图表。
2025-06-01 22:42:15
6734
1
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第3题_个性化歌单推荐系统_300分(十一)
假设你是音乐服务的开发者,为了提高用户体验需要解决推荐歌单的同质化问题,保证推荐给用户的所有歌单不包含相同歌曲的。给定一个包含N个歌单和M条歌单重复记录,每个歌单用一个从1到N的整数编号,歌单重复记录包含两个歌单的ID,表示两个歌单有相同的歌曲。你的任务是对歌单进行合并,找出合并后的最小歌单数量,合并的歌单中不能有相同的歌曲。
2025-01-07 00:15:00
1020
2
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第2题_公司园区里的建筑群_200分(十)
某公司基地园区很大,里面有N个建筑,依次编号为1到N,通过M条路将这些建筑连接在一起,这N个建筑根据之间的距离,被分为不同的建筑群。云小核喜欢饭后散步,并用步数计算了每条路的长度。经过一段时间的散步,云小核发现了一个规律,两个建筑群间最近的两个建筑之间,步数大于K步。两个建筑群之间,可能没有路。云小核把每条路的步数给了你,请你计算园区里有多少个建筑群?
2025-01-06 00:15:00
654
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第1题_最强大脑游戏_100分(九)
某最强大脑游戏要求:选手在一个整数序列中(整数取值为[1, 10]),自行去掉K个整数,得到一个新的整数序列,-使得整数序列左到右拼接起来后,得到的整数值最大。那么假设你是优秀的选手,在给定这个整数序列之后,你能够得到的最大整数值是多少?
2025-01-05 00:15:00
648
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第3题_PCB印刷电路板布线_300分(八)
在PCB印刷电路板设计中,器件之间的连线需要避免线路的阻抗值增大、而且赛件之间还有别的器件和别的干扰源,在布线时我们希望受到的干扰尽量小。现将电路板简化成一个M×N的矩阵,每个位置(单元格)的值表示其源干扰度。如果单元格的值为0,表示此位置没有干扰源;如果单元格的值为非0,则表示此位置是干扰源,其值为源干扰度。连线经过干扰源或干扰源附近会增加连线的总干扰度。位置A[x, y]的干扰源的源干扰度为d(d>0),则连线的干扰度计算如下:1、若连线经过位置A[x, y],则其总干扰度会增加d;
2025-01-04 00:15:00
919
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第1题_拔河比赛队员选拔_100分(八)
某团队近期需要组织一支队伍参加拔河比赛,团队共有队员n人,比赛队员人数要求为m人,n>m,n个队员按编号,1到n的顺序参加k轮力量测试,每轮的测试成绩用正整数表示。根据n个队员的力量测试成绩选择比赛队员m人,先选择k轮测试中最好成绩最大的队员,若有多人的最好成绩相等,则优先选择其中第二好成绩最大的队员,依次类推,最后若还有相等的情况,则优先选择编号较小的队员。每个人只能被选择一次。
2025-01-03 00:15:00
485
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第2题_公司班车上车点规划_200分(七)
某公司基地搬迁到新地点之后,新规划了一条班车路线,在这条路线上会经过N个小区,计划在这些小区中挑选出M个作为上车点,小区的位置可以用一维坐标上的点来表示,小区到上车点的距离为两个坐标点差值的绝对值。现在给定N个小区的位置,即一维坐标上的整数点:x1、x2、…、xN $ ,我们希望所有小区到最近上车点的距离总和尽可能小,请计算这个最大值能够是多少?当该小区被作为上车点,该小区到上车点的距离为0。
2025-01-02 00:15:00
416
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第2题_微服务发布时长_200分(六)
部署发布时,通常需要部署所有的现网局点。局点的部署过程存在依赖关系,因为某些局点需要等其他的局点部署完成后,才能开始部署。另外这些局点由于网络或地理位置的原因,所花费的部署时间有可能是不同的。给定一个大小为n的数组region存储局点之间的部署依赖关系,其中region[i]是第i个局点的依赖局点,0
2025-01-01 17:38:04
666
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——第3题_订单取餐顺序_300分(五)
肯德基店销售炸鸡、薯条、可乐三种实物,准备三种食物的速度一样,且三种食物同时制作;三种食物同时制作,按订单顺序进行分发食物。现在有N个订单,每个订单用连续三位数组元素表示,数组的元素是对应食物的份数。N最大为100万,每个订单里每份食物最多100万份。请计算N个订单的取餐顺序,如果多个订单可以同时取餐,按订单号从小到大排序。
2024-12-31 00:15:00
753
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——中等、较难和困难题目Python3答案(三)
【代码】牛客网|华为在线编程(最新)——中等、较难和困难题目Python3答案(三)
2024-12-29 00:15:00
336
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——中等、较难和困难题目Python3答案(二)
【代码】牛客网|华为在线编程(最新)——中等、较难和困难题目Python3答案(二)
2024-12-27 14:59:41
315
原创 在线机考|2024华为实习&秋招&春招编程题(最新)——中等、较难和困难题目Python3答案(一)
【代码】牛客网|华为在线编程(最新)——中等、较难和困难题目Python3答案(一)
2024-12-27 14:35:19
874
1
原创 人工智能|预训练大模型——混合专家模型(MoE)
MoE,全称为Mixed Expert Models,混合专家模型,简单理解就是将多个专家模型混合起来形成一个新的模型。在理解MOE之前,有两个思想前提,可以帮助我们更容易地理解MOE架构。一是在现实生活中,如果有一个包括了多个领域知识的复杂问题,我们该使用什么样的方法来解决呢?最简单的办法就是先拆分任务到各领域,然后把各个领域的专家集合到一起来攻克这个任务,最后再汇总结论。这个思想可以追溯到集成学习,MoE和集成学习的思想异曲同工,都是集成了多个模型的方法,区别在于集成学习不需要将任务分解为子任务。
2024-12-19 15:24:30
2011
原创 科研学习|论文解读——智能体最新研究进展
Can Modern LLMs Act as Agent Cores in Radiology~Environments?Achieving Collective Welfare in Multi-Agent Reinforcement Learning via Suggestion SharingA systematic review of norm emergence in multi-agent systemsAgent-based Video TrimmingGROOT-2: Weakly Supe
2024-12-19 14:44:45
978
原创 科研学习|论文解读——顶会论文中多模态数据融合成果
该论文提出了一种名为“逐步融合”(Progressive Fusion)的多模态集成方法,旨在缓解早期融合和后期融合的缺点。传统多模态集成方法将各模态的特征在不同阶段进行融合,但这可能导致信息损失。逐步融合通过向后连接,将后期融合表示引入早期层级,使模型逐步完善融合后的多模态表示,从而增强表达能力。实验表明,该方法在情感检测、媒体分析等任务中有效提高了模型的性能和鲁棒性。本研究开发了一个平衡多模态学习框架(BalanceMLA),聚焦于音视频多任务学习中的模态不平衡问题,特别是语音与情感识别。
2024-12-18 15:19:57
2198
原创 人工智能|预训练大模型——思维链详解[Chain of Thought, CoT]
Chain-of-Thought(CoT)是一种改进的Prompt技术,目的在于提升大模型LLMs在复杂推理任务上的表现,对于复杂问题尤其是复杂的数学题大模型很难直接给出正确答案。如算术推理(arithmetic reasoning)、常识推理(commonsense reasoning)、符号推理(symbolic reasoning)。COT通过要求模型在输出最终答案之前,显式输出中间逐步的推理步骤这一方法来增强大模型的算数、常识和推理能力。简单,但有效。2022 年,在 Google 发布的论文。
2024-12-17 16:46:31
5370
原创 科研学习|研究方法——访谈法
访谈,就是指以,调查者根据调查需要,并根据回答,以此用于学术研究的方法。与文献研究法、数据等研究方式不同,,整个研究工作都需要围绕着人进行,是一项直接从受众身上得到所需数据或结论,并作用于研究对象的方法。多数情况下,访谈法更多地被应用于心理学研究,但随着研究需要的扩大,现在有许多其他学科也将访谈法视为重要的研究方法。等分类。
2024-12-13 08:00:00
4395
原创 环境配置——Win10更新后严重卡顿?教你几招快速解决系统卡顿问题
通过检查并优化启动项、清理系统垃圾文件、更新驱动程序、调整虚拟内存以及检查并修复系统文件等方法,可以有效解决Windows 10更新后出现的系统卡顿问题。定期进行系统维护和备份,保持系统和软件更新,必要时进行硬件升级,能够进一步提高系统的稳定性和性能。
2024-12-12 00:15:00
6298
原创 人工智能|自然语言处理——机器翻译评价指标Bleu和Rouge
在机器翻译任务中,BLEU 和 ROUGE 是两个常用的评价指标,BLEU 根据精确率(Precision)衡量翻译的质量,而ROUGE 根据召回率(Recall)衡量翻译的质量
2024-12-11 10:23:51
1722
1
原创 编程语言|python3——GUI编程
1.python提供了多个图形开发界面库tkinter(import tkinter) :Tkinter 模块(Tk 接口)是 Python 的标准 Tk GUI 工具包的接口wxPython(import wx) :wxPython 是一款开源软件,是 Python 语言的一套优秀的 GUI 图形库Jytyhon(import sys sys.path.append(a.jar)
2024-12-03 00:30:00
2318
2
原创 环境配置|联想G510笔记本电脑换屏——操作步骤详解
前一段时间,电脑放在包中不知道什么原因,电脑屏幕发生了挤压,屏幕出现了漏液的情况,右下角出现了两个黑色的圆圈,之后查询了一下换屏费用... ... 果断选择自行淘宝购买(比较便宜,本人对屏幕的分辨率并没有什么太高要求)并进行安装,现将整个的安装过程分享如下:1.购买对应的笔记本液晶屏幕2.拔掉电源线,卸除笔记本电池一来是为了硬件的安全,二来是为了更加方便的拆除屏幕的外壳3.
2024-12-02 07:00:00
6164
3
原创 科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持
目前,旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析,来理解旅游偏好的波动,制定有针对性的发展策略。然而,鉴于在线景点评论涉及过多的混合和无形维度,广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外,现有文献通常局限于几个旅游目的地和起源地的某些类型的景点,很难保证具有全面的洞察力。为了克服这些局限性,本研究提出了一种新的知识图谱驱动框架,该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。
2024-12-01 23:06:24
1612
原创 人工智能|计算机视觉——微表情识别(Micro expression recognition)的研究现状
MEGC2019中的四篇工作,虽然使用的网络结构各不相同,但思路类似,都使用了微表情的Apex帧表示整段表情的特征。总体而言,关于Apex的光流是比较好的特征形式,而Transfer learning+Domain Adaptation对于模型的效果提升也是巨大的。
2024-11-19 23:19:41
5021
1
原创 科研学习|论文解读——Past Present and Future of Industry4.0 a systematic literature review
工业4.0的过去、现在和将来——系统性文献综述和研究议程提案
2024-11-16 00:15:00
1626
人工智能-鸿蒙开发-阅读鸿蒙版仓库
2025-04-28
Origin中【CorrelationPlot】插件资源,下载后直接拖拽到右侧+app处即可安装
2025-04-16
人工智能-知识图谱-基于领域本体和大语言模型的知识图谱自动化构建工具
2025-04-16
人工智能-大语言模型-基于deepseek 的OCR
2025-02-15
人工智能-大语言模型-基于DeepSeek开发的Intellj Idea插件
2025-02-15
人工智能-大语言模型-基于200万条医疗数据对deepseek-r1进行微调且简单部署
2025-02-15
人工智能-法律问答-基于知识图谱的林业法律法规问答
2025-01-11
人工智能-迁移学习-基于知识库的问答系统 其中使用带注意力机制的对抗迁移学习做中文命名实体识别,使用BERT模型做句子相似度分析
2025-01-01
人工智能-强化学习-基于强化学习的空战对抗
2025-01-01
人工智能-对比学习-基于iris数据集进行四种机器学习算法(决策树、朴素贝叶斯、随机森林、支持向量机SVM
2024-12-17
人工智能-预训练大模型-基于预训练模型 BERT 的阅读理解
2024-12-12
人工智能-预训练大模型-简洁易用版TinyBert:基于Bert进行知识蒸馏的预训练语言模型
2024-12-12
人工智能-开源情报-基于开源威胁情报AlienVault,排查IP地址及域名的恶意性
2024-12-01
人工智能-开源情报-本项目致力于收集网上公开来源的威胁情报,主要关注信誉类威胁情报(如IP/域名等),以及事件类威胁情报
2024-12-01
人工智能-检索增强生成-基于BM25、BGE的检索增强生成RAG示例
2024-11-19
人工智能-检索增强生成-利用开源大模型,通过RAG(检索增强生成)技术,实现基于企业内部知识图谱的,可内网运行的大模型智能客服
2024-11-19
The Ultimate Collection of 500+ Agentic Skills for Claude Code.zip
2026-01-29
AI Agent + Coding Agent + 300+ assistants agentic AI desktop .zip
2026-01-29
Specification and documentation for Agent Skills.zip
2026-01-29
Vercel's official collection of agent skills.zip
2026-01-29
An agentic skills framework & software development methodology that works.zip
2026-01-29
yolov3 yolov4 channel and layer pruning, Knowledge Distillation 层剪枝,通道剪枝,知识蒸馏
2026-01-22
SecGPT网络安全大模型
2025-11-16
基于大语言模型(LLM)和多智能体(Multi-Agent)探究AI写小说能力的边界
2025-11-06
基于大型语言模型的评论回复机器人
2025-11-06
人工智能-大模型-使开发者能够通过标准化的接口轻松使用多个中国的大型语言模型(LLM)
2025-06-01
人工智能-计算机视觉-这是一个yolov8-pytorch的仓库,可以用于训练自己的数据集
2025-06-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅