自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 直观解释 Transformer 原理

看:借助 Query、Key、Value 向量( 由 Token 的向量表示,乘上W_Q,W_K,W_V 矩阵得到 ),用某个 Token 的 Q 和其他 Token 的 K 向量进行乘积( 表示了他们之间的关联程度 ),经过 SoftMax 变成概率后,对 V 按概率加权相加,得到更新后的某个 Token 的新的向量表示。是:找谁跟谁有关,例如:输入喜欢唱跳打篮球的帅哥,经过 Self-Attension ,帅哥这个名词就会”学习“到喜欢唱跳打篮球是和它有关系。本质:也是更新 Token 的向量表示。

2025-08-04 20:37:04 197

原创 AI 时代,从零到一做一件事

所有步骤全部与 AI 沟通!

2025-07-01 15:58:17 296

原创 从零到一:LeetCode Hot 100( 少走弯路版 )

本文目标是总结并 good at 哈希、二分查找、滑动窗口等 pattern ,这样就可以在做题中将其当作工具去使用。本文解题代码选择的是 python,因为 python 的语法简单,可以将注意力集中在解题思路上,而不是编程语言的语法。

2025-07-01 09:38:42 254

原创 Gemini CLI 部署及相关问题解决

项目地址。

2025-06-29 14:32:39 1108

原创 六个月掌握第二门语言-英语

英语对程序员很重要,因为前沿技术等都使用的是英文,Kapathy 在他的 X 上的置顶帖子是这样说的:The hottest programming language is English,这篇文章总结了一个关于如何学习外语的视频,这里我将它带入成英语,感兴趣的可以去搜索《六个月内学会一门外语》

2025-06-27 15:18:20 1003

原创 LeetCode Hot 100 -- 二分查找

【代码】LeetCode Hot 100 -- 二分查找。

2025-06-27 09:04:21 170

原创 LeetCode Hot 100 -- 栈和堆

【代码】LeetCode Hot 100 -- 栈。

2025-06-24 10:00:42 199

原创 LeetCode Hot100 -- 技巧

任何数和 0 做异或,等于自己。自己和自己做异或,等于 0。

2025-06-22 22:38:57 137

原创 LeetCode Hot 100 -- 二叉树

【代码】LeetCode Hot 100 -- 二叉树。

2025-06-22 10:14:02 175

原创 LeetCode Hot 100 -- 图论

【代码】LeetCode Hot 100 -- 图论。

2025-06-21 10:53:26 217

原创 Stable diffusion 本地部署

注意:如果是最新的 5060 显卡,CUDA 是 12.9 版本,会和项目虚拟环境中的 pytorch 不兼容,需要降低 CUDA版本,并卸载原来的 pytorch 然后安装相匹配的 pytorch 版本。

2025-06-20 23:02:01 1649

原创 AI 时代,如何与时俱进?

AI技术正经历从传统编程向大语言模型(LLM)驱动的转变。国外AI发展聚焦技术前沿与应用创新,国内则更关注政策导向。当前LLM如同"操作系统",通过API提供服务,但训练成本高昂。典型应用如Cursor编辑器整合多模型,实现代码自动补全和上下文采集。尽管AI能快速生成内容,仍需人工校验,优化方向包括加速验证过程和控制输出质量。未来趋势是AI与人类深度协同,发展各类专业Agent(如智能客服)完成特定任务,最终实现"人机合体"的智能增强模式。

2025-06-19 23:25:42 191

原创 LeetCode Hot 100 -- 动态规划

拆解问题( 状态方程 ) + 记住答案( 下次使用 )

2025-06-18 23:05:14 145

原创 LeetCode Hot 100 -- 贪心算法

选择每一步的局部最优,从而达到全局最优。

2025-06-18 08:50:21 150

原创 SalesGPT 项目部署

详细介绍参考 repo 中的 README.md。

2025-06-17 18:10:38 502

原创 LeetCode Hot 100 -- 回溯法

回溯法是一种系统搜索所有可能解的算法策略,通过逐步构建候选解并在不满足条件时回退,常用于解决排列、组合等问题。其核心模板包括递归调用和状态回退两个关键步骤。示例展示了全排列和子集问题的解法:全排列通过标记已用元素避免重复,子集则通过控制搜索起点避免重复子集。代码结构遵循"处理-递归-回退"的模式,典型应用还包括电话号码的字母组合等组合类问题。该算法能有效探索解空间,但需注意剪枝优化以避免无效搜索。

2025-06-16 22:47:11 149

原创 Fine-tuning 技术

在预训练模型基础上,用特定领域的小规模数据继续训练(更新模型参数),实现定制化任务。

2025-06-15 15:34:51 374

原创 Function Calling 原理+代码

为模型提供了一种函数调用的能力,作用:让模型可以与外部系统交互。

2025-06-14 11:14:20 1909

原创 RAG 技术与应用

Retrival-Augmented Generation 检索数据增强:基本思想是通过检索相关信息,将这些信息作为上下文输入到模型中,从而提高结果的时效性和准确性。解决知识时效问题减少模型幻觉提升专业领域回答质量Cursor 中就用到了 RAG,将我们的代码作为上下文输入到模型中应用:NotebookLM( 需要魔法 )、imacopilot。

2025-06-11 18:17:26 649

原创 Embedding 和向量数据库

可以理解为特征表达( 将特征( 如果是文本的话就是分词后的数据 )用向量表示,而后在这个向量空间中,相似特征的向量在空间上是接近的 ),将高维稀疏矩阵映射到低维稠密向量空间的过程( 高维到低维的过程会学习特征的内在特征和语义信息,结果是让向量不再仅仅表达一个特征,更重要的是让相似特征的向量在向量空间中接近,关联度高 ),作用:降维,方便计算关联度 cos (Embedding 的是实现方法:Word2Vec,原理是将一个特征( 向量 )和一个字典矩阵( 包含许多信息的矩阵 )相乘,学习到信息。

2025-06-10 19:57:11 189

原创 通俗解读 AI 领域中的向量

,AI 就会把和 prompt 关联度高的给输出,得到的结果就是我们看到的它的回答。( 我们人也是一样,会对不认识的东西进行关联度比较,进而得到想知道的答案,例如:你在你室友的衣架上看到上面挂了一个五颜六色的长方形物体耷拉在上面,你首先会想到这是什么?N-Gram:将文本分解为连续的 N 个元素,例如“ 我爱自然语言处理 ”,1-Gram为 ["我",“爱”,“自然”,“语言”,“处理” ],2-Gram为["我爱",“爱 自然”,“自然 语言”,“语言 处理”]来计算,区间为 [-1,1]。

2025-06-09 19:48:37 332

原创 API 调用大模型

进行的回答,例:"Hello!可以看到,调用大模型的 API 接口和我们在进行前后端交互时很像( 因为都是调用 API ),但是多了个{ OPENAI_API_KEY }( 上文提到的OAuth2.0协议 ),是为了进行身份验证等操作。这里的 url "https://api.openai.com/v1/chat/completions",表示向 OpenAI 的聊天补全 API 发送请求。OAuth2.0:授权协议,作用:授权第三方程序访问其 API 接口。messages 的内容就是 prompt(

2025-06-08 19:08:52 453

原创 Prompt( AI 提示词 )

从直观看,就是使用 AI 时输入在对话框里的文字其本质是输入给模型的文本或指令,作用:模型根据这个 promt 输出相应的文本。

2025-06-07 20:38:43 209

原创 远程 Github 文件夹出现箭头,并且打不开文件的解决办法

起因:当你在自己的项目里clone了别人的项目,Github就将他视为一个子系统模块,导致在上传代码时该文件夹上传失败,并在github上显示向右的白色箭头。删除子文件夹里面的.git文件( 需要在电脑上蛇者显示所有隐藏文件 )

2025-06-06 15:43:05 172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除