- 博客(24)
- 收藏
- 关注
原创 直观解释 Transformer 原理
看:借助 Query、Key、Value 向量( 由 Token 的向量表示,乘上W_Q,W_K,W_V 矩阵得到 ),用某个 Token 的 Q 和其他 Token 的 K 向量进行乘积( 表示了他们之间的关联程度 ),经过 SoftMax 变成概率后,对 V 按概率加权相加,得到更新后的某个 Token 的新的向量表示。是:找谁跟谁有关,例如:输入喜欢唱跳打篮球的帅哥,经过 Self-Attension ,帅哥这个名词就会”学习“到喜欢唱跳打篮球是和它有关系。本质:也是更新 Token 的向量表示。
2025-08-04 20:37:04
197
原创 从零到一:LeetCode Hot 100( 少走弯路版 )
本文目标是总结并 good at 哈希、二分查找、滑动窗口等 pattern ,这样就可以在做题中将其当作工具去使用。本文解题代码选择的是 python,因为 python 的语法简单,可以将注意力集中在解题思路上,而不是编程语言的语法。
2025-07-01 09:38:42
254
原创 六个月掌握第二门语言-英语
英语对程序员很重要,因为前沿技术等都使用的是英文,Kapathy 在他的 X 上的置顶帖子是这样说的:The hottest programming language is English,这篇文章总结了一个关于如何学习外语的视频,这里我将它带入成英语,感兴趣的可以去搜索《六个月内学会一门外语》
2025-06-27 15:18:20
1003
原创 Stable diffusion 本地部署
注意:如果是最新的 5060 显卡,CUDA 是 12.9 版本,会和项目虚拟环境中的 pytorch 不兼容,需要降低 CUDA版本,并卸载原来的 pytorch 然后安装相匹配的 pytorch 版本。
2025-06-20 23:02:01
1649
原创 AI 时代,如何与时俱进?
AI技术正经历从传统编程向大语言模型(LLM)驱动的转变。国外AI发展聚焦技术前沿与应用创新,国内则更关注政策导向。当前LLM如同"操作系统",通过API提供服务,但训练成本高昂。典型应用如Cursor编辑器整合多模型,实现代码自动补全和上下文采集。尽管AI能快速生成内容,仍需人工校验,优化方向包括加速验证过程和控制输出质量。未来趋势是AI与人类深度协同,发展各类专业Agent(如智能客服)完成特定任务,最终实现"人机合体"的智能增强模式。
2025-06-19 23:25:42
191
原创 LeetCode Hot 100 -- 回溯法
回溯法是一种系统搜索所有可能解的算法策略,通过逐步构建候选解并在不满足条件时回退,常用于解决排列、组合等问题。其核心模板包括递归调用和状态回退两个关键步骤。示例展示了全排列和子集问题的解法:全排列通过标记已用元素避免重复,子集则通过控制搜索起点避免重复子集。代码结构遵循"处理-递归-回退"的模式,典型应用还包括电话号码的字母组合等组合类问题。该算法能有效探索解空间,但需注意剪枝优化以避免无效搜索。
2025-06-16 22:47:11
149
原创 RAG 技术与应用
Retrival-Augmented Generation 检索数据增强:基本思想是通过检索相关信息,将这些信息作为上下文输入到模型中,从而提高结果的时效性和准确性。解决知识时效问题减少模型幻觉提升专业领域回答质量Cursor 中就用到了 RAG,将我们的代码作为上下文输入到模型中应用:NotebookLM( 需要魔法 )、imacopilot。
2025-06-11 18:17:26
649
原创 Embedding 和向量数据库
可以理解为特征表达( 将特征( 如果是文本的话就是分词后的数据 )用向量表示,而后在这个向量空间中,相似特征的向量在空间上是接近的 ),将高维稀疏矩阵映射到低维稠密向量空间的过程( 高维到低维的过程会学习特征的内在特征和语义信息,结果是让向量不再仅仅表达一个特征,更重要的是让相似特征的向量在向量空间中接近,关联度高 ),作用:降维,方便计算关联度 cos (Embedding 的是实现方法:Word2Vec,原理是将一个特征( 向量 )和一个字典矩阵( 包含许多信息的矩阵 )相乘,学习到信息。
2025-06-10 19:57:11
189
原创 通俗解读 AI 领域中的向量
,AI 就会把和 prompt 关联度高的给输出,得到的结果就是我们看到的它的回答。( 我们人也是一样,会对不认识的东西进行关联度比较,进而得到想知道的答案,例如:你在你室友的衣架上看到上面挂了一个五颜六色的长方形物体耷拉在上面,你首先会想到这是什么?N-Gram:将文本分解为连续的 N 个元素,例如“ 我爱自然语言处理 ”,1-Gram为 ["我",“爱”,“自然”,“语言”,“处理” ],2-Gram为["我爱",“爱 自然”,“自然 语言”,“语言 处理”]来计算,区间为 [-1,1]。
2025-06-09 19:48:37
332
原创 API 调用大模型
进行的回答,例:"Hello!可以看到,调用大模型的 API 接口和我们在进行前后端交互时很像( 因为都是调用 API ),但是多了个{ OPENAI_API_KEY }( 上文提到的OAuth2.0协议 ),是为了进行身份验证等操作。这里的 url "https://api.openai.com/v1/chat/completions",表示向 OpenAI 的聊天补全 API 发送请求。OAuth2.0:授权协议,作用:授权第三方程序访问其 API 接口。messages 的内容就是 prompt(
2025-06-08 19:08:52
453
原创 Prompt( AI 提示词 )
从直观看,就是使用 AI 时输入在对话框里的文字其本质是输入给模型的文本或指令,作用:模型根据这个 promt 输出相应的文本。
2025-06-07 20:38:43
209
原创 远程 Github 文件夹出现箭头,并且打不开文件的解决办法
起因:当你在自己的项目里clone了别人的项目,Github就将他视为一个子系统模块,导致在上传代码时该文件夹上传失败,并在github上显示向右的白色箭头。删除子文件夹里面的.git文件( 需要在电脑上蛇者显示所有隐藏文件 )
2025-06-06 15:43:05
172
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人