放松吃羊肉-CSDN博客

原创【论文导读】AlphaEvolve：A coding agent for scientific and algorithmic discovery

我们（Google）介绍了 AlphaEvolve，它是一种进化编码 agent ，可大幅提升最先进的 LLM 在高难度任务（如解决开放科学问题或优化计算基础设施的关键部分）上的能力。AlphaEvolve 负责协调 LLM 的自主流水线，其任务是通过直接修改代码来改进算法。AlphaEvolve 采用进化方法，不断接收来自一个或多个评估者的反馈，迭代改进算法，从而可能带来新的科学和实践发现。我们将这种方法应用于一些重要的商业问题，从而证明了它的广泛适用性。

2025-06-10 19:20:06 1072

原创如何理解强化学习大模型微调中RW模型和RL模型的损失函数

大语言模型微调中训练RL模型最常用的优化方法是近端优化算法（Proximal Policy Optimization, PPO）。RL损失函数本质上是在奖励模型打分、人类偏好约束和通用能力三者间平衡，既要输出优质答案，也不能偏离原有分布太远，还要保持通用能力。(3) 生成调优模型（Tuned Language Model, RL Policy）(2) 初始语言模型（Base Language Model)(4) 奖励模型（Reward Model）(4) Sigmoid函数。(2) KL 散度部分。

2025-06-10 12:26:31 1005

原创《Coevolutionary computation and its application》协同演化及其应用中文对照·第一章

本文介绍了演化计算的基本概念及其应用

2025-06-04 23:04:26 932

原创【约束非线性优化】ADMM算法精讲

在本节中，我们将介绍一种用交叉方向乘子法（ADMM）解决带约束的最小化问题的框架。该方法非常通用，可用于解决一大类有约束的最小化问题。

2024-11-02 17:28:48 1886 2

原创【约束非线性优化1】投影梯度下降法

前面章节我们介绍了梯度下降法来解决无约束的非线性优化问题。那么如何解决带优化的非线性优化问题呢？一个直观的想法是：我们依旧先进行梯度下降到一个相对较小的点，然后再将这个点通过某种方式投影到可行域内。xk21xk−ηk∇fxkxk21Ωxk1∈argx∈Ωmin∣∣x−xk21∣∣记”把x投影到ΩPΩxargx′∈Ωmin∣∣x′−x∣∣，对于凸可行域，投影PΩx。

2024-11-02 14:44:43 2144

原创【笔面试常见题：三门问题】用条件概率、全概率和贝叶斯推导

不失一般性，假设我们最初选择1号门，然后主持人打开3号门。A1A_1=A1汽车在1号门后A2A_2=A2汽车在2号门后A3A_3=A3汽车在3号门后B3B_3=B3主持人打开3号门PA1PA2PA313PA1PA2PA331如果汽车在1号门后，那么主持人可以选择打开2号门或3号门。

2024-11-01 21:22:03 1589

原创【SVM手把手推导】对偶问题应用之支持向量机SVM（Hard Margin）

{(siyiyi∈1−1i1⋯m，我们想要找到一个（decision hyperplane），用方程表示为xTsb0，使两个类别的样本尽量分开，如图：SVM的目标就是最大化分类间隔（margin），所以找到 margin 的数学表达式至关重要。

2024-10-30 21:29:55 1425

原创【约束优化】一次搞定拉格朗日，对偶问题，弱对偶定理，Slater条件和KKT条件

对一个约束优化问题：min⁡xf(x)s.t. gi(x)≤0,i=1,⋯ ,mhi(x)=0,i=1,⋯ ,p\min\limits_{\mathbf{x}} f(\mathbf{x})\\\text{s.t. } g_i(\mathbf{x})\leq0,i=1,\cdots,m\\h_i(\mathbf{x})=0,i=1,\cdots,pxminf(x)s.t. gi(x)≤0,i=1,⋯,mhi(x)=0,i=1,⋯,p不等式约束：gi:Rn↦R,i=1,⋯ ,mg_i:\R^n\

2024-10-30 17:37:08 1163

原创【混合模型】一文搞懂混合模型、高斯混合模型（GMM）、EM算法

聚类是将一组对象根据它们的相似性进行分组，使得同一组内的对象相比于其他组的对象更加相似。聚类是一种，即在没有事先给定类别标签的情况下，根据相似性对对象进行分组。这与分类（有监督学习）问题不同，分类是基于已知的类别标签进行分类的。聚类问题分为（hard clustering）和（soft clustering），前者将每个对象明确地进行划分，如K-means算法，而后者每个对象可以以某种概率或权重属于多个簇。

2024-10-27 17:24:20 1989

原创【隐变量（潜在变量）模型】硬核介绍

上一节我们介绍了贝叶斯推断的几种方法，本文介绍了贝叶斯推断的目的以及当无法使用贝叶斯推断时如何推断似然函数的方法。

2024-10-26 16:31:01 2454

原创【贝叶斯推断】方法总结

介绍了贝叶斯估计并总结了贝叶斯推断的各种方法

2024-10-26 14:03:53 826

原创看完让你眼前一黑的【频率学派】和【贝叶斯学派】之争

文章总结了笔者对频率学派观点和贝叶斯学派观点的思考，可能存在过度解读，请多多担待！

2024-09-25 16:16:44 730

原创【退化Degeneracy】线性规划中的退化问题

【定义2.9】：一个向量x∗\pmb{x^*}x∗如果是基本解，则需满足：（a）满足所有等式约束都激活（b）在x∗\pmb{x^*}x∗处激活的约束条件中，有nnn个约束条件是线性独立的【例1】

2024-09-08 14:57:08 1682

原创【单纯形法】看似很难，实则一点也不简单

设。

2024-09-08 12:32:58 1119

原创一文看懂为什么线性规划中标准型与基本型等价

在一个一般的线性规划问题中，我们给出成本向量cc1c2⋯cncc1c2⋯cn和nnn维变量xx1x2⋯xnxx1x2⋯xn，在一系列线性等式和不等式的约束下，要求目标函数c′x∑i1ncixic′x∑i1ncixi的最小（大）值。设M1M2M3M1M2M3是有限下标集，对任意集合中的元素iii，都对应一个nnn。

2024-09-06 15:59:06 1230

原创【HarmonyOS NEXT】踩坑！Scroll中使用relativeContainer无法滚动问题

Scroll作为可滚动的容器类组件，它最多包含一个子组件，Scroll而。

2024-07-26 23:07:38 821

原创【HarmonyOS NEXT】超简单方法实现Text组件展开/收起

笔者在学习时发现网上很多方法实现的Text组件展开/收起效果比较复杂，且涉及到计算，于是查阅了相关文档，尝试通过Text组件自带的属性函数实现需求，以下为解决方案：

2024-07-26 17:57:41 917

原创【HarmonyOS NEXT】HarmonyOS自带的icon图标库如何使用

如何使用HarmonyOS NEXT自带的图标库，并且附上导入外部字体图标ttf的方法

2024-07-26 15:04:51 3764

原创【HarmonyOS Next】如何实时监控Scroll组件水平方向滚动偏移量

运用Scroll组件事件onDidScroll实现实时监控水平方向滚动偏移量，并且提供了onDidScroll正常使用说明

2024-07-25 13:10:41 1230

原创【谁用谁爽系列】word公式编号和引用

这篇文章给大家介绍一个非常好用的word公式编号方法，可以自动编号，且能交叉引用，且操作方便，不需要写代码。注：方法来自一位bilibili up主@我是啸行。

2024-03-24 22:19:18 1025

原创【说人话-论文导读1-1】约束进化优化的随机排序算法Stochastic Ranking for Constrained Evolutionary Optimization（持续更新中）

论文导读：Stochastic Ranking for Constrained Evolutionary Optimization

2024-03-08 17:21:02 1063 1

原创【Vue报错】The target environment doesn‘t support dynamic import() syntax so it‘s not possible to use ex

引入外部js（在线js）时Vue报错：The target environment doesn't support dynamic import() syntax so it's not possible to use external

2022-11-18 03:19:06 4916

原创如何在Vue框架下使用普通html中的js代码

对于很多像笔者一样的新手前端开发者，在编写前端代码的时候，大多是边学边写的状态。在做一些个人的、非商业的项目时，我们也许会经常去到各类前端设计网站获取灵感和素材（e.g. https://codepen.io/）。然而在Vue架构下，素材网站的普通的js代码并不能像html一样简单粘贴，网上相关解决办法也比较少，笔者进行相关探索后总结经验如下。如何在Vue框架下使用普通html中的js代码：举个例子

2022-11-09 17:52:49 2276 2

原创【CS202计算机组成原理】一次性搞懂cache中size, block, index, offset, tag相关计算

SUSTech的朋友，搞懂cache的相关计算，看这一篇就够啦！！

2022-06-11 00:45:11 17726 4

《Coevolutionary Computation and Its Applications》详细介绍了协同演化及其应用，由Xin Yao和Siang Yew Chong合著

内容概要：本书《Coevolutionary Computation and Its Applications》属于自然计算系列，由Xin Yao和Siang Yew Chong合著。书中详细介绍了协同进化计算的基本概念、主要方法及其应用。主要内容包括：竞争与合作协同进化算法的框架及应用，如在商业、经济、公共政策、娱乐游戏、工程、物流、运输、软件系统和服务领域的应用；高维优化问题的求解方法，如基于合作协同进化的并行算法组合优化、大规模优化问题的随机分组和差异分组方法；以及协同进化计算在学习问题中的应用，如非合作博弈中的协同进化学习、性能分析和泛化能力的研究。适合人群：具备一定编程基础和对进化计算有一定了解的研发人员，特别是对协同进化计算感兴趣的学者和工程师。使用场景及目标：①理解协同进化算法的核心原理和应用场景；②掌握解决复杂优化问题的方法，如大规模优化、高维优化和多模态数据流映射；③研究协同进化在学习问题中的应用，如博弈论、泛化性能分析等。其他说明：本书不仅提供了理论基础，还通过大量实际案例和计算研究展示了协同进化计算的实际应用效果。建议读者在学习过程中结合实例进行实践操作，并深入理解算法的设计思想和实现细节。此外，本书涵盖了最新的研究成果和前沿技术，为未来的研究提供了宝贵的参考资料。

2025-06-04

【Free to Download】Introduction to Linear Optimization.pdf

CSND上的人都疯了吗，明明这97年的经典教材在外网免费下载的，却在这里收费下载，还是高糊的影印本，这里放一个原版高清下载途径。《Introduction to Linear Optimization》是一本由Dimitris Bertsimas和John N. Tsitsiklis合著的经典教材，专门讨论线性优化理论和方法。该书介绍了线性优化问题的基本概念、理论基础和解决方法，适用于学习运筹学、管理科学、工业工程等领域的学生和从业者。该书内容涵盖了线性规划、对偶理论、线性规划的几何解释、网络流问题、整数规划、近似算法等主题。通过清晰的讲解和实例，读者可以深入了解线性优化在实际问题中的应用和解决方法。总的来说，《Introduction to Linear Optimization》是一本权威且易于理解的线性优化教材，适合希望学习和应用优化理论的学生和专业人士阅读。

2024-09-04

如何用Java Swing实现“电子宠物大作战”中的文字对战动态

2021-05-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人