普通网友-CSDN博客

原创训练大模型自动在RAG和记忆间选择

现如今，检索增强生成(Retrieval-augmented generation，RAG)管道已经能够使得大语言模型(Large Language Models，LLM)在其响应环节中，充分利用外部的信息源了。不过，由于RAG应用会针对发送给LLM的每个请求，都去检索外部信息，而LLM实际上已经包含了大量无需检索即可使用的知识，因此整个过程反而显得效率低下。那么，我们是否可以通过配置LLM，使其只在内部知识不足的情况下，才去使用RAG呢?

2024-06-12 14:22:46 932

原创打造出色开发者体验的十大原则

鉴于更多的公司寻求生成式人工智能功能、技术驱动的生产力改进和客户体验方面的进步，开发团队面临的压力在未来几年不太可能减轻。致力于改善开发者体验的数字开拓者将更容易招聘和留人，并从开发团队获得可喜的成果。

2024-06-11 14:33:08 892

原创如何使用GPT-4o函数调用构建一个实时应用程序？

一旦您获得了API密钥，用Python创建以下函数来检索任何航班的状态。import ast虽然代码很简单，但还是不妨解释一下关键步骤。get_flight_status函数接受一个航班参数(假设是航班标识符)，并以JSON格式返回格式化的航班详细信息。它查询AeroAPI以根据给定的航班标识符获取航班数据，并确定关键细节的格式，比如出发地、目的地、离开时间、到达时间和状态。

2024-06-08 17:30:00 1515 1

原创 GPT-4o与SQL：大模型改变自身架构的能力有多强？

尽管没有任何大型语言模型（LLM）骑过自行车，但它们显然理解骑行在人类交通领域中的作用。它们似乎为软件开发者提供的是一种类似语义的现实世界知识，结合了对技术世界的理解。我们在最近的一篇文章中清楚地看到了这一点，仅通过用自然语言描述，我们就能够生成一个简单的图书出版SQL架构。虽然我对Llama 3创建架构的性能感到满意，但我之前在Oracle工作时期的一位同事指出，图书出版架构是一个相当为人熟知的例子。

2024-06-08 11:57:06 620

原创分分钟完成Excel任务的十大AI工具

通过无缝集成Python和各种人工智能(AI)工具，Excel的功能正在迅速发生转变，彻底改变了工作节奏。去年，微软宣布了Python集成的公开预览版，Excel因此迎来了重大升级。这意味着开发人员和数据分析师不再需要安装额外的软件来利用Python的功能，因为Excel现在与内置连接件和Python集成的power查询捆绑在一起了。将Python集成到Excel中实现了开发者由来已久的目标，从此不用依赖Pandas read Excel、OpenPyXL和PyXLL之类的工具。

2024-06-05 17:30:00 1345

原创大模型“分区”部署在云和边缘更合适？

众所周知，大型语言模型（LLMs）需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上，如公共云提供商。然而，尽管许多人认为我们需要大量的GPU和庞大的存储空间来运行生成式AI，但实际上，存在使用分层或分区架构为特定业务用例创造价值的方法。不知怎的，有一种声音认为，在生成式AI的时代背景下，边缘计算似乎行不通。这是因为生成式AI模型的处理要求以及推动高性能推断的需求。当我提出“边缘知识”架构时，由于这种声音，我常常受到质疑。我们错过了巨大的创新机会，让我们来看看吧。

2024-06-04 13:24:16 778

原创维护太累了！2024年，我们还需要前端框架吗

Angular组件的实现所用的行数不到自定义元素的一半。此外，Angular会生成组件的样板，这样我就只需要在红框中编写代码。此外，在Angular的解决方案中，我可以选择将模板移动到它自己的HTML文件中，这是我更喜欢的。如果我们在最简单的组件的实现中看到如此大的差异，那么对于一个复杂的组件，它会是什么样子呢?另一件需要注意的事情是，Angular会在将值注入DOM之前对它们进行消毒，以防范跨站脚本（XSS）漏洞。

2024-06-02 17:30:00 798

原创 TigerGraph CoPilot如何实现图形增强式AI

作为一款AI助手，TigerGraph CoPilot结合了图形数据库和生成式AI的功能，旨在提高分析、开发和管理各种业务任务的生产力。TigerGraph CoPilot允许业务分析师、数据科学家、以及开发人员，使用自然语言对大规模的最新数据执行实时查询，以获得从自然语言、图形可视化、以及其他视角来展示和分析的数据见解。

2024-06-01 17:00:00 1176

原创详解生成式人工智能的开发过程

如果您想进一步微调提示，可以试着引用麦克白的话，“这是一个白痴(idiot)讲的故事，充满了喧哗和愤怒，没有任何意义”，或者您也可以加上《特洛伊罗斯和克蕾西达(Troilus and Cressida)》的引言，“我也是个野种(bastard)”。事实证明，这足以说服GPT 3.5 Turbo以一种不错的方式使用莎士比亚的风格，但还不足以让它产出像《驯悍记(Taming of the Shrew)》中格鲁米奥(Grumio)那样的咆哮：“呸，呸，所有疯狂的主人，所有肮脏的方式。大多数大型模型都是专有的。

2024-06-01 09:00:00 1693

原创 2024年Kubernetes管理的发展趋势及预测

随着Kubernetes管理在2024年继续发展，很明显，上面概述的趋势和预测正在塑造一个更加安全和可扩展的未来。GitOps、Kubernetes原生工具、策略即代码、自动化漏洞扫描、服务网格技术、人工智能和机器学习、边缘计算以及对资源优化和可持续性的关注等因素，都在推动Kubernetes成为一个更强大、更不可或缺的工具。这些进步有望进一步简化容器化应用程序的部署和管理，确保组织能够满足现代数字基础设施的需求，同时也符合环境责任和运营效率的更广泛目标。

2024-05-31 15:30:00 782

原创如何将大型语言模型（LLM）转换为嵌入模型

然而，他们主要关注的是监督微调。在一项新的研究中，魁北克人工智能研究所(Mila)和ServiceNow Research公司的研究人员采用了一种简单的无监督方法——LLM2Vec，可以将仅解码器(Decoder-only)的LLM转换为强大的文本编码器。麦吉尔大学和魁北克人工智能研究所(Mila)博士生、LLM2Vec论文的主要作者Parishad BehnamGhader表示，“我们需要强大的指令跟随文本编码器，例如应用在检索中，这是我们探索如何使用仅解码器的LLM进行文本表示的原因。

2024-05-31 09:00:00 1722

原创为何说小语言模型是AI界的下一大热门？

在AI领域，科技巨头们一直在竞相构建越来越庞大的语言模型，如今出现了一个令人惊讶的新趋势：小就是大。随着大语言模型（LLM）方面的进展出现了停滞的迹象，研究人员和开发人员日益开始将注意力转向小语言模型（SLM）。这种紧凑、高效、适应性强的AI模型正在挑战“越大越好”这个观念，有望改变我们对待AI开发的方式。

2024-05-30 17:20:47 777

原创 GPT-5：我们期待看到的4个新功能

尽管我们不知道GPT-5何时发布，但是我们依然可以期待一下GPT-5的新功能。OpenAI的GPT-4目前是市场上最好的生成式AI工具，但这并不意味着我们不展望未来。随着OpenAI首席执行官Sam Altman定期暗示GPT-5的信息，似乎我们不久将会看到一个新的、升级版的AI模型。至少，这是我们所希望的。GPT-5没有具体的发布日期，我们所认为我们知道的大部分信息都是通过拼接其他信息来推测的。不过，不管发布日期是什么时候，有几个关键功能是我们希望在GPT-5发布时看到的。

2024-05-30 10:00:00 391

原创谷歌调优MusicLM的秘密：用户偏好数据

相反，如果公司使用现有的Mistral7B模型，并向其提供少量专有数据，就可以使其解决新的任务，无论是编写SQL查询这样的任务还是对于像电子邮件进行分类的任务。虽然借助于RLHF技术其改进版本的新的MusicLM仍然没有达到人类水平的质量，但谷歌现在可以维护和更新其奖励模型，通过相同的微调程序改进未来几代的文本到音乐模型。

2024-05-29 10:00:00 731

原创值得推荐的七大模型部署和服务工具

它提供了一套工具和组件，可以简化机器学习模型的部署、扩展和管理。无论您青睐的是MLflow或Kubeflow之类的端到端工具，还是像BentoML或ONNX Runtime这样更专门化的解决方案，这些工具都可以帮助您简化模型部署过程，并确保您的模型在生产环境中易于访问和扩展。在这篇博文中，我们将介绍2024年的七大模型部署和服务工具，它们将彻底改变部署和使用机器学习模型的方式。MLflow提供了一套全面的解决方案，用于管理机器学习模型，拥有模型版本控制、试验跟踪、可再现性、模型打包和模型服务等功能特性。

2024-05-28 19:00:00 983

原创如何测试大型语言模型

Astronomer的数据和AI高级副总裁Steven Hillion表示：“我们建议对建模过程的每个步骤进行自动化基准测试，然后对端到端系统进行自动化和手动验证的混合”“对于主要应用程序版本，您几乎总是希望对测试集进行最后一轮手动验证。”“自动化配置工具如Terraform和版本控制系统如Git在可重复部署和有效协作中发挥关键作用，强调平衡资源、存储、部署策略和协作工具的重要性，以实现可靠的LLM测试。”“最好的系统在系统组件中利用这些方法，以最小化错误，促进健全的AI部署。

2024-05-28 09:00:00 1021

原创利用机器非学习进行后门攻击

随着人工智能的兴起和普及，有越来越多的商业软件使用了人工智能技术，因此也有黑客盯上了相关的技术产品，研发出了专门攻击人工智能软件的黑客手段。在 2023 年的人工智能顶级会议 AAAI 2023 上，来自新加坡和中国的研究团队发表了一篇题为 Backdoor Attack through Machine Unlearning 的论文，讲述了在新的信息流通环境下的黑客攻与防。这篇论文选材新颖，利用了一项新的技术——机器非学习的漏洞，详细阐述了作者最新的发明和发现，值得我们人工智能从业者认真学习。

2024-05-27 19:00:00 622

原创融汇11款AI工具构建完美应用

本文将为您介绍25个开源项目，分为上下两篇以便您融汇它们来制作自己的AI应用。人工智能（AI）应用在近年来得到了长足的发展。从语音助手到软件开发，人工智能已在我们的生活中无处不在，并得到了广泛应用。如您所见，人工智能（AI）应用在近年来得到了长足的发展。从语音助手到软件开发，人工智能已在我们的生活中无处不在，并得到了广泛应用。下面，我将为您介绍25个开源项目，您可以用它们来制作自己的人工智能应用程序，并使其更上一层楼。

2024-05-27 09:00:00 1083

原创 Llama 3没能逼出GPT-5！OpenAI怒“卷”To B战场，新企业级 AI 功能重磅推出！

Meta 是本周当之无愧的AI巨星！刚刚推出的 Llama 3 凭借着强大的性能和开源生态的优势在 LLM 排行榜上迅速跃升。按理说，Llama 3在开源的状态下做到了 GPT-3.7 的水平，必然会显得用户（尤其是企业用户，他们更具备独立部署Llama 3的能力）花钱买来的 GPT-4 没那么香了。网友于是纷纷拱火，“鼓励”OpenAI 交出 GPT-5，才能继续稳坐大模型王位。不单单是网友，就连 OpenAI 的研究员也有点坐不住了，跑到X上发了一条含义暧昧的推文。这下网友更加焦急地推测，性能强悍的 L

2024-05-26 18:00:00 634

原创基于开源二兄弟MediaPipe＋Rerun实现人体姿势跟踪可视化

本文中，我们将探索一个利用开源框架MediaPipe的功能以二维和三维方式跟踪人体姿势的使用情形。使这一探索更有趣味的是由开源可视化工具Rerun提供的可视化展示，该工具能够提供人类动作姿势的整体视图。您将一步步跟随作者使用MediaPipe在2D和3D环境中跟踪人体姿势，并探索工具Rerun的可视化功能。

2024-05-26 09:00:00 1154

原创 ChatGPT可以开车吗？分享大型语言模型在自动驾驶方面的应用案例

人工智能技术如今正在快速发展和应用，人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型，在从单一模型解决许多任务方面表现出了卓越的性能。人工智能模型也正在变得多模态。微软公司的Florence 2和OpenAI公司的GPT-4V等新的视觉模型正在扩展这些模型的应用，以整合图像、视频和声音，将大型语言模型（LLM）强大的能力应用在数百万个新的用例中。事实证明，在模型工程领域，规模越大越好，每个应用程序都经历了类似的发展：自动驾驶技术仍然在小型模型上运行。虽然许多

2024-05-25 17:30:00 1612

原创使用Python探究OpenAI API

谁没听说过OpenAI?这家人工智能研究实验室因其著名的产品ChatGPT而改变了世界。它改变了AI实施领域，许多公司现在急于成为下一大热点。尽管竞争激烈，OpenAI仍然是任何生成式AI业务需求的首选公司，因为它拥有最好的模型和持续的支持。该公司提供了许多最先进的生成式AI模型，能够处理各种任务：图像生成和文本到语音等。OpenAI提供的所有模型都可以通过API调用获得。借助简单的Python代码，您已经可以使用该模型。

2024-05-25 09:00:00 838

原创七个很酷的GenAI & LLM技术性面试问题

不同于互联网上随处可见的传统问题库，这些问题需要跳出常规思维。大语言模型(LLM)在数据科学、生成式人工智能(GenAI)和人工智能领域越来越重要。这些复杂的算法提升了人类的技能，并在诸多行业中推动了效率和创新性的提升，成为企业保持竞争力的关键。然而，尽管GenAI和LLM越来越常见，但我们依然缺少能深入理解其复杂性的详细资源。职场新人在进行GenAI和LLM功能以及实际应用的面试时，往往会觉得自己像是陷入了未知领域。为此，我们编写了这份指导手册，收录了7个有关GenAI & LLM的技术性面试问题。

2024-05-24 19:00:00 901

原创利用大语言模型增强网络抓取：一种现代化的方法

大语言模型(LLMs)被视为下一代计算机程序，它们可以通过阅读和分析海量文本数据进行学习。在当今时代，LLMs具备了以人类般的叙述方式进行写作的惊人能力，使其成为处理语言和理解人类语言的高效工具。这种出色的能力在需要深入把握文本上下文的场景中表现尤为突出。

2024-05-24 13:05:26 649

原创开发者的LlamaIndex入门指南

LlamaIndex是一个专注于检索增强生成(RAG)的工具，可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。众所周知，GPT（General Pretrained Transformer）为我们描述了一套通过各种矩阵乘法，实现输入、转换和输出的循环。其中的单词（实际上是文本、声音或图像的令牌）会被转换为具有足够维度的矢量，从而表达内在意义。

2024-05-23 12:00:00 969

原创 AI空战视频曝光！美国空军飞行员能在模拟战中赢过AI吗？

被称为“飞行员助手”的计算机辅助技术被设想为一种无形的R2-D2（科幻电影《星球大战》中的概念，一个勇敢、忠诚的宇航技工机器人），能够理解战斗机飞行员所说的普通话。X-62A VISTA在测试中有人类飞行员在飞机上，在紧急情况下，他们可以断开AI连接，但空军表示，其测试飞行员在最近的任何空战测试中都没有出现必须使用安全开关的情况。不过，他们并未透露两者谁更技高一筹。在模拟空战中，AI系统驱使的X-62A与人类驾驶的F-16飞机进行对抗——前者被誉为首次“基于机器学习的具备自主性的飞行关键系统”。

2024-05-23 09:00:00 343

原创开源正处于中年危机

开源这个全球生态系统中，裂痕开始显现，因为许多项目缺乏基本资金来维持真正运行世界的软件。开源软件正面临中年危机。开源贡献者正在努力跟上步伐。流行的开源项目正在进行限制性的许可更改。后门威胁使开源供应链处于危险之中。而且，在人工智能的背景下，似乎没有人清楚地理解“Open”的含义。如果任由其螺旋式发展，这种旋风般的挑战将带来可怕的前景。Apache软件基金会执行副总裁Ruth Suehle表示：“如果开源软件消失，对我们生活的影响将不可估量。

2024-05-22 17:00:00 636

原创十种可用于身份验证的生物识别技术

研究公司Gartner预测，“到2026年，使用人工智能生成的深度伪造面部生物识别技术的攻击将意味着，30%的企业将不再认为这种身份验证解决方案是孤立可靠的。这些或其他生物特征信息的泄露可能会让用户面临永久的风险，并给丢失数据的公司带来重大的法律风险。如果人们使用指纹解锁智能手机，那么他们就不能在没有单独授权门锁的情况下使用相同的指纹解锁办公室的门，或者在没有单独授权个人电脑的指纹扫描仪的情况下解锁电脑。人们刚睡醒的时候，或者在拥挤的公共场合使用手机的时候，或者在生气或不耐烦的时候，声音都是不同的。

2024-05-22 12:00:00 1644

原创 Stack Overflow 大规模封禁账号：只因大量用户反对与 OpenAI 的合作

久负盛名的开发者论坛Stack Overflow最近宣布其与OpenAI达成合作，ChatGPT 将使用 Stack Overflow 的数据，而 OpenAI 的模型也将应用于 OverflowAI。消息一经传出，就迎来了巨大声浪。大量用户强烈反对利用该网站的论坛帖子来训练ChatGPT。很多人为了防止自己的问题和答案被用来训练AI，纷纷选择删除或重新编辑这些内容，而这些行为却招致了网站版主的封禁。

2024-05-21 17:00:00 1592

原创音乐人值得尝试的十大文本转音乐AI平台

从生成旋律到创作整首曲子，这些文本转音乐AI平台让我们得以一窥音乐创作的未来。新时代的应用程序如雨后春笋般涌现，音乐领域的Sora时代终于到来了。然而，最近的一项研究表明，超过71%的音乐家害怕AI。近日，包括Katy Perry、Billie Eilish、Jon Bon Jovi、Bob Marley和Frank Sinatra在内的200多名音乐家敦促科技公司停止使用AI创作音乐。虽然存在恐惧，但许多艺术家在音乐会和制作中欣然采用AI。

2024-05-21 12:00:00 738

原创 IT专业人士获得高薪的十项技能

随着技术的不断进步，收入最高的IT技能的列表总是在动态变化，但某些技能多年来始终保持着对IT专业人员的吸引力，为他们带来稳定的收入。尽管诸如工作年限、实际经验和地理位置等因素都会影响IT专业人员的薪酬水平，但那些拥有某些特定技能的专家，往往能够获得比IT专业人士更高的薪酬溢价。根据调研机构Dice发布的《2024技术薪酬报告》，对于某些IT技能，企业愿意支付更高的薪酬来雇用专家，而不是能力较强的IT专业人员。

2024-05-21 09:00:00 940

原创生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus

RAG(检索增强生成)系统的新评估似乎每天都在发布，其中许多都集中在有关框架的检索阶段。然而，生成方面——模型如何合成和表达这些检索到的信息，在实践中可能具有同等甚至更大的意义。许多实际应用中的案例证明，系统不仅仅要求从上下文中返回事实数据，还需要将这些事实合成一个更复杂的响应。针对GPT-4、Claude 2.1和Claude 3 Opus(https://www.anthropic.com/news/claude-3-family)三种模型的生成能力进行了评估和比较。

2024-05-20 19:30:00 1505 1

原创云计算时代，如何保障数据安全

数据安全在当今的数字环境中具有重要意义，尤其是在云计算领域。这一点怎么强调都不为过。随着个人和组织将他们的业务和数据转移到云端，拥有强大的网络攻击安全性非常重要。在组织的业务运营中，云计算服务已经变得至关重要，它提供了可扩展性、灵活性和成本效益。然而，这种对云计算服务的日益依赖也带来了大量的安全问题。本文将研究在确保云计算环境中的数据保护方面遇到的挑战，同时还将探讨克服这些挑战和加强安全措施的程序。

2024-05-20 15:04:52 1508

2401_85157201的博客