写点什么

一念 LLM 分布式推理优化实践

  • 2025-08-01
    北京
  • 本文字数:842 字

    阅读完需:约 3 分钟

大小:471.49K时长:02:40
一念 LLM 分布式推理优化实践

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


腾讯公司专家工程师袁镱已确认出席并发表题为一念 LLM 分布式推理优化实践的主题分享,介绍基于大模型推理基本原理,结合 MoE 类模型特性,一念 LLM 设计了一套高效分布式推理优化方案。围绕流水线并行、显存管理、以及 DP/TP/PP 混合并行策略,实现了对推理过程的深度调优。在 DeepSeek 推理测试中,相较于业界主流开源推理框架,整体吞吐性能提升达 48%。



袁镱是腾讯 PCG 机器学习平台技术负责人,负责无量系统和一念 LLM 等机器学习训练和推理框架研发。他在本次会议的详细演讲内容如下:


演讲提纲:

1、大模型推理的挑战

  • 大模型推理的基本逻辑

  • 各个推理加速框架的设计思路对比

2、大模型分布式推理的主要优化技术

  • DP/EP 等并行技术与 MoE 模型的特点

3、一念 LLM 的设计与优化

  • 一念 LLM 的设计思路和主要优化方向

  • 一念 LLM 针对 DeepSeek 特点进行的性能优化

听众收益:

  • 了解大模型推理的基本逻辑以及各个推理加速框架的设计思路对比

  • 了解一念 LLM 的设计思路,以及针对 DeepSeek 特点进行的性能优化


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


大会 9 折优惠倒计时最后 1 天,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-08-01 13:007087

评论

发布
暂无评论

基于公共信箱的全量消息实现

百度Geek说

大数据 即时通讯 企业号 4 月 PK 榜 公共信箱

阿里十年资深码农共享SpringCloud微服务架构实战文档

Java你猿哥

微服务架构 Spring Cloud ssm 架构设计 架构师

ShareSDK Google平台注册指南

MobTech袤博科技

Rust-Shyper:基于 Rust 语言的高可靠、开源嵌入式 Hypervisor

openEuler

Linux rust 操作系统 虚拟机 嵌入式

python游戏开发-pgzero

AIWeker

Python python小知识 三周年连更

戴尔科技园动力计划,携手中南高科赋能中小企业数字化转型

科技热闻

分布式计算技术(上):经典计算框架MapReduce、Spark 解析

星环科技

分布式计算

代码重构:面向单元测试

阿里技术

anyRTC快对讲融合通信指挥调度平台

anyRTC开发者

音视频 融合通信 快对讲 视频监控 综合调度

竞争焦点转向数智底座 用友能否再引领

用友BIP

用友iuap 用友技术大会 升级企业数智化底座

Github星标120k!这份阿里独有的高并发实战笔记太强了!

Java redis zookeeper Netty 高并发

iSulad+Kuasar:管理面资源消耗锐减 99%的新一代统一容器运行时解决方案

openEuler

Linux 容器 云原生 操作系统 Kubernetes Serverless

iOS MachineLearning 系列(6)—— 视频中的物体轨迹分析

珲少

神了!阿里P8级数据库专家手写出了这份438页数据库高效优化手册

Java 数据库 sql 性能优化

从入门到精通,超详细的程序员Java学习路线指南

Java你猿哥

Java 数据库 Web ssm 死磕 Java 基础

分布式计算技术(下):Impala、Apache Flink、星环Slipstream

星环科技

分布式计算 Slipstream

自动化回归测试平台 AREX 0.2.8 版本正式发布!

AREX 中文社区

自动化测试 接口测试 回归测试

AppleParty(苹果派)v3 支持 App Store 新定价机制 - 批量配置自定价格和销售范围

37手游iOS技术运营团队

In App Purchase AppleParty App Store Connect API 批量创建内购IAP app store

阿里RocketMQ创始人首次分享出这份RocketMQ技术内幕神级架构手册

Java RocketMQ 消息队列 消息中间件

SysCare:为您的操作系统保驾护航

openEuler

Linux 操作系统 openEuler 内核 热补丁

数栈V6.0全新产品矩阵发布,数据底座 EasyMR 焕新升级

袋鼠云数栈

大数据 基础软件 数字化转型

权威学者、企业CFO荟聚上海国家会计学院,共探「智能会计 价值财务」

用友BIP

智能会计 价值财务 用友智能财务 业财融合

度量分析开源社区健康度,助力企业开源生态健康发展——华为开源管理中心王晔晖

开源雨林

开源治理 OSPO OSS Compass CHAOSS

分布式场景下,Apache YARN、Google Kubernetes 如何解决资源管理问题?

星环科技

资源管理 Apache YARN

星环科技自研技术,加速大数据从持久化、统一化、资产化、业务化到生态化

星环科技

大数据

分析型数据库:MPP 数据库的概念、技术架构与未来发展方向

星环科技

MPP数据库

这一秒,困扰了程序员 50 年!

Java你猿哥

Java 程序员 ssm 计算机

面试官:HashMap线程不安全体现在哪里?

宝塔人机识别验证:如何确保人脸识别的安全性?

百度开发者中心

人脸识别 人工智能’

在高校内投放共享电单车有什么优势

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电单车投放 校内共享电单车 共享电单车优势

一念 LLM 分布式推理优化实践_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章