
根据 Gimlet Labs 的最新研究成果,AI 已能够自动生成高度优化的 Metal 内核,使 PyTorch 的推理速度提升了87%。这项技术突破不仅显著增强了性能表现,还在测试涵盖的215个 PyTorch 模块上实现了平均1.87倍的加速效果,部分特定工作负载甚至达到了数百倍的速度提升。
研究团队选用了来自 Anthropic、DeepSeek 和 OpenAI 等领先人工智能机构的八个先进模型,利用它们为苹果设备定制高效的 GPU 内核代码。整个过程无需更改用户原有代码,也不依赖新框架的引入,即可在苹果硬件平台上直接实现性能飞跃。
实验平台采用搭载 Apple M4 Max 芯片的 Mac Studio,以 PyTorch 的 eager 模式作为性能基准。测试使用的 KernelBench 数据集包含215个典型 PyTorch 模块,覆盖从
基础的矩阵乘法运算到完整神经网络架构等多种场景。
测试流程包括接收输入参数和原始 PyTorch 代码、自动生成对应的 Metal 内核,并验证其功能正确性。数据表明,随着生成尝试次数增加,AI 输出内核的准确性持续提升。例如,在第五次尝试时,正确实现的比例已达到94%。值得注意的是,尽管部分非专为推理设计的模型也具备生成有效内核的能力,显示出跨任务适应的潜力。
千博企业网站系统全功能个人版Access2011 Build 0903
2010.09.03更新优化前台内核处理代码;优化后台内核、静态生成相关代码,生成速度全面提升;修改前台静态模板中所有已知错误;修正后台相关模块所有已知错误;更换后台编辑器,功能更强大;增加系统说明书。免费下载、免费使用、完全无限制。完全免费拥有:应广大用户要求,千博网络全面超值发布企业网站系统个人版程序包:内含Flash动画源码、Access数据库程序包、SQL数据库程序包。全站模块化操作,静态
0
查看详情
实验结果显示,GPT-5 在某些模块中实现了高达4.65倍的性能提升。更引人注目的是,o3 模型在个别任务中将延迟降低了惊人的9000倍。研究还发现,并非单一模型在所有任务中都表现最优,结合多个模型的优势可进一步提升内核质量与执行效率。
为进一步增强生成效果,研究人员引入了额外上下文信息,如 CUDA 实现代码和 gputrace 提供的性能追踪数据。该策略使平均加速比提升至1.87倍,相较仅使用基础智能体的1.31倍,性能增益提升了约三成。
研究团队特别指出,本项目的核心目标并非追求极致性能上限,而是验证 AI 在自动内核生成方面的可行性,旨在通过智能化手段减轻开发者的底层优化负担。总体来看,这一成果标志着人工智能在硬件级系统优化方向迈出的关键一步。
以上就是AI 生成优化 Metal 内核,PyTorch 推理速度提升 87%的详细内容,更多请关注其它相关文章!
# 美国
# 订酒店网站建设总结
# 阳曲口碑好网站排名优化
# 芜湖营销推广哪家效果好
# 海口小网站推广公司
# 网站推广行业赚钱吗知乎
# 重庆网站seo优化排名公司
# 全网整合营销推广怎么做
# 武汉seo优化行业
# 淘宝网店推广和营销
# 网络推广营销途径
# 安全防护
# 自动生成
# 开源
# 园区
# 程序包
# 人工智能
# 微软
# 帮你
# 的是
# 企业网站
# deepseek
# gpt-5
# 神经网络
# gpt
# apple
# openai
# ai
# mac
# 苹果
# app
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
借力AI!PCB全球巨头,有爆发潜质吗?
构建人机交互创新模式,微美全息研究AIGC智能交互界面生成技术
618京东3C数码趋势产品备受青睐 AR设备成交额同比增长15倍
今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告
下一个前沿:量子机器学习和人工智能的未来
眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
OpenAI首席执行官表态支持欧盟AI监管
微软在 Build 大会上宣布的新 Microsoft Store AI Hub 现已开始推出
基于信息论的校准技术,CML让多模态机器学习更可靠
AI创作广告文案等同2.47年工作经验,且消费者无法区分|AI营销前沿
科技数码圈的新物种 乐天派桌面机器人 AI +安卓+机器人 首发价1799元
刊·见 | 捕捉人工智能领域最新动态?收藏Applied Artificial Intelligence
智能机器人正在彻底改变客户服务
如何成功实施人工智能?
AI室内设计软件流行,室内设计行业如何应对效率变革
利用AI技术更好地发展农村电商
大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战
“技术+实践+生态”三箭齐发,京东方抢占物联网高地
联想戴炜:以全栈AI加速CT与IT融合,共建高质量算力网络
云鲸发布全新的扫拖机器人J4系列
提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用
RoboNeo操作教程
陈根:ChatGPT和人类合作开发机器人
英特尔张宇:边缘计算在整个AI生态系统中扮演重要角色
谷歌内部正在测试代号为Genesis的AI新闻写作产品
国内首款大尺寸仿鸵双足机器人“大圣”亮相,穿戴红色战袍
李开复官宣新公司「零一万物」,进军 AI 2.0
Adobe旗下Illustrator引入生成式AI工具Firefly
“苏南 vs 苏北” AI 分胜负,娱乐性比较工具 EitherChoice 上线
阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型
万魔推出AI主攻的运动耳机,开启十年研发新纪元
ChatGPT只讲这25个笑话!实验上千次有90%重复,网友:幽默是人类最后的尊严
视觉中国宣布推出AI灵感绘图、画面扩展功能
美图影像节演讲实录:191次提及AI,发布7款影像生产力工具
张勇对话多位诺奖得主 人工智能将无处不在
华为4G5G通信物联网收费标准公布,多年研发成果,十年花费近万亿
Intel酷睿Ultra发布会官宣!迈向全新的AI时代
机构:边缘AI或是当前预期差最大的AI方向
360发布认知型通用大模型“360智脑4.0” 全面接入360全家桶
应用生成式人工智能技术改善农业产业
洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!
华为将于 7 月发布面向 AI 大模型的新款存储产品
一文看懂基础模型的定义和工作原理
Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙
曝索尼在开发新头显设备:游戏中使用AR技术
改变城市交通:智慧城市中的智能交通
RoboNeo安装教程
小米发布CyberDog2 - 他们的第二代仿生四足机器人展示
聚焦人工智能大模型、AIGC 徐汇十余场重磅论坛等你来
靠游戏更靠AI 英伟达成唯一首季度两位数增长的公司
2025-09-05
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。