专业编程教程与实战项目分享平台

网站首页 > 技术文章 正文

浅谈ARM的新架构(arm架构重大变革)

ins518 2025-04-06 16:53:00 技术文章 22 ℃ 0 评论

近日ARM发布了新的架构,X3,A715,以及Mali g715,依旧的ARMv9.0,大约等9.1才上gemm与bf16罢

X3,代号Makalu ELP,流水线9,依旧增大rob(320),最高8M L3,前端为6宽解码(X1为5宽)

后端新增两组整数单元,增加到4单+2复(X2则为2单2复)好像这一代都砍Mopcache,虽说分支预测越强,mop cache收益越高。

A715,代号Makalu,流水线9(?)只保留了AArch64的支持,前端5解码(A710 4解码)

而且,相比较上代,单个解码器面积缩小了4倍

其次,支持了更多的L3(A710:4M,A715 6M),

顺道支持了指令融合,挂在指令缓存中,以前只能在mopcache中,现在可以直接到L1i读取指令,说白了就是mopcache部分放到了解码器里。

然后就是传统艺能,arm的ppt造假,说起造假,其实也不算造假,那ipc增益完全是靠高频以及加大缓存所带来的,前端解码面积缩小了3.2倍,等效带宽增加了25%,simd猜测256(猜测2x128)

单论架构图来看,除了fp部分,其参数已经类似于X1的前后端了(除了fp,x14条128bit的fma simd)。。。。那也只是类似罢

这代给了后端图:

A510没必要写,重制版罢了

G715则是依旧基于G77那批的valhall,新增了光追支持(新增RTU),以及VRS(可变着色率)以及保守光栅化。之前第一在移动端支持的只有img bxt。

G715则分为两种,不支持光追(G715)以及支持光追(Immortalis G715)其gpu组可最高16核,还带来了之前G510的AFRC(固定速率压缩)

单元方面,FP32从G710的128增加到256,其余无变化(无数据无法得知)

依旧的(10-16 immortalis G715)(7-9 G715)(1-6 G615)

以及dsu开放到12核,dsu依旧110,笔记本理论最高8+4+0,

并不存在所谓的新的dsu110

顺手更新,写了1个小时。应该是在酷安最后的图文了

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表