随着时间的推移,上代主机PS360成为现今移动端芯片的比较对手也是迟早的事情,所以有必要回顾一下上代主机的处理器。当然性能还要受到各方各面的影响,内存,显存,总线,存储等等,但这里主要讨论CPU和GPU。

CPU:Cell Broadband Engine
GPU:RSX
Cell Broadband Engine:
包含8个核心,1 x PPE + 7 x SPE,其中一个SPE被Hypervisor保留占用
主CPU核心,PPE
——基于64位PowerPC
——频率3.2GHz
——双线程Dual threaded
——双发射Dual issue
——顺序执行In-order execution
——VMX SIMD
——32KB+32KB L1 cache,512KB L2 cache

协处理单元,SPE
——128bit,4-way SIMD
——频率3.2GHz
——双发射Dual issue
——顺序执行
——128 矢量寄存器
——256KB Local Store(cache)
——25.6GFLOPS/SPE

PPE用于运行操作系统和顶层操作,SPE则专注于提升游戏处理的性能
SPE对于PS3的图形性能有巨大作用,因此在对比PS3图形性能的时候不能单纯看GPU性能,还要结合SPE的性能。
简单介绍一下
SPE不是简单的CPU协处理器,Cell BE的SPE可以独立工作,有完整的指令流水线。
在进行图形运算的时候,SPE会遵循一条geometry processing流水线。比如,解压顶点数据和三角形索引数据,转换成浮点格式用于SPE运算。然后在SPE上进行blend shape,skining,LOD,culling,然后压缩,交给GPU渲染输出。以及PS3的大部分后处理效果都是由SPE和GPU结合完成的。
说到底其实就类似于现在GPU的GPGPU操作。
RSX:
——基于G70
——频率550MHz
——8 x Vertex Shader,24 x Pixel Shader
——24 x TMU,8 x ROP
——128bit显存位宽
——FlexIO总线接口

大体上可以参考7800,就不做太多介绍了。还有一点和G70不同之处在于,RSX主内存和显存都可以访问。
浮点性能:(8 x 4 + 24 x 2 x 4)x 2 x 0.55 = 246GFLOPS
单论浮点性能,显然必须算上SPE的加成。SPE浮点性能理论最高值为25.6GFLOPS/SPE @3.2GHz x 6 = 153GFLOPS,当然实际受到各方各面的影响不会达到这个值,并且并不是所有都用在图形上。实际应用能达到这个数值一半就不错了。
功耗方面
最新版本的PS3 CECH-4x00,GPU已经升级到28nm制程,CPU则还不确定,可能从45nn升级到22nm。
功耗比较

CPU+GPU的合计功耗已经降低到35w(推测值)

CPU:Cell Broadband Engine
GPU:RSX
Cell Broadband Engine:
包含8个核心,1 x PPE + 7 x SPE,其中一个SPE被Hypervisor保留占用
主CPU核心,PPE
——基于64位PowerPC
——频率3.2GHz
——双线程Dual threaded
——双发射Dual issue
——顺序执行In-order execution
——VMX SIMD
——32KB+32KB L1 cache,512KB L2 cache

协处理单元,SPE
——128bit,4-way SIMD
——频率3.2GHz
——双发射Dual issue
——顺序执行
——128 矢量寄存器
——256KB Local Store(cache)
——25.6GFLOPS/SPE

PPE用于运行操作系统和顶层操作,SPE则专注于提升游戏处理的性能
SPE对于PS3的图形性能有巨大作用,因此在对比PS3图形性能的时候不能单纯看GPU性能,还要结合SPE的性能。
简单介绍一下
SPE不是简单的CPU协处理器,Cell BE的SPE可以独立工作,有完整的指令流水线。
在进行图形运算的时候,SPE会遵循一条geometry processing流水线。比如,解压顶点数据和三角形索引数据,转换成浮点格式用于SPE运算。然后在SPE上进行blend shape,skining,LOD,culling,然后压缩,交给GPU渲染输出。以及PS3的大部分后处理效果都是由SPE和GPU结合完成的。
说到底其实就类似于现在GPU的GPGPU操作。
RSX:
——基于G70
——频率550MHz
——8 x Vertex Shader,24 x Pixel Shader
——24 x TMU,8 x ROP
——128bit显存位宽
——FlexIO总线接口

大体上可以参考7800,就不做太多介绍了。还有一点和G70不同之处在于,RSX主内存和显存都可以访问。
浮点性能:(8 x 4 + 24 x 2 x 4)x 2 x 0.55 = 246GFLOPS
单论浮点性能,显然必须算上SPE的加成。SPE浮点性能理论最高值为25.6GFLOPS/SPE @3.2GHz x 6 = 153GFLOPS,当然实际受到各方各面的影响不会达到这个值,并且并不是所有都用在图形上。实际应用能达到这个数值一半就不错了。
功耗方面
最新版本的PS3 CECH-4x00,GPU已经升级到28nm制程,CPU则还不确定,可能从45nn升级到22nm。
功耗比较

CPU+GPU的合计功耗已经降低到35w(推测值)
