Meio Bit » Arquivo » Games » GeForce GTX 465: “vai que é tua”, nVidia!

GeForce GTX 465: “vai que é tua”, nVidia!

Que desempenho esperamos do novo processador gráfico GeForce GTX 465, o mais barato entre os atuais Fermi? Se suas placas de vídeo têm um preço entre as equipadas com a Radeon HD 5830 e as equipadas com a 5850, tal custo deveria valer a pena.

14 anos atrás

Após meses de muita especulação, chegam ao varejo as primeiras placas de vídeo equipadas com o processador gráfico dedicado GeForce GTX 465.

Laguna_nVidia_Logo_07jun2010

Tal GPU dedicada será o mais barato chip baseado na microarquitetura Gráficos Fermi 100, pelo menos enquanto aguardamos as placas de vídeo baseadas nos chips GF104, GF106 e GF108 da nVidia.

Laguna_GTX465bboard_07jun2010

O processador gráfico GeForce GTX 465 será baseado no chip GF102, onde teríamos um GPC e um outro SM adicional desativados, quando comparamos tal chip ao projeto original do Fermi.

É um belo ‘sacrifício’, em nome do reaproveitamento de chips defeituosos (do GF100 original) e conseqüente desconto nos precinhos “camaradas” das respectivas placas de vídeo, estas por volta dos 279 dólares no Ocidente (ou € 279,00 no velho continente).

Apenas para termos idéia do que tal perda representaria no ponto de vista do desempenho, relembremos o seguinte:

Laguna_GForceGTX465_07jun2010

Cada Cluster de Processamento Gráfico (GPC) do Fermi possui 4 unidades de Múltiplo Processamento em Fluxo Gráfico (SM) e é associado diretamente a no máximo um canal e meio de memória (interface de 96 bits). Por sua vez, cada SM possui 32 CUDA cores (ALUs), 4 texturizadores (TMUs) e 3 rasterizadores (ROPs).

Na microarquitetura Fermi, os 4 TMUs formam, em conjunto com uma unidade tesseladora, o chamado motor polimórfico (PE), responsável por toda a geometria executada via hardware em cada SM. Algo análogo ocorre com o motor de rasterização (RE), também presente em cada SM e que engloba os 3 ROPs do SM.

Resumindo: o Fermi original possui 4 GPCs e 16 SMs, o que, em teoria, nos daria um processador gráfico dedicado ao DirectX 11 com 512 ALUs, 64 TMUs, 48 ROPs e interface de memória 384 bits. Na prática, temos os dados abaixo para a GeForce GTX 465:

Laguna_GTX465aSpecs_07jun2010

Certo, tio Laguna, e quem seriam os concorrentes diretos de todos esses números na figura acima?

Laguna_GTX465boards_07jun2010

Vamos à mais alguns números interessantes, agora de 2 placas de vídeo, diretamente concorrentes, ou seja, que tenham preços próximos à GeForce GTX 465. Tais placas têm chips baseados no Cypress, a GPU high-end da família Evergreen, toda uma série de processadores gráficos da ATi, dedicados ao DirectX 11:

Radeon HD 5830, a Cypress LE

  • Precinho médio de 250 obamas;
  • TDP de respeitáveis 175 watts, a serem arrefecidos pelo conjunto dissipador de calor;
  • 7 dos 10 Clusters de Fluxo Gráfico do Cypress original (SC) ativos;
  • 224 unidades de processamento em fluxo gráfico unificado + 896 outras ALUs mais simples (a totalizar 1120 ALUs), 56 texturizadores (TMUs) e 16 rasterizadores (ROPs) correndo à freqüência de 800 MHz;
  • 1GiB de memória a 1GHz (4GHz GDDR5), com interface 256 bits.

Laguna_RadeonHD5830_07jun2010

Radeon HD 5850, a Cypress Pro

  • Esta single-GPU custa, no momento, por volta dos US$ 310;
  • TDP de míseros 151 watts;
  • 9 Stream Clusters;
  • 288 Stream Processors (1440 ALUs), 72 TMUs e 32 ROPs caminhando a 725 MHz;
  • 1GiB de memória a 1GHz (4GHz GDDR5), com interface 256 bits.

Agora traduziremos toda essa infinidade de números para as aplicações reais deles, que são a renderização, manipulação, aceleração e posterior exibição de gráficos tridimensionais em tempo real. Como? Por meio de diversos benchmarks e outras comparações de desempenho.

Vejamos abaixo o que a GeForce GTX 465 faria com o DiRT 2, um jogo desenvolvido em DX11:

Laguna_GTX465bDiRT2_07jun2010

No benchmark realizado pelo Tom’s Hardware, o desempenho da GeForce GTX 465 é discretamente inferior ao da Radeon HD 5830, esta trinta obaminhas mais barata, quando se é exigida uma resolução maior (1080p versus 2560x1600), embora o desempenho de ambas esteja bem próximo, ao desativar o anti-aliasing a 8 amostras, na resolução mais alta do teste.

Observemos atentamente a situação a seguir, onde temos uma mesma resolução testada (1920x1200) em dois jogos diferentes, Aliens Versus Predator (DX11) e Resident Evil 5 (DX10):

Laguna_AlienPredator_07jun2010 Laguna_BioH5bench_07jun2010

Agora sim vemos que os US$30 adicionais pela GeForce GTX 465 fizeram uma boa diferença, pois vemos que a barata Radeon HD 5830 foi entre 20 a 33 por cento “menos rápida” no Aliens Versus Predator, enquanto a diferença no Resident Evil 5 não ultrapassou os 8% à favor da nova criança da nVidia, que conseguiu maior quantidade de fotogramas por segundo.

O que podemos aproveitar desses testes todos, tio Laguna?

Bom, notamos aqui, primeiramente, o quanto a microarquitetura Fermi pode ser ‘modularizável’, ou seja, a capacidade de reaproveitar chips incompletos para preencher lacunas de desempenho e preço mais modestos, mantendo a competitividade da nVidia no mercado de processadores gráficos com novos chips, algo que a empresa não conseguiu com a segunda geração dos gráficos Tesla.

Outro aspecto que podemos perceber: enquanto a GeForce GTX 465 ainda é o terceiro processador gráfico DX11 da nVidia (com um preço relativamente baixo, mas ainda high-end), a AMD+ATi já disponibilizou a família Evergreen por completo (o que compreende dez faixas de preço e desempenho!) e isso nem inclui cinco produtos destinados ao segmento profissional.

Laguna_nVidiaVsATi_07jun2010

O tio Laguna particularmente admira a microarquitetura Fermi, até muito mais que a Evergreen, mesmo sendo fã dos processadores gráficos da ATi há exatos 8 anos.

E por um motivo simples: o tio Laguna considera a microarquitetura Fermi como inovadora, estando à frente de seu tempo. Inclusive, o Fermi até relembra a empolgação que ele teve com o R600.

O único e maior defeito da nVidia é depender do processo de litografia à 40nm da TSMC, cujos wafers de silício ainda apresentam baixo yield, o que faz com que o enorme chip do Fermi (530mm²!) não renda o desempenho esperado.

O gozado é perceber que tal situação é análoga ao R600: àquela época, logo após a fusão AMD+ATi, a empresa apresentou um enorme chip (OMG, chegava a ter 420mm²!) litografado à 80nm, cuja placa era caríssima para ser fabricada, afinal tinha oito canais de memória (interface de 512 bits), o que representava 1024 pinos/fios apenas para a entrada e saída de dados no framebuffer!

Além de cara, a Radeon HD 2900 XT simplesmente não entregou o desempenho prometido à época, afinal a ATi foi responsável pelo mais potente processador gráfico dos consoles de sétima geração, o Xenos, pertencente ao XBox 360. Tal GPU dedicada foi o primeiro projeto de fluxo gráfico unificado, mesmo tendo sua API gráfica ainda um tanto limitada ao DirectX 9c.

Apesar do fracasso inicial, a microarquitetura do R600 continua bem viva no Evergreen, pois após três séries de GPUs com refinamentos e outras sutis melhorias, o Cypress apenas representa o ‘estado da arte’ do R600, ou seja, chegou ao que o tio Laguna considera o limite máximo de desempenho.

Ou a AMD+ATi apresenta, de facto, uma nova arquitetura, ou o desempenho não será competitivo caso a nVidia se recupere do “passo maior que as pernas” com o Fermi.

O que você faria nessa situação toda?

  1. Compraria alguma placa de vídeo com o melhor custo benefício do momento (Radeon HD 5k)?
  2. Esperaria a nVidia se recuperar do ‘tombo’, ao oferecer alguma boa placa de vídeo com preço quase acessível?
  3. Agiria que nem a Intel, ao fingir que o computador pessoal não serve mais para jogos pesados?

Enquanto isso, o tio Laguna ficará verde, de inveja, por não poder experimentar algo melhor que a veterana Sapphire Radeon HD 3850. Pelo menos não tão cedo.

*Observo que alguns termos mais complicados possuem legendas ocultas, visíveis ao passar o cursor do mouse sobre tais palavras.

relacionados


Comentários