Meio Bit » Arquivo » Indústria » Miaul, que chips quentinhos: AMD exibe “Bulldozer” e ‘Bobcat’

Miaul, que chips quentinhos: AMD exibe “Bulldozer” e ‘Bobcat’

AMD exibe as CPUs Bulldozer (K11, desktops e workstations) e Bobcat (portáteis) no 22º Hot Chips. A empresa anuncia muitas promessas e deixa muitas expectativas para 2011…

14 anos atrás

No segundo dia de conferências da Hot Chips 22, os dois últimos palestrantes foram Mike Butler e Brad Burgess, chefes da divisão de microarquitetura de CPUs da californiana e ‘verde’ AMD.

Laguna_HotChipsLogo_28ago2010

Eles apresentaram vários detalhes do Bulldozer e do Bobcat, principais representantes da maior mudança na microarquitetura nos processadores da AMD desde o Athlon 64 (aka K8), aquele pioneiro processador central de 2003 que colocou no varejo recursos como os registradores x86 de 64 bits, controlador de memória integrado na die da CPU e o barramento Hyper Transport.

A empresa de Sunnyvale até atualizou a microarquitetura K8 com uma linha de CPUs de duplo núcleo nativo (Athlon X2) em 2005 e lançou a microarquitetura K10, no final de 2007, com as CPUs de quádruplo núcleo nativo (Phenom litografado a 65 nm, Phenom II a 45 nm).

Laguna_AMDZaFutureF_21abr2010

Uma pena que os K10 sofreram bastante nas mãos da Intel, especialmente no quesito desempenho, embora pareçam ter preços até atraentes.

Laguna_AMD2011CPUs_26ago2010

Seja como for, a AMD tem obtido bons resultados financeiros, embora atualmente só consiga estabilizar-se como um distante segundo lugar ante a Intel, um concorrente muito, mas muito maior no mercado mundial de CPUs x86.

E é na esperança de conseguir derrotar os produtos desktop e mobile da Intel (e abocanhar alguma fatia maior de tal mercado) que a AMD apresentou mais detalhes sobre dois dos novos chips, ambos com previsão de lançamento para o próximo ano (2011, certo?):


Bulldozer

Esta complexa CPU da AMD terá 8 núcleos nativos numa mesma die.

Entretanto, o modelo inicial do Bulldozer (codinome Interlagos) será voltado exclusivamente ao mercado de workstations e servidores de alto desempenho, ao ser constituído por duas dies, o que trará ao mundo nada menos que 16 núcleos físicos num mesmo encapsulamento (soquete G34 da AMD, para Opteron. Possui 1944 pinos do tipo LGA).

Tio Laguna, isso aí é muito ou é pouco núcleo físico em comparação à atual concorrência?

Bom, o atual Core i7 possui um modelito de 1.000 dólares para o soquete LGA-1366. Tal processador central da Intel, com 6 núcleos físicos, pode ser encontrado à venda em qualquer phármacia atual, assim como plutônio.

Pois bem, agora sério: cada núcleo nativo do tal Core i7 possui o recurso Hyper Threading™, aquele que permite que cada núcleo físico consiga executar duas tarefas simultâneas (threads) de um mesmo processo. Ao fazermos as contas, teríamos 12 núcleos lógicos no sistema operativo.

Laguna_AMDBullK11_29ago2010

Desde o K8 que esperávamos a AMD nos entregar alguma tecnologia semelhante ao Hyper Threading™: outros recursos, como a virtualização, são inclusos até em modelos mais modestos da “empresa verde de Sunnyvale”, enquanto a Intel limitava a inclusão do Hyper Threading™ aos modelos mais ‘extremos’.

Aqui no K11 da AMD (chamar-se-á Phenom III ?), teremos o Simultaneous MultiThreading (SMT) em cada FPU, compartilhada pelo módulo constituinte elementar do Bulldozer: a verdinha focará na performance e escalabilidade ao usar um projeto bem modular, que combinará componentes dedicados e compartilhados.

Cada módulo básico do Bulldozer conterá dois núcleos físicos, que processarão tarefas bem distintas: cada um deles terá a própria cache L1 (instruções) de 64 KiB, o próprio escalonador de processos em inteiros e suas respectivas 4 pipelines de execução.

A novidade será que cada um desses núcleos físicos do módulo do Bulldozer, compartilharão a cache L2 e um mesmo escalonador de processos em ponto flutuante, que gerenciará a atividade das 2 unidades de matemática em ponto flutuante, com precisão 128 bits cada.

Caso haja o reaproveitamento de chips com defeito (Sempron ?) num dos núcleos físicos, o processador resultante manteria a FPU completa do módulo, com plena capacidade de SMT, ou seja, teria um núcleo físico de facto e dois lógicos.

Tio Laguna não estranhará se vermos um “Phenom III X7” (3 módulos bons e um reaproveitado) e/ou “Athlon III X5” (2 módulos bons e um reaproveitado, mas com menor ou mesmo sem cache L3) no mercado.

A empresa dos microdispositivos avançados acredita que tal abordagem será a maneira mais correcta e elegante de multitarefa simultânea, pois, em teoria, o SMT permitirá que duas threads simultâneas possam ser processadas em paralelo, de forma mais rápida e eficiente que o Hyper Threading™ dos atuais Nehalem da Intel: da maneira como está o Bulldozer, ele parece desperdiçar menos transístores litografados a 32 nm, ao permitir até 16 threads num único chip (4 módulos, 8 núcleos físicos) para desktops (codinome Zambezi).

Ou logo 32 threads no caso do modelo dual-chip (Interlagos), para servidores high-end.

Enquanto o Interlagos utilizará o mesmo soquete G34 dos atuais Opteron como encaixe lógico e eletromecânico na respectiva placa-mãe, o Zambezi octanuclear até será compatível com o atual soquete AM3, embora necessite de um novo soquete que aproveite o upgrade na alimentação elétrica, algo análogo à transição do soquete AM2+ para o AM3, mas não igual: o novo soquete (AM3+ ?) terá saída digital de áudio e vídeo, afinal o Llano terá versão para desktops.

Bobcat

Esta simplória CPU será destinada ao mercado de computadores portáteis, especialmente àquele onde o Atom “faz a festa” hoje: os subnotebooks, aka netbooks. O objetivo do Bobcat é bater o custo benefício do Atom, ao tentar obter um desempenho melhor com um consumo competitivo ante os ‘pequeninos átomos’ da Intel.

Lembremos que o Atom é um processador central bem simplificado, tanto que somente processa as instruções ‘em-ordem’. Tal facto é interessante do ponto de vista do consumo, mas deixa o desempenho “atômico” inferior à clássicas CPUs de quase uma década atrás (um Athlon XP ou Pentium IV na mesma freqüência do Atom, p.ex.), mas que hoje somente possuem desempenho satisfatório em tarefas muito leves, como o acesso à internê e uso para ‘aplicativos de escritório’.

Laguna_AMDHotBobcat_29ago2010

O Bobcat foi planejado para processar a execução ‘fora-de-ordem’ das instruções, com direito a uma avançada ‘previsão de desvio’ e FPU semelhante à do Bulldozer.

E, ao contrário do Atom, teríamos registradores x86 de 64 bits e total suporte à recursos como a virtualização.

Aliás, o tio Laguna especula que cada Bobcat seria um módulo do Bulldozer bastante simplificado, até porque o Bobcat apresentará duas instruções por ciclo de clock, embora sem o SMT, falta compreensível dado o desafio de gerenciar fortemente um baixíssimo consumo.

Consumo elétrico esse que estaria por volta do 1 Wh.

Além do ínfimo consumo teórico, outra semelhança com o Atom seria que a pipeline de inteiros do Bobcat será de 15 estágios, um a menos que o Atom.

Menos estágios na pipeline, menor complexidade. Menor complexidade, menos componentes a serem alimentados.

O tio Laguna até acharia aceitável que o consumo do Bobcat fosse maior que o do Atom: este nasceu como um processador central numa plataforma que não colaborava com um consumo ainda menor, pois era constituída por mais dois outros chips, o northbridge e o southbridge.

Com o passar do tempo, a Intel foi integrando os componentes até chegar ao Pine Trail.

Já o Bobcat será uma das CPUs do chip Ontario, um SoC que combinará duas CPUs Bobcat à uma modesta GPU DX11 (Radeon HD 5k) da minha querida ATi.

O tio Laguna especularia que tal GPU integrada teria um quarto (400 MHz, 500 MHz?) da freqüência dos Bobcat (1,6 GHz; 2,0 GHz?) e um sexto dos componentes (16 SP + 4 TMU + 2 ROP) da GPU contida no Llano (96 SP + 24 TMU + 12 ROP).

Por falar em freqüências de operação, a AMD não revelou na Hot Chips maiores informações sobre tal detalhe em qualquer dos dois chips apresentados. Se bem que um outro aspecto semelhante entre o Bulldozer e o Bobcat será o abandono do 3DNow!, embora as instruções PREFETCH e PREFETCHW ainda sejam mantidas naqueles e noutros futuros processadores x86 da AMD.

Algumas considerações finais

O tio Laguna considera que o mercado de hardware, de uma forma geral, está numa espécie de transição para as APUs, aqueles processadores que combinam CPU com GPU.

Há mercados que ainda pedem por um enorme poder de processamento em série e que possua o legado das CPUs x86. Talvez para diminuir o consumo do conjunto todo, uma boa sugestão para tais mercados seria usar CPUs mais simples combinadas à poderosíssimas GPUs.

Aliás, o consumo elétrico é a palavra chave para os mercados desktop e mobile: não é todo mundo que vá planejar a compra de uma cara fonte de alimentação (PSU) num desktop ou mesmo o recarregamento da bateria do notebook “toda hora”.

Tio Laguna só especula que o inteligente consumidor não abriria mão de um desempenho decente por um consumo pouco menor e nesses quesitos a AMD está a gerar grandes expectativas, afinal a empresa viu seu conceito de fusão CPU+GPU ser colocado primeiro em prática pela maior concorrente, embora a Intel não represente uma ameaça real no ramo dos processadores gráficos.

Será que a AMD cumprirá as promessas feitas com o Bulldozer e o Bobcat? Esperemos por 2011.

relacionados


Comentários