You are on page 1of 12

Processadores Top AMD

Mauricio de Melo Viana EE1113001-21 Ely Carlos dos Santos Dias EE0421004-21 Clemilson Ferreira EE01011008-21 Engenharia Eltrica Instituto Federal do Maranho (IFMA) So Luis MA Brasil

Abstract. AMD since its inception until the present day has developed several technologies to reach what today is considered a high performance processor, the FX family originated technology Bulldozer. Combined with technologies such as Hypertransport, the processors can not only make its tasks extremely quickly, but also can "deliver" the results quickly.

Resumo. A AMD desde a sua criao, at os dias de hoje desenvolveu diversas tecnologias at chegar no que hoje, considerado um processador de alto desempenho, a famlia FX oriunda da tecnologia Bulldozer.Aliado a tecnologias como a Hypertransport, os processadores conseguem no s realizar suas tarefas com extrema rapidez, mas tambm conseguem entregar os resultados com rapidez.

1. Um breve resumo da histria da AMD


A AMD comeou a produzir circuitos lgicos em 1969, em 1975 ingressou no mercado de circuitos integrados para memrias RAM. Ainda em 1975 foi introduzido no mercado um microprocessador clone do Intel 8080, usando de engenharia reversa para tal. A AMD tambm produzia outros tipos de circuitos integrados para uso em minicomputadores de arquiteturas variadas. Houve vrias tentativas de diversificar seus produtos, atingindo reas da arquitetura RISC (com o processador AMD 29K), dispositivos de udio e vdeo e memrias flash. Nem todos esses ramos de produtos atingiram a rentabilidade esperada, portanto a AMD focou seus esforos nos mercados de processadores de arquitetura x86 e memrias flash, que eram respectivamente os mercados, principal e secundrio da Intel na poca, colocando AMD e Intel em concorrncia direta. Em 2004 e 2005 a AMD foi pioneira ao lanar os primeiros processadores 64 bits do mercado. Em 24 de Julho de 2006 a AMD comprou a ATI Technologies, uma das maiores fabricantes mundiais de placas grficas, num investimento calculado em 5,4 bilhes de

dlares americanos. Esta quantia inclui 2 bilhes conseguidos atravs de um emprstimo, alm de 56 milhes de aes da AMD.

2. Tecnologia Multicore
A tecnologia Multicore (mltiplos ncleos) consiste na colocao de dois ou mais ncleos (cores) no interior de um nico chip. O sistema operacional trata cada ncleo como um processador diferente, com seus prprios recursos de execuo. Na maioria dos casos, cada unidade possui o seu prprio cache e pode processar vrias instrues simultaneamente. Adicionar novos ncleos de processamento a um processador possibilita o processamento paralelo das instrues das aplicaes, em vez de serialmente, como ocorre apenas com um nico ncleo. Adicionar um novo ncleo como criar uma nova pista em uma estrada para aliviar o trnsito: os carros no precisam de se deslocar mais rpido para chegarem mais cedo ao seu destino, eles apenas no so atrasados tanto pelo afunilamento das pistas e congestionamentos. Os processadores de mltiplos ncleos permitem trabalhar num ambiente multitarefa. Em sistemas de um ncleo s, as funes de multitarefa podem ultrapassar a capacidade da CPU, o que resulta em queda no desempenho enquanto as operaes aguardam serem processadas. Em sistemas de mltiplos ncleos, como cada ncleo tem seu prprio cache, o sistema operacional dispe de recursos suficientes para lidar com o processamento intensivo de tarefas executadas em paralelo. Portanto, melhora-se a eficincia do sistema e o desempenho de computadores que executam vrias aplicaes simultaneamente.

Figura 1 Afunilamento na execuo de aplicaes

Figura 2 Desaparecimento de afunilamento Multicore Vantagens dos processadores Multicore Suporte de aplicaes multithreaded; Compatibilidade para mais utilizadores ou tarefas em aplicaes com vrias transaes; Desempenho superior em aplicaes que utilizam processamento de forma intensiva; Economia no preo de licenciamento de softwares proprietrios, passando a ter um maior poder de processamento sem necessitar de uma nova mquina; Reduo da dissipao trmica quando comparado ao Single-Core;

Desvantagens dos processadores Multicore Embora no seja necessrio ter um sistema operacional que suporte Multicore para usufruir de tecnologia Multicore, o sistema operacional um fator crucial para tirar partido da tecnologia; Mais difcil de controlar termodinamicamente do que os projetos SingleCore de baixa densidade.

3. HyperTransport
O barramento HyperTransport foi criado por um consrcio de vrias empresas, incluindo a AMD, a NVIDIA e a Apple. Este barramento pode ser usado em vrias aplicaes e no restrito apenas aos produtos da AMD. Atualmente, processadores AMD possuem dois barramentos para comunicao externa, sendo um para comunicao com a memria, o Barramento de memria e o outros para comunicao com o chipset, chamado de HyperTransport (nome dado pela

AMD). Os processadores AMD se comunicam com os demais perifricos atravs deste barramento. A memria o nico perifrico com canal de comunicao exclusivo, a ilustrao abaixo (Figura 1), demonstra a comunicao do processador com o chipset (este, chamado de ponte) e com a memria. Algumas placas possum dois chipsets, com objetivo de dividir a carga de trabalho referente ao controle dos perifricos (HD, Placas de udio, Placas de vdeo, etc...), este segundo chamado de ponte sul.

Figura 3: Localizao do barramento HyperTransport nos processadores AMD Existem processadores AMD com mais de um barramento HyperTransport, podendo ser dois ou at trs barramentos. Estes barramentos extras tem a funo de intercomunicar diversos processadores, por isso esta tecnologia esta disponvel apenas em processadores do tipo Opteron, voltados para servidores (estes possuem tecnologia de multi-processamento). O uso do barramento HyperTransport traz duas principais vantagens para o computador, a primeira o canal independente para a memria, a segunda vantagem esta no fato do barramento ser composto por dois canais independentes, um para recebimento e outro para comunicao (Figura 2). A Vantagem de se ter dois canais esta no fato do processador poder trabalhar com leitura e escrita em paralelo. Nas arquiteturas anteriores o barramento de comunicao com o chipset possua apenas um canal para leitura e escrita.

Figura 4: O barramento HyperTransport oferece caminhos separados para operaes de entrada e de sada O barramento HyperTransport pode operar com diferentes configuraes de clock e nmeros de bits que podem ser transmitidos por vez. Significando que a configurao do barramento usada em um determinado circuito depender do desenvolvedor do hardware. Apesar da tecnologia do barramento HyperTransport permitir que os dados sejam transmitidos a taxa de at 32 bits, os processadores AMD utilizam apenas 16 bits.

3.1 HyperTransport 1.x


O HyperTransport 1.x (HT1) usado nos processadores soquete 754 e no Sempron soquete AM2 (os demais processadores baseados no soquete AM2 usam o HyperTransport 2.0). Aqui est um resumo de todos os clocks possveis e taxas de transferncias do HyperTransport 1.x: 200 MHz = 400 MT/s = 800 MB/s 400 MHz = 800 MT/s = 1.600 MB/s 600 MHz = 1.200 MT/s = 2.400 MB/s 800 MHz = 1.600 MT/s = 3.200 MB/s

O barramento HyperTransport se utiliza da tecnologia DDR (Double Data Rate), ou taxa de transferncia dobrada transfere dois dados por pulso de clock. No site oficial do HyperTransport (http://www.hypertransport.org), possivel ver que a taxa de transferncia mxima do barramento HyperTransport 1.x de 12,8 GB/s. Esta taxa referente ao uso de links de 32 bits, no sendo aplicvel assim, aos processadores AMD que utilizam links de 16 bits.

3.2 HyperTransport 2.0


O HyperTransport 2.0 (HT2) adiciona novos clocks e consequentemente novas taxas de transferncia, mantendo compatibilidade com taxas de transferncias do HyperTransport 1.x. Os novos clocks e taxas de transferncia introduzidos pelo HyperTransport 2.0 so os seguintes. MHz = 2.000 MT/s = 4.000 MB/s 1.200 MHz = 2.400 MT/s = 4.800 MB/s 1.400 MHz = 2.800 MT/s = 5.600 MB/s

A AMD usa o HyperTransport 2.0 em todos os processadores baseados nos soquetes 939 e AM2 (exceto nos processadores Sempron).

3.3 HyperTransport 3.0


O barramento HyperTransport 3.0 adiciona novos clocks e consequentemente novas taxas de transferncia, mantendo compatibilidade com as taxas do HT1 e HT2. O HyperTransport 3.0 adiciona os seguintes clocks. 1.800 MHz = 3.600 MT/s = 7.200 MB/s 2.000 MHz = 4.000 MT/s = 8.000 MB/s 2.400 MHz = 4.800 MT/s = 9.600 MB/s 2.600 MHz = 5.200 MT/s = 10.400 MB/s

Os atuais processadores da AMD, como o Phenom, Phenom II, Athlon II e o FX, utilizam a verso mais recente do barramento HyperTransport.

4. Arquitetura Bulldozer
Em 2010 a AMD anuncioua arquitetura Bulldozerque passoua ser usada em seus processadores a partir de 2011, e que completamente diferente da arquitetura AMD64, usada desde o processadorAthlon 64, lanado em 2003, da qual herdou alguns recursos, tais como controlador de memria integrado e o uso do barramento HyperTransport para comunicao entre o processador e o chipset. A Bulldozer usa um novo padro de pinagem, chamado AM3+, compatvel comprocessadores soquete AM3. Porm, os processadores soquete AM3+ no so compatveis com placas-me soquete AM3.Processadores com esta arquitetura podem fazer overclock automtico caso esteja rodando programas pesados e se a dissipao trmica ainda estiver dentro da especificao, um equivalente da tecnologia Intel Turbo Boost.O termo Bulldozer refere-se apenas arquitetura, e no a um processador especfico.

4.1 Conjuntos de Instrues


A arquitetura Bulldozer, compatvel com as instrues x86, e tambm suporta os seguintes conjuntos de instrues adicionais: SSE4.1 e SSE4.2 Aumentam o desempenho de aplicaes multimdia (imagem e processamento de vdeo) que fazem uso dessas instrues. AVX (Advanced Vector Extensions ou Extenses de Vetor Avanadas) A AMD props o conjunto de instrues SSE5, mais a Intel criou sua prpria implementao do que seria a SSE5, a AVX que traz 12 novas instrues e aumenta o tamanho dos registradores XMM de 128 bits para 256 bits, a AMD incluiu este conjunto de instrues na arquitetura Bulldozercom algumas das instrues originalmente propostas para o conjunto de instrues SSE5(XOP e FMA4). Portanto, a implementao AVX da arquitetura Bulldozer mais completa do que a da Intel. AES (AdvancedEncryption Standard ou Padro de Criptografia Avanada) Consiste de seis novas instrues para tratar especificamente com criptografia. LWP (Light WeightProfiling ou Perfil Peso Leve) Permitem monitorar o desempenho de programas, e pode ser usado por desenvolvedores para ajustarem seus programas a obterem o maior desempenho possvel.

4.2 Diagrama em Blocos


O processador possui um mdulo de dois ncleos que compartilham a unidade de entrada, a unidade de ponto flutuante e o cache de memria L2e, portanto, eles no so completamente independentes.

Figura 5 - Diagrama em blocos da arquitetura Bulldozer Isto foi feito para otimizar o processador e, ao mesmo tempo, reduzir custos,dado o fato de que em um processador de vrios ncleos, algumas unidades dentro dos ncleos permanecem ociosas na maior parte do tempo, e na arquitetura Bulldozer essas unidades puderam ser combinadas. Como o processador ter menos unidades, ele poder ser menor, o que reduzir a quantidade de material necessrio para sua fabricao, reduzindo custos. Com menos unidades tambm possvel economizar energia e reduzir a quantidade de calor gerado. Assim, portanto, no se pode considerar o processador com esta arquitetura de dois ncleos, embora a AMD use este termo para referenci-lo.

4.3 Unidades de Busca e Decodificao

Figura 6 - Unidades de busca e decodificao

A unidade de busca compartilhada pelos dois ncleos disponveis em cada mdulo Bulldozer. O cache de instrues L1 de instrues tambm compartilhado pelos dois ncleos, mas cada ncleo do processador tem seu prprio cache L1 de dados de 64 KB usando arquitetura associativa de duas vias, a mesma configurao usada pelos processadores baseados na arquitetura AMD64, com a diferena de que enquanto os processadores AMD64 tm um cache L1 de memria por ncleo, os processadores baseados na arquitetura Bulldozer tem um cache de memria L1 por cada par de ncleos. No entanto, o cache de dados usado por cada ncleo so de apenas 16 KB, que consideravelmente menor do que os 64 KB por ncleo usados pelos processadores baseados na arquitetura AMD64.

4.4 Unidades de Execuo


Aps as instrues terem sido decodificadas, elas so enviadas para a unidade de agendamento apropriada, inteiro ou ponto flutuante. A arquitetura Bulldozer tem apenas uma unidade de ponto flutuante, que compartilhada entre os dois ncleos disponveis. Por outro lado, ela tem unidades de nmeros inteiros completamente independentes, os chamados ncleos.

Figura 7 - Unidades de execuo Cada motor de nmeros inteiros tem quatro unidades de execuo, chamadas: EX, MUL: executa qualquer tipo de instruo inteira, incluindo multiplicao, mas no diviso EX, DIV: executa qualquer tipo de instruo inteira, incluindo diviso, mas no multiplicao AGen: Gerao de endereos, tambm chamada Unidade de Gerao de Endereos ou AGU, usada para gerar os endereos que o processador buscar ou armazenar um dado.

Existe uma unidade de Carga/Armazenamento (Load/Store ou Ld/ST), responsvel por buscar ou armazenar um dado requisitado por uma instruo.

A arquitetura Bulldozer usa execuo fora de ordem, pois nem todas as unidades de execuo podem processar todo tipo de instrues, se no houvesse uma unidade de execuo fora de ordem unidades do processador poderiam ficar ociosas, tambm possui uma unidade de agendamento cuja funo manter todas as unidades de execuo do processador ocupadas a maior parte do tempo. A unidade de ponto flutuante tambm tem quatro unidades de execuo, chamadas:

MMX: Pode executar instrues bsicas de ponto flutuante (instrues x87), incluindo instrues MMX 128-bit FMAC: Pode executar todas as instrues de ponto flutuante

Figura 8: A unidade de ponto flutuante

4.5 O Cache de Memria L2


A arquitetura Bulldozer ter um cache de memria L2 compartilhado por cada dois ncleos. Um cache de memria L3 estar disponvel, compartilhado entre todos os ncleos. O cache de memria L2 utilizar uma arquitetura associativa de 16 vias, com um buffer de tradues de endereos (TLB) de 1.024 entradas.

Figura 9: O cache de memria L2

4.6 Gerenciamento de Energia


A AMD incluiu alguns recursos interessantes para o gerenciamento de energia na arquitetura Bulldozer, a mais importante sendo o chaveamento de circuitos (powergating), que permite ao processador simplesmente cortar alimentao de unidades que no esto sendo usadas para economizar energia. Este recurso tambm pode desligar completamente

qualquer ncleo do processador que no esteja sendo usado. A AMD tambm incluiu um recurso para medir a atividade do processador para estimar a energia que esta sendo dissipada. A frase Hardware uses higherfrequencywhenpowerlimitallows ou o processador usa uma frequncia maior quando o limite de energia permitir uma indicao do uso de uma tecnologia similar Intel Turbo Boost, que automaticamente aumenta o clock do processador se a dissipao trmica ainda estiver dentro da especificao.

Figura 10 - Gerenciamento de energia

5. Processadores AMD FX
Atualmente a famlia recente do portflio da AMD a famlia FX, baseada na arquitetura Bulldozer. Todos os modelos do processador AMD FX possuem uma tecnologia de overclock automtico, chamada Turbo Core. Esta tecnologia foi introduzida com os processadores Phenom II X6. Os processadores AMD FX possuem dois clocks Turbo (exceto o modelo FX4170). O primeiro deles, chamado Turbo Core, usado quando se necessita de mais poder de processamento e se tem margem de TDP (Thermal Design Power - indica a mxima dissipao trmica do processor), o processador aumenta o seu clock. Neste modo, todos os ncleos do processador podem estar ativos. O segundo clock Turbo chamado Max Turbo e entra em ao quando h ncleos de processamento ociosos. Neste caso, o processador desativa os ncleos ociosos, permitindo que ele aumente ainda mais o clock dos ncleos em uso. As principais especificaes do processador AMD FX incluem: Soquete AM3+ Arquitetura Bulldozer Quatro (modelos FX-4xxx), seis (modelos FX-6xxx) ou oito (modelos FX-8xxx) ncleos de processamento 64 KB de cache L1 de instrues e 64 KB de cache L1 de dados por ncleo 2 MB de cache de memria L2 para cada par de ncleos (por exemplo, um processador de oito ncleos tem quatro caches de memria L2 de 2 MB) 8 MB de cache L3 compartilhado por todos os ncleos Controlador de memria rodando a 2 GHz ou 2,2 GHz, dependendo do modelo

Suporte para memrias DDR3 at 1.866 MHz na configurao de dois canais Barramento HyperTransport 3.0 suportando as velocidades de 2.400 MHz (9,6 GB/s) e 2.600 MHz (10,4 GB/s), no disponveis em processadores soquete AM3 Dois clocks Turbo na maioria dos modelos Multiplicador de clock destravado, permitindo fazer overclock do processador aumentando este parmetro Suporte para instrues SSE4 e AVX, no disponveis em outros processadores da AMD Tecnologia de fabricao de 32 nm

Na tabela abaixo, estam listados todos os modelos do processador AMD FX lanados at o momento. Todos os modelos suportam as maiores velocidades do barramento HyperTransport 3.0 (com links 16 bits), que so de 2.400 MHz (9,6 GHz) e 2.600 MHz (10,4 GB/s). Todos os modelos tm multiplicador de clock destravado, o que permite ao usurio fazer overclock.

Clock Clock Max Cache Cache Ncleos Modelo Clock Turbo Core Turbo L2 L3 3,6 2 MB x FX-8150 3,9 GHz 4,2 GHz 8 8 MB GHz 4 3,1 2 MB x FX-8120 3,4 GHz 4,0 GHz 8 8 MB GHz 4 2,8 2 MB x FX-8100 3,1 GHz 3,7 GHz 8 8 MB GHz 4 3,3 2 MB x FX-6100 3,6 GHz 3,9 GHz 6 8 MB GHz 3 4,2 2 MB x FX-4170 ND 4,3 GHz 4 8 MB GHz 2 FX3,8 2 MB x 3,9 GHz 4,0 GHz 4 8 MB B4150 GHz 2 3,6 2 MB x FX-4100 3,7 GHz 3,8 GHz 4 8 MB GHz 2

Contr. Mem. 2,2 GHz 2,2 GHz 2,0 GHz 2,2 GHz 2,2 GHz 2,2 GHz 2,0 GHz

TDP 125 W 95 W ou 125 W 95 W 95 W 125 W 95 W 95 W

6. Concluso
De fato, no h como argumentar, a ltima gerao de processadores Top AMD perdeu a briga para a srie concorrente da Intel. Porm a AMD anunciou que a competio deixou de ser uma meta, portanto, as anlises so meramente para efeitos comparativos. A AMD vem focando sua ateno para processadores destinados a servidores (multi processados) e processadores flexveis quanto ao consumo, uma vez que os ncleos podem ser desligados caso no haja demanda suficiente.

7. Referncias http://www.clubedohardware.com.br/artigos/Tudo-o-Que-Voce-Precisa-SaberSobre-o-Barramento-HyperTransport/522/4 http://www.clubedohardware.com.br/artigos/Todos-os-Modelos-do-ProcessadorAMD-FX/2385/1 http://www.amd.com/us/aboutamd/corporate-information/Pages/timeline.aspx

You might also like