Professional Documents
Culture Documents
Agenda
Introduo Conceitos bsicos Microprocessadores Histrico dos processadores X86 (Intel e AMD) Linha evolutiva dos processadores Mercado de processadores Breve Comparativo Intel x AMD Resumo Processador Celeron Processadores 64 bits Concluses Bibliografia e sites relacionados
80386 80486
AMD 386 AMD 486 Pentium Pentium Pro Pentium II Pentium III AMD K5 AMD K6 AMD K6-II AMD K6-III
Celeron
(Pentiums limitados)
Pentium IV
Evoluo X86
Nome 8086 Data 1978 Transistores 29K
Processador de 16-bit. Base para o IBM PC & DOS Limitado a 1MB de espao de endereamento. DOS disponibiliza ao usurio apenas 640K
80286
1982
134K
Modo de endereamento mais complexo, mas no muito til Base para IBM PC-AT e Windows
386
1985
275K
Extenso para 32 bits. Adicionado um novo tipo de endereamento Capaz de rodar Unix (modos Real, Protegido)
Evoluo X86
Nome
Data Transistores
486 1989 1.9M Pentium 1993 3.1M Pentium II/MMX 1997 4.5M
Adicionada uma coleo especial de instrues para operar em vetores de 64-bit de dados inteiros de 1, 2, ou 4 bytes
PentiumPro
1995
6.5M
Adionadas as instrues de mov condicional Grande mudana na microarquitetura Preempo de tarefas (saltos)
Evoluo X86
Nome Pentium III Data 1999 Transistores 8.2M
Adicionadas instrues streaming SIMD para operar sobre vetores de 128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
Pentium 4
2001
42M
Adicionados formatos de 8-bytes e 144 novas instrues para o modo streaming SIMD
Evoluo AMD
197 5 197 9 198 2 199 1
Am386
199 3
Am486
199 5
AMD-K5
199 7
AMD-K6
199 9
AMD Athlon
200 2
AMD Athlon XP
8080A
8086
286
Transistores
5k 10um
29k
134k
275k 0.80um
1.200k
3.500k
9.300k 0.25um
22.000k 0.18um
37.000k 0.13um
0.35um
200 3
200 4
200 5
+
100.000k Transistores
0.13um
->
0.09um
Evoluo AMD
1991 1992 1993 1994 1995 1996 1997 1998
am386
am486
1999
2000
2001
2002
2003
2004
2005
2006
Arquitetura 8086
8086 - primeiro microprocessador de 16 bits da Intel
arquitetura de 16 bits
comunicao com a memria em 16 bits (8086) capacidade mxima de memria de 1 MByte 14 registradores (4 dados, 4 endereos, 4 segmentos, ponteiro do programa, flags) endereo fsico = segmento * 16 + deslocamento 85 instrues bsicas coprocessador: 8087 (67 instrues bsicas) sem cache, sem memria virtual
Endereos
apontador de instrues flags segmento de cdigo segmento de dados segmento de pilha segmento extra
Segmento
linear addresses
one segment
0000
Adder
Organizao de memria
Bloco 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 Dados rea de memria para o usurio (64 Kb) rea de memria para o usurio (128 Kb) rea de memria para o usurio (192 Kb) rea de memria para o usurio (256 Kb) rea de memria para o usurio (320 Kb) rea de memria para o usurio (384 Kb) rea de memria para o usurio (448 Kb) rea de memria para o usurio (512 Kb) rea de memria para o usurio (576 Kb) rea de memria para o usurio (640 Kb) Memria de Vdeo Memria de Vdeo rea de Extenso da ROM rea de Extenso da ROM ROM-BIOS do sistema ROM-BIOS do sistema e ROM-BASIC
Comunicao com a memria em 16 bits 14 registradores (os do 8086) Endereo fsico ou virtual 15 instrues extras (92 + 15 = 107 instr. bsicas) Co-processador: 80287 Sem cache Memria virtual segmentada (apenas no modo protegido) Maior parte dos programas desenvolvidos para modo Real
14 registradores
do 8086, com 32 bits, e mais 2 regs. de segmento
44 instrues extras
107 + 44 = 153 instrues bsicas
m v al em ria irtu
en ereo d v al irtu
p cessad r ro o
en ereo d fsico
m ead r ap o
m em ria fsica
CEFET-PE Arquitetura e redes de Computadores
CS DS SS ES ...
0 3 1 ( g l Ser eae et dtoa lo b l ( lb oLa Ga ub l ol o ) c a l o u l Drtr e io s c nr oa de s o Eebe dsget eemo n c (2is 3b ) t ( be 8ys t) a l ) s Te ddctrs a l eero ba s i e e 3 1 g GR oL R D T uD T m
(Global ou Local)
(2is 3b ) t
+
Eelnr nr o e de i a
D r d n ie i e gs rt o P a i (D P )
...
(PT)
...
P D E (2s 3i) b t C R 3 3 1 Erda fm n e e gr e d o pea e
Tabelas
P T E (2t) 3i b s
1 1 2 1 Dc eo eom s an l t Erfio n e c d os e
outras caractersticas Co-processador: 80387 (67 + 7 -1 = 73 instr. bsicas) Sem cache TLB:
pequena memria associativa que retm os ltimos e mais freqentes endereos de pgina acessado uma pequena cache de endereos fsicos
FPU
Reestruturao do 486
Modos real (8086), protegido e virtual86 16 registradores (os do 80386, tambm em 32 bits) Memria virtual segmentada e paginada
Comunicao com a memria em 64 bits Capacidade mxima de memria de 4 GByte 5 instrues extras (157 + 5 = 162 instr. bsicas) FPU: coprocessador aritmtico integrado Cache de 16 KByte (2 x 8 KByte)
FPU tambm em pipeline (mas no em paralelo) operao super-escalar: mais de uma instruo pronta em um ciclo de relgio
BB T
Bfe d uf r e i sr e ntus
FU P
rg e. sak tc
FUi e P- p p
cm cr ut s o icio ddcds ei ao pr s m aa o a , dvso i i e mtpi a ui lco l
Vi e -p p B I U Ui e -p p
bsi t rae u nef c ui nt
AU AU L L
R i taoe e sr dr s g
cce spr ds ahs eaaa ddse i sr ao nt. 8 B cd K aa
Ch Do ae as c d
CEFET-PE Arquitetura e redes de Computadores
5 instrues extras (162 + 5 = 167 instr. bsicas) Operao super-escalar 14 unidades internas Execuo fora de sequncia Execuo especulativa
Pro
PentiumII
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium 4
Lanado em novembro de 2000 Pipeline de 20 estgios (hyper pipeline) At 128 instrues em execuo (3 vezes mais que no Pentium III) Algoritmo melhorado para previso de desvios, com tabela de 4K Novo sistema de cache de nvel 1 Cache de execuo de 12 K micro-operaes (Execution Trace Cache) Cache de dados de 8 KBytes
Intel Pentium 4
Instrues SSE2 (Streaming SIMD Extensions 2) 144 novas instrues
67 instrues para vetores de pontos flutuante de preciso dupla (64 bits) 69 novas instrues MMX, para vetores inteiros de 128 bits (utilizando os registradores XMM) 8 instrues para controle de cache
Mercado de Processadores
Low End
Destinado construo de mquina de baixo poder computacional
Usurio iniciante
(Celeron D (Intel), Semprom (AMD)
Mid-Range
Destinado construo de mquinas de maior poder computacional
Ferramentas CAD, design house
Pentium IV (Intel), Athlon (AMD)
High-End
Destinado maquinas de alto poder computacional e compartilhamento
Servidores de Rede Gerenciamento de Clusters
Pentium HT (Intel), Athlon 64 D (AMD)
AMD
Desktop: AMD Athlon 64 FX, AMD Athlon 64 Server: AMD Opteron
Intel
Desktop: Intel Pentium 4 w/ HT, Intel Pentium 4 Extreme Edition Server: Intel Itanium 2, Xeon
Os processadores Celeron diferenciam-se dos processadores Pentium II, III e IV pela limitao das seguintes caractersticas:
Tamanho da Cache L2 Clock interno Clock do barramento externo
Celeron A
Mendocino
32KB
128KB
0.25m
66MHz
Slot 1
Celeron PPGA
Mendocino
32KB
128KB
0.25m
66MHz
Soquete 370
Celeron Coppermine
Coppermin e
32KB
128KB
0.18m
66MHz / 100MHz
Soquete 370
Celeron Tualatin
Tualatin
32KB
256KB
0.13m
100MHz
Soquete 370
Celeron Willamette
Willamette
8KB
128KB
0.18m
400MHz
Soquete 478
Celeron Northwood
Northwood
8KB
128KB
0.13m
400MHz
Soquete 478
Celeron D
Prescott
8KB
256KB
0.09m
533MHz
478 ou 775 478 ou 775 478 ou 775 478 ou 775 478 ou 775 478 ou 775
Processador lgico barramentos, caches e unidades de execuo so compartilhados cada processador lgico tem estado prprio, bem como registradores de propsitos gerais. Processador fsico tem seus prprios conjuntos de registradores e caches.
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
AMD Athlon 64
Resumo Processadores AMD Atuais
Desktop
Semprom (Low End) Athlon 64 (Mid Range) Athlon 64 FX Athlon 64 X2
Notebooks
Athlon 64 Mobile Turion 64
Servidores
Opteron
AMD Athlon 64
197 5 197 9 198 2 199 1
Am386
199 3
Am486
199 5
AMD-K5
199 7
AMD-K6
199 9
AMD Athlon
200 2
AMD Athlon XP
8080A
8086
286
Transistores
5k 10um
29k
134k
275k 0.80um
1.200k
3.500k
9.300k 0.25um
22.000k 0.18um
37.000k 0.13um
0.35um
200 3
200 4
200 5
+
100.000k Transistores
0.13um
->
0.09um
AMD Athlon 64
North Bridge
Bus PCI
AGP
UCP
Interface Grfica
Adaptador SCSI
REDE LAN
HD CD-ROM Scaner COM LPT
USB
HD CD-ROM Mouse
PCI I/O
Bus SCSI
Bus E / ISA
ROM BIOS
Super I/O
PCMCIA
Floppy
Interface Som
RAM
L1/L2
L3
RAM
AMD Athlon 64
Novas caractersticas incorporadas
1MB L2 Cache Controlador de Memria DDR incorporado HyperTransport Channel Menor consumo de potencia Novo Core Processador Registradores em dobro Pipeline maior (10 12 estgios) Maior Look Aside Buffer (TLB)
AMD64 Architecture
Register Differences: AMD64 vs x86
AMD64
64-bit integer registers 48-bit Virtual Address 40-bit Physical Address
In x86 Added by AMD64 63 31 15 7 0
RAX
0
EAX
AH AL
79 0
127
S S E
MMX0
G P R
EAX
x 8 7
MMX7 MMX8
EDI R8 EIP
XMM8
MMX15
R15
Load32bitOS Load32bitOS
64-bit
Load64bitOS Load64bitOS
CPU
CPU AMD64
DDR
PCI Express
PCI
IDE, FDC, USB, Etc.
PCI
Athlon 64 X2 Opteron
Processadordual-core
Ncleos
Placame
FluxodeDadosemumAMD64CPU
Processor Core
144-bitwide DRAMinterface
128-bitswide
64-bitswide
L1Inst.Cache
Memory Controller
SystemRequest Queue(SRQ)
1MB
BussingUnit
Crossbar Switch
Load/Store Unit
AMD64 CPU
L2Cache
HyperTransportTechnologyBUS
L1DataCache
ArquiteturaInterna
128-bitswide 64-bitswide
144-bitwide DRAMinterface
L1Inst.Cache
DRAM Controller
1MB
BussingUnit
L2Cache
128-bitswide
64-bitswide
Crossbar Switch
L1Inst.Cache
L1DataCache
Memory Controller
Load/Store Unit
AMD64 CPU
L2Cache
HyperTransportTechnologyBUS
L1DataCache
SystemRequest Queue(SRQ)
1MB
BussingUnit
Load/Store Unit
AMD64 CPU
Processamento nativo em 32 e 64 bits Controlador de memria DDR integrado ao processador Barramento de sistema Hyper Transport Coolnquiet - Gerenciamento avanado de energia Proteo anti-vrus por hardware Excelente custo/benefcio AMD Athlon 64 FX:
Campeo em aplicaes single thread Jogos
CEFET-PE Arquitetura e redes de Computadores
Sistema Quad-processado
Soluo do problema de gargalo no chipset/FSB
AMD Opteron
AMD Opteron
DDR
PCI-X PCI-X Bridge Bridge North North Bridge Bridge PCI-X PCI-X Bridge Bridge PCI-X PCI-X Bridge Bridge
PCI-X
DDR
PCI-X
DDR
PCI-X PCI-X
PCI-X
PCI
Other I/O
PCI
CPUCPU
CPU
SRQ Crossbar
Mem.Ctrlr
8 GB/S
SRQ Crossbar
Mem.Ctrlr
HT
HT
8 GB/S
8 GB/S
I/O Hub
PCI-E Bridge
PCI-E Bridge
Arquiteturax86tradicional
FSB compartilhado por CPUs, Memria e I/O Mais CPUs Maior performance
AMD64comDirectConnect
Arquitetura x86 padro de mercado Sem gargalo de FSB
O futuro do Microprocessador
Mais transistores, mais ncleos, mais threads
Mais ncleos Ncleos especializados Mais controladores integrados ...
CPU de 16 ncleos
CEFET-PE Arquitetura e redes de Computadores
Concluses
Processadores AMD atuais so mais indicados para aplicativos (Business), Jogos, Aplicativos 2D com melhor taxa de preo Processadores Intel esto mais indicados para aplicativos 3D e Multitasking
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software Torres, G. Hardware Curso completo Weber, R. Arquitetura de computadores pessoais Intel Home page: http://www.Intel.com AMD Home Page: http://www.amd.com
Pesquisa: