Professional Documents
Culture Documents
Agenda
Introduo Conceitos bsicos Microprocessadores Histrico dos processadores X86 (Intel e AMD) Linha evolutiva dos processadores Mercado de processadores Breve Comparativo Intel x AMD Resumo Processador Celeron Processadores 64 bits Concluses Bibliografia e sites relacionados
80386 80486
AMD 386 AMD 486 Pentium Pentium Pro Pentium II Pentium III AMD K5 AMD K6 AMD K6-II AMD K6-III Duron Athlon Semprom
Celeron
(Pentiums limitados)
Pentium IV
Evoluo X86
Nome Transistores Data
8086
1978
29K
Processador de 16-bit. Base para o IBM PC & DOS Limitado a 1MB de espao de endereamento. DOS disponibiliza ao usurio apenas 640K
80286
1982
134K
Modo de endereamento mais complexo, mas no muito til Base para IBM PC-AT e Windows
386
1985
275K
Extenso para 32 bits. Adicionado um novo tipo de endereamento Capaz de rodar Unix (modos Real, Protegido)
CEFET-PE Arquitetura e redes de Computadores
Evoluo X86
Nome
Data Transistores
486 1989 1.9M Pentium 1993 3.1M Pentium II/MMX 1997 4.5M
Adicionada uma coleo especial de instrues para operar em vetores de 64-bit de dados inteiros de 1, 2, ou 4 bytes
PentiumPro
1995
6.5M
Adionadas as instrues de mov condicional Grande mudana na microarquitetura Preempo de tarefas (saltos)
Evoluo X86
Nome Data Transistores
Pentium III
1999
8.2M
Adicionadas instrues streaming SIMD para operar sobre vetores de 128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
Pentium 4
2001
42M
Adicionados formatos de 8-bytes e 144 novas instrues para o modo streaming SIMD
Evoluo AMD
1975 1979 1982 1991 1993 1995 1997 1999 2002
Am386
Am486
AMD-K5
AMD Athlon XP
8080A
8086
286
Transistores
5k 10um
29k
134k
275k
1.200k
3.500k
9.300k
22.000k
37.000k
0.80um
0.35um
0.25um
0.18um
0.13um
2003
2004
2005
+
100.000k Transistores
0.13um
->
0.09um
Evoluo AMD
1991 1992 1993 1994 1995 1996 1997 1998
am386
am486
1999
2000
2001
2002
2003
2004
2005
2006
Arquitetura 8086
8086 - primeiro microprocessador de 16 bits da Intel
arquitetura de 16 bits
comunicao com a memria em 16 bits (8086) capacidade mxima de memria de 1 MByte 14 registradores (4 dados, 4 endereos, 4 segmentos, ponteiro do programa, flags) endereo fsico = segmento * 16 + deslocamento 85 instrues bsicas coprocessador: 8087 (67 instrues bsicas) sem cache, sem memria virtual
Endereos
apontador de instrues flags segmento de cdigo segmento de dados segmento de pilha segmento extra
Segmento
F0000 E0000 D0000 C0000 B0000 A0000 90000 80000 70000 60000 50000 40000 30000 20000 10000 00000 seg ofs 8000:0000
0250
8000:FFFF
one segment
8000:0250
0000
Adder
Organizao de memria
Bloco 01 02 03 04 05 Dados rea de memria para o usurio (64 Kb) rea de memria para o usurio (128 Kb) rea de memria para o usurio (192 Kb) rea de memria para o usurio (256 Kb) rea de memria para o usurio (320 Kb)
06
07 08 09 10 11 12 13 14 15 16
Comunicao com a memria em 16 bits 14 registradores (os do 8086) Endereo fsico ou virtual 15 instrues extras (92 + 15 = 107 instr. bsicas) Co-processador: 80287 Sem cache Memria virtual segmentada (apenas no modo protegido) Maior parte dos programas desenvolvidos para modo Real
CEFET-PE Arquitetura e redes de Computadores
14 registradores
do 8086, com 32 bits, e mais 2 regs. de segmento
44 instrues extras
107 + 44 = 153 instrues bsicas
CS DS SS ES ...
...
(PT)
...
PDE (32bits) CR3 31 12 11 0 Endereo de page frame Deslocamento
Tabelas (1024 x 32)
CEFET-PE Arquitetura e redes de Computadores
Endereo fsico
outras caractersticas Co-processador: 80387 (67 + 7 -1 = 73 instr. bsicas) Sem cache TLB:
pequena memria associativa que retm os ltimos e mais freqentes endereos de pgina acessado uma pequena cache de endereos fsicos
Reestruturao do 486
Modos real (8086), protegido e virtual86 16 registradores (os do 80386, tambm em 32 bits) Memria virtual segmentada e paginada
Comunicao com a memria em 64 bits Capacidade mxima de memria de 4 GByte 5 instrues extras (157 + 5 = 162 instr. bsicas) FPU: coprocessador aritmtico integrado Cache de 16 KByte (2 x 8 KByte)
FPU tambm em pipeline (mas no em paralelo) operao super-escalar: mais de uma instruo pronta em um ciclo de relgio
BTB
Buffer de instrues
FPU
reg. stack
FPU-pipe
com circuitos dedicados para soma, diviso e multiplicao
ALU ALU
Registradores
Cache Dados
CEFET-PE Arquitetura e redes de Computadores
5 instrues extras (162 + 5 = 167 instr. bsicas) Operao super-escalar 14 unidades internas Execuo fora de sequncia Execuo especulativa
PentiumII
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium 4
Lanado em novembro de 2000 Pipeline de 20 estgios (hyper pipeline) At 128 instrues em execuo (3 vezes mais que no Pentium III) Algoritmo melhorado para previso de desvios, com tabela de 4K Novo sistema de cache de nvel 1 Cache de execuo de 12 K micro-operaes (Execution Trace Cache) Cache de dados de 8 KBytes
Intel Pentium 4
Instrues SSE2 (Streaming SIMD Extensions 2) 144 novas instrues
67 instrues para vetores de pontos flutuante de preciso dupla (64 bits) 69 novas instrues MMX, para vetores inteiros de 128 bits (utilizando os registradores XMM) 8 instrues para controle de cache
Mercado de Processadores
Low End
Destinado construo de mquina de baixo poder computacional
Usurio iniciante
(Celeron D (Intel), Semprom (AMD)
Mid-Range
Destinado construo de mquinas de maior poder computacional
Ferramentas CAD, design house
Pentium IV (Intel), Athlon (AMD)
High-End
Destinado maquinas de alto poder computacional e compartilhamento
Servidores de Rede Gerenciamento de Clusters
Pentium HT (Intel), Athlon 64 D (AMD)
AMD
Desktop: AMD Athlon 64 FX, AMD Athlon 64 Server: AMD Opteron
Intel
Desktop: Intel Pentium 4 w/ HT, Intel Pentium 4 Extreme Edition Server: Intel Itanium 2, Xeon
Os processadores Celeron diferenciam-se dos processadores Pentium II, III e IV pela limitao das seguintes caractersticas:
Tamanho da Cache L2 Clock interno Clock do barramento externo
Baseado no
Cache L1
32KB
Cache L2
-
Tecnolo gia
0.25m
Barramento Externo
66MHz
Soquete
Celeron SEPP
Celeron A
Mendocino
Celeron PPGA
Mendocino
Celeron Coppermine
Coppermi ne
Celeron Tualatin
Tualatin
Celeron Willamette
Willamette
Celeron Northwood
Northwoo d
Celeron D
Prescott
Pentium II com ncleo Deschutes Pentium II com ncleo Deschutes Pentium II com ncleo Deschutes Pentium III com ncleo Coppermine Pentium III com ncleo Tualatin Pentium 4 com ncleo Willamette Pentium 4 com ncleo Northwood Pentium 4 com ncleo Prescott
Slot 1
32KB
128KB
0.25m
66MHz
Slot 1
32KB
128KB
0.25m
66MHz
Soquete 370
32KB
128KB
0.18m
66MHz / 100MHz
Soquete 370
32KB
256KB
0.13m
100MHz
Soquete 370
8KB
128KB
0.18m
400MHz
Soquete 478
8KB
128KB
0.13m
400MHz
Soquete 478
8KB
256KB
0.09m
533MHz
325
2,53 GHz
533 MHz
256 KB
478 ou 775
No
Processador lgico
AMD Athlon 64
AMD Athlon 64
Resumo Processadores AMD Atuais
Desktop
Semprom (Low End) Athlon 64 (Mid Range) Athlon 64 FX Athlon 64 X2
Notebooks
Athlon 64 Mobile Turion 64
Servidores
Opteron
AMD Athlon 64
1975 1979 1982 1991 1993 1995 1997 1999 2002
Am386
Am486
AMD-K5
AMD Athlon XP
8080A
8086
286
Transistores
5k 10um
29k
134k
275k 0.80um
1.200k
3.500k
9.300k 0.25um
22.000k 0.18um
37.000k 0.13um
0.35um
2003
2004
2005
+
100.000k Transistores
0.13um
->
0.09um
AMD Athlon 64
L1/L2
North Bridge
Bus PCI RAM
L3
AGP
RAM
UCP
Interface Grfica
Adaptador SCSI
REDE LAN
HD CD-ROM Scaner COM LPT
USB
HD CD-ROM Mouse
PCI I/O
Bus SCSI
Bus E / ISA
ROM BIOS
Super I/O
PCMCIA
Floppy
Interface Som
AMD Athlon 64
Novas caractersticas incorporadas
1MB L2 Cache Controlador de Memria DDR incorporado HyperTransport Channel Menor consumo de potencia Novo Core Processador Registradores em dobro Pipeline maior (10 12 estgios) Maior Look Aside Buffer (TLB)
AMD64 Architecture
Register Differences: AMD64 vs x86
AMD64
64-bit integer registers 48-bit Virtual Address 40-bit Physical Address
127 In x86 Added by AMD64
63
31
15
RAX
0
EAX
AH AL
79 0
S S E
MMX0
G P R
EAX
x 8 7
MMX7 MMX8
EDI R8
XMM8
EIP
MMX15
R15
Load 32 bit OS
Look at OS
64-bit
Load 64 bit OS
Melhor custo/benefcio
Sistemas mais confivies Preparado para software de 64 bits
DDR
PCI Express
South Bridge
PCI
IDE, FDC, USB, Etc.
I/O Hub
PCI
Athlon 64 X2 Opteron
Processador dual-core
Ncleos
Placa me
Processor Core
L1 Inst. Cache
Memory Controller
1MB
Bussing Unit
Crossbar Switch
Load/Store Unit
AMD64 CPU
L2 Cache
L1 Data Cache
Arquitetura Interna
128-bits wide 64-bits wide
L1 Inst. Cache
DRAM Controller
1MB
Bussing Unit
L2 Cache
128-bits wide
64-bits wide
Crossbar Switch
L1 Inst. Cache
L1 Data Cache
Memory Controller
Load/Store Unit
AMD64 CPU
L2 Cache
L1 Data Cache
1MB
Bussing Unit
Load/Store Unit
AMD64 CPU
Sistema Quad-processado
Soluo do problema de gargalo no chipset/FSB
AMD Opteron
AMD Opteron
DDR
Memory Expander
PCI-X
DDR
DDR
AMD Opteron
AMD Opteron
PCI-X
DDR
Memory Expander
PCI-X PCI-X
PCI-X Bridge
PCI-X Bridge
PCI-X
South Bridge
PCI
Other I/O
Other Bridge
I/O Hub
PCI
CPUCPU
CPU
SRQ Crossbar
Mem.Ctrlr
8 GB/S
SRQ Crossbar
Mem.Ctrlr
HT
HT
8 GB/S
8 GB/S
I/O Hub
PCI-E Bridge
PCI-E Bridge
O futuro do Microprocessador
Mais transistores, mais ncleos, mais threads
Mais ncleos Ncleos especializados Mais controladores integrados ...
CPU de 16 ncleos
CEFET-PE Arquitetura e redes de Computadores
Concluses
Processadores AMD atuais so mais indicados para aplicativos (Business), Jogos, Aplicativos 2D com melhor taxa de preo
Processadores Intel esto mais indicados para aplicativos 3D e Multitasking
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software Torres, G. Hardware Curso completo Weber, R. Arquitetura de computadores pessoais
Pesquisa: