Total de visualizações de página

deixe um OI

Como montar um PC - parte 3: Processadores modernos

O processadore o seu soquete

 

A primeira decisão a ser tomada por quem quer montar um computador é escolher o fabricante do processador: Intel ou AMD. A segunda decisão é o formado do processador. Já vai longe o tempo em que as placas de CPU serviam para qualquer processador, ou pelo menos para qualquer um entre os modernos. As placas de CPU produzidas entre 1995 e 1997 para a plataforma Soquete 7, permitiam instalar processadores Pentium, Pentium MMX, AMD K5, AMD K6, AMD K6-2, Cyrix 6x86, 6x86MX e M-II, além de outros menos comuns, como o Winchip, produzido pela IDT. Todos esses processadores eram uma espécie de cópia do Pentium, com os devidos melhoramentos. Os fabricantes de placas de CPU tinham pouco trabalho. Era fácil projetar placas adequadas para todos os processadores compatíveis com o Soquete 7.
A situação mudou com o lançamento do Pentium II, que utilizava um novo conector chamado Slot 1. Este conector era de uso proprietário, ou seja, a Intel não permitia a sua utilização por outros fabricantes. Novos processadores da Cyrix e AMD tiveram que continuar usando o Soquete 7, que sofreu melhoramentos e passou a ser chamado de Super 7.
A seguir a Intel criou uma variação do Slot 1, mas em forma de soquete. Era o chamado Socket 370. A AMD, por sua vez, criou um conector em forma de Slot, parecido com o utilizado pelo Pentium II, para usar com o seu processador Athlon. Era o chamado Slot A. Este mesmo conector foi posteriormente transformado em soquete, passando a se chamar Soquete A. Finalmente a Intel lançou um novo tipo de soquete para o seu novo processador Pentium 4. É chamado de Socket 423.
Desta forma os fabricantes de placas de CPU passaram a produzir placas diferentes, com conectores diferentes para os diversos processadores disponíveis:
Processador
Soquete ou Slot
Pentium 4
Socket 423
Pentium III
Socket 370
Celeron
Socket 370
Pentium III “antigo”
Slot 1
Celeron “antigo”
Slot 1
Pentium II
Slot 1
Athlon
Socket A
Duron
Socket A
Athlon “antigo”
Slot A
AMD K6, K6-2, K6-III
Super 7
Cyrix MII / 6x86 / 6x86MX
Super 7 ou Socket 7
AMD K5, Pentium, Pentium MMX
Socket 7
Winchip, Rise mP6
Super 7
Nesta tabela fazemos referência a processadores Pentium III, Celeron e Athlon “antigos”. Ao serem inicialmente lançados, esses processadores utilizavam o formato de cartucho, e eram encaixados no Slot 1 (Intel) e no Slot A (AMD). Os slots para processadores caíram em desuso, e passaram a ser novamente utilizados soquetes (Socket 370 e Socket A). Tanto a Intel como a AMD realizaram uma transição suave de slot para soquete. Mesmo depois de lançar as versões para soquete, continuaram produzindo durante algum tempo seus processadores em versões para slot.
Mesmo levando em conta processadores que utilizam o mesmo tipo de conector, encontramos diferenças relativas ao clock externo. Por exemplo, existem versões do Pentium III com clock externo de 100 MHz e versões de 133 MHz. Da mesma forma, as primeiras placas de CPU para Pentium III podiam operar apenas com clock externo de 100 MHz. As mais recentes operam a 133 MHz. À medida em que novos processadores operam com clocks externos mais elevados, novas memórias precisam ser usadas para acompanhar este aumento de clock. Ao mesmo tempo, os chipsets, que fazem entre outras coisas, a ligação entre o processador e a memória, também precisam acompanhar este aumento de clock. Podemos portanto encontrar placas de CPU com diferentes características, de acordo com os processadores aos quais são destinadas. Por exemplo:
Socket 370 e 133 MHz
Socket 370 e 100 MHz
Slot 1 e 133 MHz
Slot 1 e 100 MHz
Slot 1 e 66 MHz
Socket A e 133 MHz
Socket A e 100 MHz
Slot A e 100 MHz
A coisa não é tão complicada como parece. Ao comprar um PC novo, devemos preferencialmente optar pela tecnologia mais recente. Para a plataforma Intel, seria recomendada uma placa de CPU com Socket 370 e 133 MHz. O Socket 370 a 100 MHz e todas as versões do Slot 1 são considerados ultrapassados, do ponto de vista de um PC novo. Para a plataforma AMD, o ideal é uma placa com Socket A e 133 MHz. Lembre-se que os processadores Athlon e Duron utilizam clock dobrado, portanto 100 MHz tem o mesmo efeito de 200. Isto torna o Socket A com 100 MHz superior ao Socket 370 com 133 MHz. Por isso não podemos considerar tão obsoleto o Socket A com 100 MHz. A transição do Socket A de 100 para 133 MHz ocorreu entre 2000 e 2001. Já a transição do Socket 370 para 133 MHz ocorreu antes, entre 1999 e 2000.

Conversores de Slot 1 para Socket 370

Do ponto de vista eletrônico, o Socket 370 e o Slot 1 são semelhantes. Assim que surgiram os primeiros processadores para este soquete, não haviam disponíveis no mercado, placas de CPU apropriadas, apenas placas com Slot 1. Foram então produzidos adaptadores como o da figura 1. Este adaptador possui um Socket 370 é encaixado no Slot 1. Não é bom utilizar esses adaptadores de forma indiscriminada. Muitos deles não são certificados para operar a 133 MHz, e sim a 100 MHz. São bastante adequados para adaptar processadores Celeron (clock externo de 66 MHz) em placas de CPU com Slot 1. Processadores Pentium III com encapsulamento FC-PGA (para Socket 370) e clock externo de 100 MHz também funcionam bem. Se for realmente necessário utilizar um desses adadptadores para Pentium III FC-PGA com clock externo de 133 MHz, verifique na embalagem se é realmente certificado para esta velocidade.
Figura 3.1
Conversor de Slot 1 para Socket 370.
 
 
 
Bastante raros são os conversores para o processador Athlon (Slot A para Socket A). Com seus 100 MHz e Double Data Rate, o resultado é equivalente a um clock de 200 MHz. Sendo maior a freqüência, maiores são as dificuldades técnicas para produzir um adaptador confiável. A AMD desaconselha totalmente o uso de eventuais adaptadores.

Soquetes e processadores

A figura 2 mostra um soquete ZIF (Zero Insertion Force, ou Força de Inserção Zero). Este tipo de soquete é ideal para facilitar o encaixe e desencaixe do processador. Possui uma alavanca lateral que, ao ser levantada, permite a colocação ou a retirada do processador sem força sobre os seus pinos. No passado os soquetes não tinham este recurso. Era preciso aplicar força para encaixar cuidadosamente o chip, e utilizar chaves especiais para retirá-lo. Muitos usuários inexperientes dobravam acidentalmente os terminais dos chips durante este processo. Todos os soquetes para processadores das placas de CPU modernas são do tipo ZIF.
Figura 3.2
Um soquete para processador.
 
 
 
Os soquetes ZIF utilizados por diversos processadores são bastante parecidos. A diferença principal é o número de contatos.
Figura 3.3
Processadores com encapsulamento PGA.
 
 
 
A figura 3 mostra processadores (frente e verso) próprios para encaixe em soquetes ZIF. Seu encapsulamento é chamado PGA (Pin Grid Array). Seus contatos parecem uma espécie de “cama de pregos”. A maioria dos processadores modernos têm este formato, com pequenas diferenças no número de pinos.
Figura 3.4
Slot para processador e mecanismo de retenção.
 
 
 
A figura 4 mostra um slot para processadores que usam o formato de cartucho. Para dar melhor sustentação ao processador, usamos normalmente um mecanismo de retenção composto de duas peças plásticas que são montadas nas extremidades do slot.
Figura 3.5
Processador em forma de cartucho.
 
 
 
Finalmente vemos na figura 5 um processador com encapsulamento em forma de cartucho. É formado por uma placa de circuito na qual está instalado o processador propriamente dito e os chips que formam a cache L2. A placa é envolvida por um cartucho metálico que facilita a dissipação do calor. O principal motivo para o uso deste encapsulamento é o espaço necessário para abrigar o processador e os chips que formam a cache L2. Processadores mais modernos possuem a cache L2 on die, ou seja, integrada ao seu núcleo. Não é mais necessário o espaço adicional para os chips de memória cache L2, portanto o encapsulamento de cartucho caiu em desuso, voltando a ser usado o formato PGA.

Evolução da cache

Os primeiros processadores usados nos PCs não necessitavam de memória cache. A memória DRAM disponível na época era suficientemente veloz para aqueles processadores. O IBM PC XT, por exemplo, usava memórias com 250 ns de tempo de acesso, mas o seu processador operava com ciclos de 600 ns para realizar os acessos, portanto 250 ns era um tempo de acesso mais que satisfatório. Apenas computadores de grande porte, aqueles que custavam alguns milhões de dólares, utilizavam memória cache. A cache é uma pequena quantidade de memória veloz e cara que servia para acelerar o desempenho de uma grande quantidade de memória lenta e de custo menor.
Em 1989 surgiu o processador Intel 80486, o primeiro a utilizar cache. Com clock de 25 MHz e ciclos de 80 ns, necessitava de memórias com menor tempo de acesso, porém na época as mais rápidas eram de 100 ns, tempo muito grande para aquele processador. Os 8 kB de cache, localizadas dentro do próprio processador (cache interna) permitiam o funcionamento do processador com bom desempenho, mesmo com a memória DRAM mais lenta que o necessário.
Figura 3.6
Cache interna do 486.
 
Processadores 386 produzidos pela AMD na época (1991-1993) eram concorrentes do 486, até então produzidos apenas pela Intel. Assim como ocorria no 486, os processadores 386 daquela época também necessitavam de cache para melhorar o seu desempenho. Como o 386 não tinha cache interna, foram produzidas placas de CPU 386 com cache externa, ou seja, formada por chips SRAM (RAM estática) localizados na placa de CPU. Encontrávamos placas de CPU 386 com 8 kB, 16 kB, 32 kB, 64 kB e 128 kB de cache externa. Um processador 386 de 40 MHz e 128 kB de cache externa era praticamente tão veloz quanto um 486 de 25 MHz e 8 kB de cache interna, mas a opção do 386 era muito mais barata.
Figura 3.7
Cache externa de placas de CPU para 386.
A cache externa realmente acelerava bastante o desempenho, e assim foram criadas placas de CPU para processadores 486, também com cache externa. Eram comuns placas para 486 com 256 kB de cache externa, além dos 8 kB de cache interna existentes no processador.
Figura 3.8
Cache interna e externa.
 
Este esquema de dupla cache (interna e externa) utilizada em processadores 486 foi mantido em processadores mais modernos, como o 586, o Pentium e todos os demais processadores para Soquete 7, com exceção do AMD K6-III, que operava com 3 caches.

Cache L1 e L2

Os termos “cache interna” e “cache externa” caíram em desuso. Atualmente ambas as caches ficam localizadas dentro do próprio processador, portanto não faz mais sentido classificá-las como interna e externa. A cache interna é agora chamada de cache primária ou cache L1 (level 1 ou nível 1). A cache externa é agora chamada de cache secundária ou cache L2 (level 2 ou nível 2).

A cache do Pentium Pro

Na época em que o Pentium e o Pentium MMX eram utilizados em computadores de uso pessoal, a Intel produzia o Pentium Pro, utilizado em aplicações de nível profissional e em servidores (1995-1997). Este foi o primeiro processador a embutir a cache L2. Em outras palavras, dentro do processador Pentium Pro encontrávamos a cache L1 e 256 kB de cache L2.
Figura 3.9
Cache L2 do Pentium Pro.
 
O Pentium Pro era construído em uma pastilha de silício (die) com dupla cavidade, ou seja, como se fossem dois chips montados em um mesmo substrato. Um deles é o núcleo do processador, o outro é a cache L2. Este método permitiu a construção de uma cache L2 bastante veloz, entretanto tinha um elevado custo de produção. O núcleo do Pentium Pro utiliza a arquitetura Intel P6, usada nos processadores seguintes (Pentium II, Celeron e Pentium III). A cache L2 entretanto nunca mais foi produzida com o sistema de dupla cavidade.

A cache do Pentium II

O Pentium II foi lançado em 1997, utilizando um núcleo similar ao do Pentium Pro, ou seja, ele também usa a microarquitetura P6. A principal diferença está na sua cache L2. Ao invés de utilizar uma única pastilha de silício contendo o processador e a cache L2, o Pentium II é montado em uma placa de circuito, juntamente com chips de memória que formam a cache L2. O conjunto inteiro é montado em um cartucho metálico. Do ponto de vista do núcleo do processador, esta cache L2 é externa, mas considerando o cartucho como um todo, a cache L2 é interna. Para evitar confusão, os termos interna e externa não são mais usados, e em seu lugar usamos hoje, L1 e L2.
Figura 3.10
Cache do Pentium II e das primeiras versões do Pentium III e do Athlon.
 
Este sistema de cache L2 foi também utilizado nas primeiras versões do Pentium III e do AMD Athlon.

Cache L2 integrada no núcleo

Integrar a cache L2 no núcleo significa produzir um processador contendo na mesma base de silício, com uma única cavidade, o núcleo e a cache L2. Integrar a cache no núcleo foi possível com a adoção de tecnologia de 0,18 mícron, no lugar da antiga tecnologia de 0,25 mícron, possibilitando a construção de transistores menores, e em conseqüência, chips menores e com menor aquecimento. Além do menor custo, a cache L2 integrada ao núcleo do processador resulta em maior desempenho, já que os acessos à cache podem ser feitos com maior velocidade.
O primeiro processador a integrar a cache L2 no seu núcleo foi o Celeron. Posteriormente a mesma técnica passou a ser usada pelo Pentium III. A Intel utiliza vários nomes para diferenciar seus modelos de processador. O Pentium III versão Katmai era o original, que tinha a cache L2 formada por chips SRAM adicionais. A versão chamada Coppermine é a que integra a cache L2 no núcleo. Apesar de ter apenas 256 kB, contra os 512 kB do Pentium III Katmai, a nova versão do Pentium III oferece maior desempenho, pois sua cache L2 opera com um clock duas vezes maior.
Também os processadores Athlon passaram a utilizar cache L2 integrada no núcleo. Assim como ocorre com os processadores Intel, são usados nomes adicionais para designar as versões do Athlon. A versão com cache L2 embutida no núcleo é chamada de Thunderbird, ou simplesmente T-Bird. Ao mesmo tempo em que foi lançado o Athlon T-Bird, com 256 kB de cache L2 integrada no núcleo, foi também lançado o Duron, utilizando a mesma tecnologia. A diferença é a cache L2, que no Duron tem apenas 64 kB. Entretanto, sua cache L1 de 128 kB (encontrada tanto no Athlon quanto no Duron) oferece um bom desempenho, mesmo com uma cache L2 de apenas 64 kB.

Velocidades das caches

Um dos principais melhoramentos introduzidos nos processadores modernos foi o aumento de velocidade da cache L2. Quando um processador se torna mais rápido, a memória DRAM não necessariamente precisa acompanhar este aumento de velocidade (e na prática não acompanha), mas a cache L2 precisa acompanhar. Se o processador se tornar mais veloz mas a cache L2 mantiver velocidade constante, o desempenho será prejudicado.
Figura 3.11
Relação entre o processador e as caches.
 
A figura 11 mostra a relação entre o processador, as caches e a memória DRAM. Para que o sistema tenha um bom desempenho, deve ocorrer o seguinte:
a) O processador encontra na maior parte das vezes, os dados e instruções que precisa na própria cache L1.
b) Os dados a serem transferidos para a cache L1 estão na maior parte das vezes, localizados na cache L2
Desta forma, a cache L2 acelera o desempenho da DRAM. Ao mesmo tempo, a cache L1 acelera o desempenho da cache L2. Note que na figura estão indicadas as freqüências F1, F2 e F3.
F1: Velocidade na qual os dados trafegam entre a cache L1 e o núcleo
F2: Velocidade na qual os dados são transferidos entre as caches L1 e L2
F3: Velocidade de transferência entre a DRAM e a cache L2
Veja como ficam essas velocidades em alguns processadores produzidos em um passado recente:
Processador
F1
F2
F3
Pentium-200
200 MHz
66 MHz
66 MHz
AMD K6-2/300
300 MHz
100 MHz
100 MHz
AMD K6-2/500
500 MHz
100 MHz
100 MHz
Pentium II/400
400 MHz
200 MHz
100 MHz
Em todos os casos, o clock usado na transferência de dados entre a cache L1 e o núcleo do processador é o próprio clock do núcleo. Por exemplo, em um núcleo de 500 MHz, esta transferência é feita a 500 MHz.
Observe o que ocorre com os valores de F2, que representa a velocidade da cache L2. Nos processadores Pentium, K6-2 e similares, a cache L2 opera com freqüência fixa, igual à freqüência do barramento externo. Um K6-2/500 tem condições de processar dados mais rapidamente que um K6-2/300, entretanto ambos possuem caches L2 com velocidades semelhantes. Aumentar mais ainda o clock do processador e manter fixa a velocidade da cache L2 é a mesma coisa que usar em um carro de Fórmula 1, pneus de Fusca.
Finalmente observe o valor de F2 para o Pentium II. Este processador possui uma cache L2 capaz de transferir dados em uma velocidade maior que a do seu barramento externo. É usado um barramento dual, um de 100 MHz para acessar a DRAM e um de 200 MHz para acessar a cache L2. No caso geral, c cache L2 do Pentium II e das primeiras versões do Pentium III (Katmai) opera com a metade da freqüência do núcleo do processador. Um Pentium III/600, por exemplo, tem cache L2 operando a 300 MHz.
O aumento do valor de F2 foi uma das prioridades nos processadores lançados recentemente. Veja o que ocorre com os modelos mais novos:
Processador
F1
F2
F3
Pentium IIIE
F
F
100 MHz
Pentium IIIB
F
F/2
133 MHz
Pentium IIIEB
F
F
133 MHz
Athlon original
F
F/2, F/2.5, F/3
200 MHz
Athlon T-bird
F
F
200/266 MHz
Duron
F
F
200 MHz
Pentium 4
F
F
400 MHz
Na tabela usamos F para indicar a freqüência do núcleo do processador. Por exemplo, em um Pentium III/1000, F vale 1000 MHz. Observe que nos processadores mais modernos, F2 (freqüência da cache L2) é igual à freqüência do núcleo do processador. Núcleo a 1000 MHz significa cache L2 a 1000 MHz. Isto resulta em um grande aumento de desempenho, em comparação com versões mais antigas. Nas primeiras versões do Pentium III, bem como no Pentium IIIB (clock externo de 133 MHz), a cache L2 operava com a metade da freqüência do núcleo. Isto também ocorria com as primeiras versões do Athlon, a cache L2 operava com a metade, e até com 1/3 da freqüência do núcleo. Nas versões mais novas do Pentium III (Coppermine) e nas versões T-Bird do Athlon e Duron, a cache L2 também opera com a freqüência do núcleo. Esta é uma característica que será mantida em todos os processadores modernos: cache L2 em full peed., integrada no núcleo do processador (on-die). 
Finalmente observe na tabela que melhoramentos têm sido feitos na freqüência da DRAM. Novas tecnologias como DDR e RDRAM estão aos poucos sendo implantadas para tornar mais elevada a taxa de transferência dos dados que chegam da DRAM.

Cache L3

Durante aproximadamente um ano (meados de 1999 a meados de 2000), a AMD produziu o processador K6-III. Foi lançado apenas nas versões de 400 e 450 MHz, mas foi logo retirado de linha, devido ao seu custo de produção relativamente alto, o que dificultava a concorrência com os processadores Intel. O K6-III tinha uma cache L2 full speed integrada no seu núcleo. Processador a 450 MHz, cache L2 a 450 MHz. Seu desempenho era muito bom, bem mais veloz que o K6-2 e igualando-se ao Pentium III de mesmo clock. A AMD achou melhor descontinuá-lo e dedicar sua linha de produção ao Athlon.
O processador K6-III tinha no seu núcleo, caches L1 e L2. Podia ser instalado em placas de CPU para K6-2, que já tinham cache externa. Sendo assim, a cache existente na placa de CPU era de nível 3 (L3). A figura 12 mostra a relação entre as três caches do K6-III.
Figura 3.12
Relação entre as caches de um K6-III/400.
A figura 12 mostra a relação entre as caches de um processador AMD K6-III de 400 MHz. Estando o núcleo operando a 400 MHz, as transferências feitas entre o processador, a cache L1 e a cache L2 (internas) é feita na mesma freqüência. Para o modelo de 450 MHz, essas transferências são feitas a 450 MHz. Em ambos os modelos, as transferências entre a cache L2 e a L3 (externa), e entre a cache L3 e a DRAM são feitas a 100 MHz.

Pentium III

O Pentium III foi lançado em 1999, inicialmente como um melhoramento do Pentium II. Utilizava o encapsulamento em forma de cartucho chamado SECC2 (Single Edge Contact Cartridge 2), uma versão derivada do SECC, usado pelo Pentium II.
Figura 3.13
Pentium III com encapsulamento SECC2.
 
 
Os primeiros processadores Pentium III utilizavam o núcleo Katmai, semelhante ao do Pentium II, porém com pequenas diferenças, como as novas instruções SSE (Streamed SIMD Extensions), voltadas para processamento 3D e multimídia.
Figura 3.14
Pentium III com encapsulamento FC-PGA.
 
 
O novo núcleo Coppermine foi introduzido em meados do ano 2000. Além de utilizar a tecnologia de 0,18 mícron, o Coppermine traz a nova cache L2 integrada ao núcleo. Esta nova versão do Pentium III passou a ser produzida no tradicional encapsulamento SECC2 e também no novo FC-PGA (Flip Chip Pin Grid Array).

O Pentium III Katmai

Em março de 1999, a Intel lançou o Pentium III construído com o núcleo Katmai, o mesmo do Pentium II, acrescentando algumas alterações importantes:
  • Maiores clocks que o Pentium II
  • Novas instruções para multimídia e 3D (SSE)
  • Identificação do processador através de número de série
A mais relevante alteração foi a introdução das novas instruções SSE (Streaming SIMD Extensions). São instruções especializadas em operações comuns em aplicações de áudio, vídeo e geração de imagens tridimensionais. Sem essas instruções, o processador teria que utilizar combinações de outras instruções clássicas para realizar o mesmo trabalho. Essas instruções são SIMD (Single Instruction, Multiple Data – instrução única para múltiplos dados) facilitam os processamentos citados, pois envolvem a aplicação de cálculos fixos a grandes seqüências de dados. Essas instruções tem portanto o objetivo de aumentar a velocidade de processamento de aplicações de multimídia a geração de imagens 3D, apesar de também servir como resposta à tecnologia 3D Now! Da AMD, utilizada a partir do processador K6-2, desde 1998.
A inclusão de um número de série em cada processador Pentium III foi uma questão polêmica, tanto assim que ele foi eliminado no Pentium 4. Quando habilitado pelo usuário, este recurso permite ao processador informar um número único quer o identifica entre todos os demais processadores. Com ele tornam-se mais seguras as transações comerciais pela Internet, e torna mais simples e confiável a identificação de um determinado PC dentro de uma rede. Muitos usuários reclamamaram sobre outra questão, que é a privacidade. Como cada processador tem seu próprio número, o usuário pode deixar um “rastro” nos sites percorridos ao acessar a Internet (é claro, se este recurso estiver habilitado, e se o computador do usuário estiver carregado com software próprio para prestar esta informação). A outra preocupação é que o uso desta identificação se tornar padrão, os fabricantes de software poderão vincular o número de série do processador ao número de série dos seus softwares. Desta forma seria fácil detectar ou impedir o uso de cópias ilegais de software, um golpe mortal sobre a pirataria. A Intel oferece um software que permite ao usuário desabilitar o número de série. Na verdade o número não é apagado, apenas o processador é impedido de informá-lo. A desabilitação só tem efeito depois que é executado um novo RESET. Da mesma forma, para habilitá-lo é preciso executar um RESET para que volte a ser usado. Os novos BIOS de placas de CPU para este processador também permitem desativar o número de série, através do CMOS Setup.
Foi notável no ano de 98 a expansão da AMD com o seu processador K6-2. Esses processadores possuem dois conjuntos de instruções que se juntam às instruções do Pentium original: MMX (Multimedia Extensions, idênticas às da Intel) e 3D Now!, especializadas no processamento de imagens  3D (esta tecnologia foi mantida nos processadores mais novos da AMD, como o Athlon e o Duron). Tanto o Pentium MMX, o Celeron e o Pentium II possuem as instruções MMX, mas nada semelhante às instruções 3D Now! da AMD. As novas instruções introduzidas pela Intel rivalizam com a tecnologia 3D Now!. Passamos a ter a Intel com as tecnologias MMX e SSE (também chamada de MMX2), e a AMD com as tecnologias MMX e 3D Now!.
Para que os diversos programas já disponíveis façam uso do 3D Now! é preciso que seja instalado o pacote DirectX 6.0 ou superior. Para usar as novas instruções SSE do Pentium III é necessário instalar o DirectX 6.1 ou superior. O DirectX pode ser obtido em http://www.microsoft.com/directx. Periodicamente a Microsoft libera novas versões do DirectX. No Windows ME, por exemplo, era fornacido o DirectX 7.1. Poucos meses depois estava libarada a versão 8.0. Novas versões do DirectX visam dar suporte à utilização dos recursos encontrados nos novos processadores.
As placas de CPU para Pentium II podem ser usadas para instalar um Pentium III, desde que o barramento externo seja de 100 MHz. Placas para Pentium II mais antigas operavam com apenas 66 MHz (ex: chipset i440LX), e desta forma não aproveitavam todo o potencial do Pentium III. Logo a seguir, pequenas modificações de hardware e de BIOS foram feitas nas placas para Pentium II disponíveis na época, visando não apenas dar suporte ao Pentium III, mas aproveitar todo o seu potencial.
Também deve ser tomado cuidado com a questão do cooler. Existem coolers que são próprios para o Pentium II, e outros que são próprios para o Pentium III. O Pentium II possui na sua parte posterior uma chapa metálica para acoplar o ventilador e facilitar a dissipação de calor. O seu encapsulamento é conhecido como SECC. O Pentium III usa o SECC2, que não possui esta chapa metálica, ficando exposta a placa onde está o processador e a cache L2. Conjuntos de ventilador/dissipador para o Pentium III deverão conter a chapa metálica apropriada. Ao comprar um Pentium III, não esqueça também de pedir um cooler para Pentium III.
O Pentium III presta uma valiosa contribuição ao uso intensivo de sons, vídeos e imagens 3D em sites da Internet. Graças às avançadas instruções SSE para áudio e vídeo, é possível comprimir bastante esses elementos, tornando rápida a sua transmissão pela Internet. A descompressão, operação que envolve muitos cálculos, pode ser feita de forma mais rápida com as novas instruções do Pentium III. Desta forma imagens de melhor qualidade são transmitidas mais rapidamente e novamente exibidas em alta qualidade no computador receptor. As instruções 3D também agilizam a exibição de elementos 3D (VRML).

O Pentium III Coppermine

Sem dúvida um dos fatores que contribuiu (como sempre contribui) para a evolução do Pentium III foi a redução no tamanho dos minúsculos transistores que os formam. Ao ser lançado em 1997, o Pentium II usava a tecnologia de 0,35 mícron (ou seja, cada minúsculo transistor media 0,35 milésimos de milímetro). Já o Pentium II de 333 MHz introduziu a tecnologia de 0,25 mícron. Os atuais modelos utilizam a tecnologia mais recente, 0,18 mícron. A partir de meados de 2001, começou o uso da tecnologia de 0,13 mícron. Ao utilizar transistores menores é possível produzir processadores com clocks mais elevados e com menos aquecimento. Sem dúvida a elevada dissipação de calor é o maior obstáculo para atingir clocks elevados. Portanto ao reduzir o aquecimento, os fabricantes de processadores podem lançar modelos com clocks mais elevados, ainda mantendo níveis de aquecimento aceitáveis.
Outra vantagem das tecnologias de transistores menores é a redução no tamanho do chip. Ao ocupar menos espaço, torna-se possível acrescentar mais circuitos, ou seja, mais recursos. Desta forma foi possível acrescentar aos processadores, instruções MMX, instruções SSE e integrar a cache L2 ao núcleo do processador. Finalmente temos a vantagem da redução dos preços. Preços de processadores são em parte definidos por questões comerciais, mas também em parte por questões técnicas. Ao reduzir o tamanho de um chip, é possível produzir um número maior deles em cada lote. Isto resulta em redução do custo de produção que pode ser repassada ao usuário final.
Figura 3.15
Base de silício onde são construídos os chips.
A figura 15 mostra a base de silício (waffer) na qual são produzidos os chips. Esta base tem 20, 30 ou 40 cm de diâmetro, dependendo do equipamento usado na produção. Os pequenos quadrados estampados na base (mostrados em detalhe à direita) são os processadores. Quanto menor é o tamanho dos transistores, maior é o número de processadores que podem ser construídos em cada waffer, e desta forma, menor poderá ser o custo unitário. A adoção de tecnologias de produção com transistores menores permite lançar novas versões de processadores mais rápidos, com menor dissipação de calor e menor custo.
Outro melhoramento importante foi o aumento do clock externo, permitindo o uso de memórias mais rápidas. Desde o lançamento do Pentium, a comunicação entre o processador e o seu exterior (o que inclui a memória RAM) era feita com o clock de 66 MHz, ou seja, permitia realizar teoricamente até 66 milhões de acessos à memória por segundo. Em abril de 1998 o barramento do Pentium II passou a operar com até 100 MHz, possibilitando o uso das memórias classificadas como PC100. Em setembro de 1999 chegaram ao mercado modelos do Pentium III com clock externo de 133 MHz (ainda com o núcleo Katmai), permitindo assim o uso de memórias PC133. Se o clock externo do processador não tivesse aumentado, boa parte dos ganhos de desempenho seria colocada a perder. As versões de 233 a 333 MHz do Pentium II funcionavam com clock externo fixo em 66 MHz. Quanto mais elevado era o seu clock interno, mais difícil era obter desempenho mais elevado. Compare a relação entre clock interno e externo para esses processadores:
Processador
Clock interno
Clock externo
Multiplicador
Pentium II/233
233 MHz
66 MHz
3.5x
Pentium II/266
266 MHz
66 MHz
4x
Pentium II/300
300 MHz
66 MHz
4.5x
Pentium II/333
333 MHz
66 MHz
5x
Comparando os multiplicadores 3.5x e 5x do Pentium II/233 e do Pentium II/333, respectivamente, podemos afirmar que a capacidade do Pentium II/333 em buscar dados e instruções na memória manteve-se fixa (ou seja, aumentou 0%), enquanto a capacidade de processamento aumentou em 42%. Sendo assim, o aumento global no desempenho do processador não foi de 42%, fixou-se em um índice menor. Medidas de desempenho feitas com programas especializados mostraram que o desempenho do Pentium II/333 é apenas 35% maior que o do Pentium II/233, e não 42% como seria se o clock interno fosse o único determinante da velocidade de um processador. Isto mostra que para aproveitar integralmente o aumento do clock interno, é preciso melhorar o desempenho dos acessos à memória.
Esta situação foi melhorada com o lançamento de novos modelos do Pentium II e posteriormente do Pentium III, com clock externo de 100 MHz, 50% maior que 66 MHz. As primeiras versões do Pentium II a usarem o novo clock externo de 100 MHz foram as de 300, 350 e 400 MHz. Comparando o Pentium II/350 com o Pentium II/233, temos aumentos de 50% tanto no clock interno como no externo. Como resultado de ambos os clocks terem aumentado em 50%, o desempenho do Pentium II/350 é também 50% maior que o do Pentium II/233.
Novos modelos do Pentium II, que deu lugar ao Pentium III, foram lançados com clocks mais elevados. Em agosto/1999 tínhamos o Pentium III/600, ainda operando com o clock externo de 100 MHz. Usando o multiplicador 6x, o barramento de 100 MHz deste processador já era considerado lento em relação aos 600 MHz que usava internamente. Para melhorar a situação, foram lançadas em setembro/1999 as primeiras versões do Pentium III com barramento externo de 133 MHz. Com 600 MHz internos e 133 MHz externos, o multiplicador usado é 4.5x, menos ruim que o 6x usado na versão anterior.
Por mais que se procure desenvolver memórias mais rápidas, um problema sempre ocorre na evolução dos processadores: a velocidade das memórias não acompanha a mesma evolução que a velocidade dos processadores. No primeiro Pentium lançado, tanto o clock interno como o externo eram de 66 MHz, portanto o multiplicador era 1x. Nos modelos mais atuais do Pentium III são usados multiplicadores elevados como 6x e superiores. No Pentium III de 1000 MHz, o multiplicador é 7.5x. Isto significa que a velocidade do processador evoluiu 7.5 vezes mais que a velocidade das memórias. Felizmente a Intel e outros fabricantes de processadores utilizaram uma forma de melhorar este quadro: utilizar uma memória cache L2 mais rápida, operando com a mesma freqüência do núcleo do processador. Esta é uma das principais características do Pentium III Coppermine.
A versão Coppermine do Pentium III incorpora mais um melhoramento na cache L2. A Intel chama a tecnologia de Advanced Transfer Cache. Com a adoção do processo de fabricação com 0,18 mícron no lugar de 0,25 mícron, tornou-se possível incorporar a cache L2 ao próprio núcleo do processador, ao invés de utilizar chips SRAM independentes. Apesar de ter agora apenas 256 kB, a cache L2 do Pentium III é acessada com a mesma velocidade do núcleo, e não mais com a metade deste valor. Em um Pentium III /600E, o clock de acesso à cache L2 é de 600 MHz, e não de 300 MHz como no Pentium III/600. De certa forma, dobrar a velocidade de acesso à cache L2 compensa com vantagem a sua redução em tamanho pela metade. Melhor ainda, a transferência de dados entre a cache L2 e o núcleo do processador não é feito mais em grupos de 64 bits, e sim em grupos de 256 bits, ou seja, 4 vezes mais rápido. Comparando de forma simplificada, a cache L2 do Pentium III Coppermine tem tamanho duas vezes menor, mas sua taxa de transferência de dados para o processador é 8 vezes maior. O Pentium III/600 foi o último a ser produzido com a cache L2 “tradicional”, com 512 kB (núcleo Katmai), formada por chips SRAM e acesso em 64 bits. Todas as novas versões do Pentium III, de 600 MHz em diante, além das versões 550E, 533EB e 500E apresentam cache L2 na nova arquitetura. A tabela que se segue compara as caches L2 utilizadas nos últimos anos.
Processador
Tamanho da cache L2
Tipo de cache L2
Número de bits
Clock da cache L2
Pentium MMX
512 kB
Chips SRAM na placa de CPU
64
66 MHz
Pentium II e III original (Katmai)
512 kB
Chips SRAM no cartucho
64
Metade do clock do núcleo
Pentium IIIE (Coppermine)
256 kB
Integrado ao núcleo
256
Clock igual ao do núcleo
Você pode encontrar no Pentium III, sufixos como B, E e EB. O sufixo E indica que o Pentium III é um modelo construído com tecnologia de 0,18 mícron e com Advanced Transfer Cache de 256 kB (núcleo Coppermine). Da mesma forma, o sufixo B indica o clock externo de 133 MHz (pode ser núcleo Katmai ou Coppermine). Entretanto a ausência desses sufixos não indica a ausência desses recursos. Eles são usados pela Intel apenas para diferenciar entre modelos que possuem e que não possuem esses recursos. Por exemplo, o Pentium III de 700 MHz não possui versões com clock externo de 133 MHz, nem versões com cache L2 de 512 kB operando com a metade do clock do núcleo, por isso não utiliza sufixos. Já o Pentium III de 600 MHz possui 4 versões: 600, 600E, 600B e 600EB.
Figura 3.16
Versões do Pentium III com encapsulamento de cartucho.
 
 
 
A figura 16 mostra uma tabela com os modelos de Pentium III com encapsulamento de cartucho (SECC2), ou seja, para placas de CPU equipadas com o Slot 1, disponíveis até março/2001. Para cada um deles é indicado o clock interno, o clock externo, o tamanho e o tipo de cache. Note que existem versões Katmai, com cache L2 de 512 kB formada por chips SRAM, e versões Coppermine, com cache L2 de 256 kB integrada ao núcleo. Existem versões com barramentos de 100 e 133 MHz. Quando dois modelos têm o mesmo clock interno mas são produzidos com clocks externos diferentes (100 e 133 MHz), o sufixo “B” é usado para indicar a versão de 133 MHz.
Figura 3.17
Versões do Pentium III com encapsulamento FC-PGA.
 
 
 
A figura 17 mostra uma tabela com as versões do Pentium III com encapsulamento FC-PGA, ou seja, próprios para placas de CPU equipadas com o Soquete 370 (março/2001). Todos eles apresentam o núcleo Coppermine, mas encontramos versões com clocks externos de 100 e de 133 MHz. O sufixo B é usado para diferenciar a versão de 133 MHz, quando existem um modelo de mesmo clock interno e com o clock externo de 100 MHz.

Pentium 4

No final do ano 2000 a Intel lançou o processador Pentium 4, juntamente com o chipset i850. Este processador inaugura finalmente uma nova família de chips Intel de alto desempenho. A família anterior, formada pelos processadores Pentium Pro, Pentium II, Pentium III e Celeron, era baseada na microarquitetura P6. Cada um deles não era na verdade um projeto novo, mas um melhoramento do projeto anterior.
Figura 3.18
Processador Pentium 4 e chipset i850.
 
 
 
O Pentium 4 deverá substituir o Pentium III (assim como o Pentium III substituiu o Pentium II, como o Pentium II substituiu o Pentium MMX, como o Pentium substituiu o 486, etc.). Um Pentium 4 de 1.5 GHz tem velocidade de processamento quase duas vezes maior que a de um Pentium III/800.
O Pentium 4 foi lançado inicialmente nas versões de 1.4 e 1.5 GHz. Para aplicações em que é necessária alta produtividade, nas quais “tempo é dinheiro”, qualquer aumento de velocidade pode resultar em economia e maior faturamento.
Tecnicamente, o Pentium 4 é um marco importante. O Pentium II e o Pentium III eram basicamente melhoramentos do Pentium Pro, lançado em 1995, todos com a microarquitetura conhecida como P6. O Pentium 4 é um projeto novo, utiliza uma nova arquitetura chamada de NetBurst. É um projeto novo que começou do zero, e não uma sucessão de melhoramentos feitos em uma arquitetura já existente. São os seguintes os principais melhoramentos desta arquitetura:
  • Barramento externo de 400 MHz, contra 133 MHz do Pentium III
  • Cache L1 mais eficiente
  • Unidade lógica e aritmética com o dobro da freqüência do processador
  • 20 estágios pipeline, contra apenas 10 do Pentium III
  • 144 novas instruções para processamento de sons, imagens e gráficos 3D
Um PC baseado no Pentium 4 tem algumas características diferentes. Os gabinetes precisam ter furos adicionais para acomodar o novo processo de fixação do processador. O soquete é diferente do utilizado no Pentium III. Utiliza o formato ZIF, mas possui 423 pinos. As memórias precisam ser do tipo RDRAM para permitir o funcionamento a 400 MHz. São necessários coolers diferentes, e os gabinetes devem ter uma boa dissipação de calor, já que o Pentium 4 é um chip bastante quente.

Netburst x P6

Até o Pentium III, a arquitetura utilizada era a chamada “P6”, introduzida no final de 1995, com o Pentium Pro de 150 MHz. Este processador não foi um grande sucesso de vendas na sua época, pois era otimizado para executar programas de 32 bits, e naquela época o mercado de software era dominado por programas de 16 bits. O Pentium Pro era menos eficiente que o Pentium MMX na execução de programas de 16 bits, por isso seu uso foi praticamente restrito a servidores baseados no Windows NT. Com a popularização do Windows 95 e aplicativos de 32 bits, a microarquitetura P6 passou a ser mais vantajosa. Com diversas adaptações, foi lançado o Pentium II. A partir daí, vários melhoramentos foram introduzidos: barramento de 100 MHz, instruções SSE, barramento de 133 MHz, cache L2 duas vezes mais rápida, tudo isso acompanhado pelo aumento de clock, graças ao uso de tecnologias de fabricação que possibilitavam a construção de transistores cada vez menores. Inicialmente era usada a tecnologia de 0,35 mícron (1 mícron = 1 milésimo de milímetro), sendo substituída por 0,25 mícron, e mais recentemente por 0,18 mícron. Menor tamanho significa menor custo (já que o número de peças produzidas por cada matriz é maior) e menor dissipação de calor. O calor é o principal elemento a ser vencido para a obtenção de clocks elevados. Em 2001, a Intel passará a utilizar a tecnologia de 0,13 mícron.
O Pentium III/1000 é um produto resultante de uma seqüência de melhoramentos que começaram há 5 anos com o Pentium Pro/150. Isto significa que a microarquitetura P6 foi bastante prolongada, chegando a um clock quase 7 vezes maior que o utilizado no seu lançamento. Apenas por comparação, a microarquitetura P5 (Pentium e Pentium MMX) foi de 60 a 233 MHz (quase 4 vezes) durante seu ciclo de vida (1992-1997). A arquitetura do 486 foi submetida a clocks de 25 a 100 MHz (4 vezes) e a arquitetura do 386 operou inicialmente a 16 MHz, terminando em 40 MHz (2.5 vezes). Vemos portanto que a arquitetura P6 teve sua utilização bastante prolongada, o que resulta em problemas tecnológicos para a introdução de novos melhoramentos.
Finalmente a Intel passa a ter uma nova arquitetura, com espaço para crescer, obter clocks mais elevados e desempenho proporcionalmente maior. Esta arquitetura é chamada pela Intel de Netburst, e traz vários melhoramentos.

Tecnologia e clocks dos primeiros modelos do Pentium 4

As primeiras versões do Pentium 4 utilizam tecnologia de 0.18 micron. Seus clocks são respectivamente 1.4 e 1.5 GHz. Em breve (meados de 2001) a Intel passará a utilizar a tecnologia de 0.13 micron, reduzindo os preços e possibilitando atingir clocks mais elevados. As primeiras versões do Pentium 4 dissipam 52 e 56 watts, respectivamente. São chips extremamente quentes e requerem fontes, gabinentes e coolers especiais. Em geral os processadores mais rápidos dissipam entre 30 e 50 watts. Subir a dissipação de potência muito acima de 60 watts resulta em sérios problemas de aquecimento, portanto o lançamento de versões mais rápidas pode estar condicionado à adoção do novo processo de fabricação, com 0.13 micron.

Soquete de 423 pinos

Novas placas e novos chipsets. As placas de CPU para Pentium III, que utilizam o Socket 370, não aceitam a instalação de um Pentium 4. Não é apenas a questão do soquete, todo o funcionamento eletrônico do chip é diferente. Existem semelhanças com o Pentium III, como a arquitetura de 32 bits (IA-32) e as memórias de 64 bits. Fora isto, a eletrônica é totalmente diferente, exigindo chipsets próprios. O primeiro chipset disponível para o Pentium 4 é o Intel i850.

OBS: Atualmente o Pentium 4 usa soquete de 478 pinos.

Barramento de 400 MHz

O barramento do Pentium 4, opera com 64 bits, tal qual o do Pentium III, entretanto o clock é bem mais elevado: 400 MHz, contra apenas 133 MHz do Pentium III. Isto significa que enquanto o Pentium III acessa a memória na velocidade de 1.06 GB/s, o Pentium 4 atinge 3.2 GB/s. Este salto no desempenho da memória é muito importante, e bastante significativo. Durante os 5 anos de vida da arquitetura P6, o acesso às memórias foi de 60 a 133 MHz. Agora com 400 MHz, novas aplicações complexas poderão ser executadas em tempo real.

Cálculos em 2x

A unidade lógica e aritmética do Pentium 4 opera com o dobro da velocidade do seu núcleo. Isto é inédito em processadores. Operando a 1.5 GHz, um Pentium 4 é capaz de realizar 3 bilhões de adições por segundo. A maioria das operações matemáticas simples com números inteiros poderá ser feita em apenas meio período de clock.

SSE2

As instruções SSE introduzidas no Pentium III foram melhoradas, e passaram a ser chamadas SSE2. São uma evolução da tecnologia MMX, agora com 144 novas instruções que tornam mais rápidas operações complexas como descompressão de vídeo MPEG-2 (DVD), reconhecimento de voz, geração de gráficos 3D, exibição de vídeo, compressão MP3, processamento de sinais em geral. As operações SSE2 passam a utilizar números de ponto flutuante com 128 bits, contra os 64 bits anteriormente usados. Isto significa maior precisão nos cálculos sem gasto adicional de tempo. Para aproveitar esses novos recursos é preciso instalar no computador, o DirectX 8.0 ou superior.

Hyper Pipelined Technology

Todos os procesadores modernos executam suas instruções em modo pipeline. Ao invés de serem usadas unidades de execução complexas e lentas, são utilizadas várias unidades elementares, sendo cada uma delas mais simples e rápida, todas ligadas em série. É como uma linha de montagem. Imagine 20 pessoas ao mesmo tempo montando um automóvel. O grupo só poderia montar um carro de cada vez. Mais rápido seria colocar as pessoas em uma linha, cada uma responsável por uma etapa da montagem. Este é basicamente o princípio do pipeline. A arquitetura P6 em 10 estágios pipeline, o Pentium 4 possui 20, o que o torna potencialmente mais veloz na execução de instruções. Em outras palavras, cada “GHz” do Pentium 4 tem mais capacidade de processamento que cada “GHz” do Pentium III.

A nova cache L1

Este é um ponto que talvez seja melhorado em versões posteriores. A cache L1 do Pentium III tinha 32 kB (16k para dados e 16k para código). O Pentium 4 tem 8 kB de cache para dados e 12 kB de cache para código (trace cache). O uso de uma cache menor pode ser conseqüência do funcionamento mais eficiente da cache de código. Ao invés de armazenar instruções, a cache L1 do Pentium 4 armazena micro-operações, ou seja, instruções já decodificadas e divididas em operações elementares. Ao acessar dados na área de código da cache L1, o Pentium 4 não perderá portanto tempo repetindo essas etapas. Com mais eficiência, a cache L1 pode ter seu tamanho diminuído sem comprometer o desempenho do processador.

Cache L2

A cache L2 do Pentium 4 é similar à do Pentium III, com 256 kB, 256 bits e operando na mesma freqüência do núcleo.

Execução especulativa 33% mais eficiente que do Pentium III

Todos os processadores modernos fazem execução especulativa. Ao receberem uma seqüência de instruções da memória, passam a executar várias delas simultaneamente. Ocorre que algumas instruções dependem do resultado de outras, que podem ainda não ter sido concluídas. Este problema não ocorria com os processadores antigos, que executavam uma instrução de cada vez. Para permitir o paralelismo, o processador precisa “especular” qual será o resultado de operações ainda não terminadas. Várias vezes a especulação falha, e é preciso repetir aquele trecho de programa. O Pentium 4 sofreu melhoramentos que permitem “acertar” esta especulação em mais vezes que o Pentium III.

Chipset i850 e placa de CPU D850GB

O Pentium 4 requer novos chipsets e novas placas de CPU. Portanto de forma simultânea com o seu lançamento, a Intel colocou também no mercado o chipset i850 e a placa de CPU que o utiliza, a D850GB. A princípio é uma placa semelhante a outras, no padrão ATX, com slot AGP 4x e 5 slots PCI, interface ATA-100, conectores seriais, paralelo e USB. As principais diferenças estão na presença do soquete de 423 pinos e nos soquetes para memórias RDRAM. Essas memórias, ainda caras, tendem a substituir as atuais PC100 e PC133 usadas nos últimos anos. Logo a seguir, os fabricantes de placas de CPU passaram a produzir modelos para o Pentium 4, como é o caso da P4T, produzida pela Asus.

Sem número de série

O polêmico número de série introduzido no Pentium III, que possibilitava a identificação do processador, foi muito criticado pela comunidade de informática. Além de permitir maior segurança no comércio eletrônico, ele também possibilitava a identificação do usuário, comprometendo o anonimato e a privacidade. A solução foi incluir no BIOS um comando para desabilita-lo. Foi tão criticado que a Intel resolveu não usá-lo no Pentium 4.

Itanium

A Intel lançará em breve o processador Itanium, que não será abordado neste livro. A rigor, um computador equipado com este processador não poderá ser classificado como “PC”. Ele não é um processador classe x86, padrão utilizado nos PCs. Os processadores x86 foram originados no 8086 e no 8088 (este último usado no primeiro IBM PC), lançados no final dos anos 70, e que deram origem a todos os processadores usados nos PCs produzidos a partir de 1980. Processadores modernos como o Pentium III, Pentium 4, Celeron, Athlon e Duron são de classe x86. Isto significa que um programa usado em 1980 pode funcionar em um PC moderno, graças à compatibilidade com as instruções x86. Mais especificamente, os processadores modernos seguem à arquitetura IA-32 (Arquitetura Intel de 32 bits). Esta arquitetura foi inaugurada com o processador 386, em meados dos anos 80.
O Itanium inaugura uma nova arquitetura, a IA-64. As instruções executadas pelo Itanium são incompatíveis com as existentes na arquitetura IA-32. Isto significa que os programas para Windows, por exemplo, não funcionarão no Itanium, pelo menos de forma direta. Duas providências serão tomadas para que esta compatibilidade seja possível:
a) Todos os programas serão lançados em versões para Itanium
b) O Itanium poderá funcionar em modo de emulação IA-32
Teremos no futuro, versões diferentes do Windows, uma para IA-32 (Pentium III, Pentium 4, Athlon, etc.) e uma para Itanium. O mesmo ocorrerá com os utilitários e aplicativos. Este recurso já é utilizado pelo Windows NT/2000, sistemas criados para serem facilmente portados para outras plataformas. O sistema operacional Linux também poderá ser facilmente convertido para IA-64. Como o Itanium é destinado inicialmente a uso em servidores, é possível que apenas o Windows 2000 seja convertido, enquanto o Windows 9x/ME/XP continuará compatível apenas com a arquitetura IA-32.
O modo de emulação IA-32 é um recurso que permitirá ao Itanium processar programas criados para esta arquitetura. Sua eficiência será bastante reduzida ao operar neste modo, mas este recurso poderá permitir uma eventual transição entre as arquiteturas IA-32 e IA-64.
A arquitetura IA-32 é bastante arcaica. Os processadores modernos executam em alta velocidade, tarefas feitas de forma ineficiente. A alta velocidade compensa a ineficiência. Eles fazem rapidamente as mesmas coisas que faziam os processadores do final dos anos 70. A arquitetura IA-64 é na verdade uma forma nova, mais eficiente de processar dados, desenvolvida nos anos 90. É uma arquitetura mais adequada ao século 21. Quando os computadores equipados com o Itanium se tornarem realidade, você encontrará mais informações neste site. 

Athlon

Lançado em meados de 1999, este novo processador AMD trazia uma característica inédita: tomou o primeiro lugar da Intel na corrida pelo processador mais rápido para PCs. Um Athlon/550, por exemplo, era sensivelmente mais veloz que um Pentium III/550, e seu custo era menor. A partir daí, Intel e AMD começaram uma corrida em busca do primeiro lugar. A Intel lançava um modelo mais veloz, logo a seguir a AMD lançava um modelo ainda mais veloz, depois a Intel fazia o mesmo, e assim por diante.
Figura 3.19
Processador AMD Athlon para Slot A.
A primeira versão do Athlon usava tecnologia de 0,25 mícron e utilizava um encapsulamento de cartucho, similar ao do Pentium II e do Pentium III. O seu soquete, chamado Slot A, era bastante parecido com o Slot 1, entretanto não são compatíveis do ponto de vista elétrico. Não é possível encaixar um Athlon em um Slot 1, assim como não é possível encaixar um Pentium II/III em um Slot A. Ambos os conectores são parecidos, mas possuem chanfros em posições diferentes que impedem o encaixe do processador errado. Um técnico distraído pode conseguir encaixar um Athlon no Slot 1, se inverter a posição do processador. Se isto for feito, o processador obviamente não funcionará. O processador e a placa de CPU serão danificados.
No detalhe à direita da figura 19, que mostra processadores Athlon com o cartucho aberto, podemos observar que na placa interna existe o processador propriamente dito, na sua parte central, e dois chips de memória, que formam a cache L2.
Figura 3.20
Processador Athlon para Socket A.
 
 
Em meados de 2000, a AMD lançou uma nova versão do Athlon chamada Thunderbird (figura 20). Este processador possui no seu interior, 256 kB de cache L2 operando com a mesma freqüência do núcleo. A partir daí tornou-se desnecessário o uso do encapsulamento de cartucho, e passou a ser usado o encapsulamento PGA. Este processador deve ser instalado no chamado Socket A.
Apesar dos novos processadores Athlon terem encapsulamento PGA, a AMD ainda produz versões de cartucho. Podemos identificar facilmente um Athlon T-Bird de cartucho. Observe na figura 21 a descrição da numeração existente no processador. Os dígitos “2” e “4” na figura caracterizam o T-Bird. O “2” indica que a cache L2 tem 256 kB, e o “4” indica que o divisor de cache é 1:1, ou seja, a cache opera na mesma freqüência do núcleo. Esses processadores são mais velozes que os Athlons originais, e podem ser instalados em placas de CPU com Slot A. Como essas placas foram originalmente projetadas para os Athlons “antigos” (não T-Bird), o seu BIOS poderá apresentar a mensagem “Unknown Athlon Processor” (processador Athlon desconhecido) durante o boot. Este não reconhecimento preciso do processador não traz maiores conseqüências ao funcionamento do computador. O reconhecimento correto pode ser feito se realizarmos uma atualização no BIOS da placa de CPU.
Figura 3.21
Identificação de um processador Athlon T-Bird para Slot A.
 
 
 
O Athlon foi projetado para ser um processador compatível com as arquiteturas x86 / IA-32 e processar todos os sistemas operacionais e programas para PCs, como o Windows 9x/ME, Windows NT/2000, Linux, etc. Todos os programas que funcinam no Pentium, Pentium II/Pentium III e demais processadores Intel, funcionam também no Athlon. Apenas algumas atualizações cabem ser feitas nos sistemas operacionais. O Windows 2000, por exemplo, requer a instalação do Service Pack 1 para corrigir alguns problemas.
Na prática, um Athlon T-Bird tem desempenho praticamente igual ao de um Pentium III Coppermine de mesmo clock, mas seu preço é sensivelmente menor.
Tudo o que é ensinado neste livro a respeito de montagem, configuração e expansão de PCs, vale tanto para a linha Intel como para a linha AMD. As placas de expansão, as memórias, os gabinetes e fontes, discos rígidos, drives de CD-ROM e monitores que são usados para montar PCs baseados em processadores Intel, são os mesmos usados para montar PCs baseados em processadores AMD, como Athlon e Duron. Apenas as placas de CPU devem ser apropriadas para o processador utilizado. Mesmo assim essas placas de CPU, apesar de serem direcionadas para processadores diferentes, possuem características bastante semelhantes. Não conseguimos à primeira vista, perceber a diferença entre uma placa de CPU para processadores Intel e uma para processadores AMD. Apenas depois de examinar o soquete ou slot do processador percebemos a diferença.

Barramento de 200 a 400 MHz

O Athlon foi criado para operar com um barramento externo de 200 MHz, podendo ter este clock aumentado para até 400 MHz. Isto tornará possível a compatibilidade com novas memórias mais velozes a serem lançadas em um futuro próximo. Este barramento emprega um método chamado DDR (Double Data Rate), já utilizado por vários barramentos para obter clocks maiores. Em cada período de clock, o Athlon realiza duas transferências de dados, portanto cada período vale por dois. Com o clock de 100 MHz e usando DDR, o resultado é equivalente ao de um clock de 200 MHz. Com 133 MHz e DDR, o resultado é 266 MHz, e com 200 MHz e DDR, o resultado é o mesmo que 400 MHz. As primeiras versões do Athlon operavam com 100 MHz x 2. No final do ano 2000 foram lançadas versões de 133 MHz x 2. Note que um Athlon operando com 100 MHz e DDR produz um resultado melhor que um Pentium III usando 133 MHz, sem DDR.
Mesmo sendo o Athlon capaz de operar a 200 MHz externos, as primeiras placas de CPU para Athlon não suportavam memórias de 200 MHz, pois elas simplesmente não existiam. Os primeiros chipsets faziam a comunicação com o processador à taxa de 200 MHz (100 MHz com DDR), mas comunicavam-se com a memória a 100 ou 133 MHz (memórias PC100 e PC133). No início do ano 2001 começaram a surgir no mercado, placas de CPU com suporte a memórias DDR. Memórias DDR200 podem operar a 200 MHz, e memórias DDR266 podem operar a 266 MHz. Com o uso dessas novas placas de CPU e novas memórias, o Athlon finalmente poderá tirar o máximo proveito do seu veloz barramento externo.

Cache L1 de 128 kB

Caches maiores e com maior clock resultam em maior desempenho. Os processadores Intel tradicionalmente usam caches L1 de tamanho modesto, como 16 kB e 32 kB. Processadores AMD costumam usar caches L1 maiores como os 64 kB do K6-2 e do K6-III. A AMD colocou no Athlon, uma cache L1 de 128 kB. É um tamanho de cache bastante generoso. A conseqüência deste tamanho maior é que o processador encontrará com maior probabilidade, os dados e instruções que necessita na própria cache L1, sem a necessidade de utilizar mecanismos de acesso mais demorados para obter essas informações.

Unidade de ponto flutuante

A unidade de ponto flutuante, responsável pela execução de cálculos matemáticos complexos, é de extrema importância na execução de programas científicos, programas de CAD e engenharia, e em programas que geram gráficos tridimensionais. Antigamente, só engenheiros e cientistas precisavam de uma unidade de ponto flutuante. Hoje, todos os jogos 3D necessitam deste recurso. Por isso todos os processadores modernos possuem em seu interior, uma unidade de ponto flutuante, capaz de realizar operações matemáticas complexas com extrema velocidade.
Até pouco tempo, a unidade de ponto flutuante de processadores Intel era imbatível. Um Celeron/266, por exemplo, realizava cálculos de forma mais rápida que um AMD K6-III/450. Esta situação mudou com o processador Athlon. Sua unidade de ponto flutuante foi totalmente reprojetada visando máxima eficiência. Um Athlon realiza cálculos matemáticos complexos com velocidade de 10 a 15% maior que um Pentium III de mesmo clock.

Duron

Assim como a Intel produziu processadores Celeron como versões de menor custo e menor desempenho do Pentium II e Pentium III, a AMD produziu a partir do Athlon T-Bird, o AMD Duron. Tecnicamente a única diferença entre o Athlon e o Duron é a cache L2. O Athlon tem 256 kB, enquanto o Duron tem 64 KB. Todas as demais características são similares às do Athlon. Inclusive o aspecto externo do Duron é bastante parecido com o do Athlon, como podemos ver na figura 22.
Figura 3.22
Processador AMD Duron.
 
 
 
O AMD Duron destina-se ao mercado de PCs de baixo custo. Foi criado para substituir o K6-2, o processador que dominou este mercado entre 1998 e 2000. Ao mesmo tempo em que cessou a produção de chips K6-2, no final do ano 2000, aumenta a oferta de processadores Duron e de placas de CPU de baixo custo, com áudio e vídeo onboard, equipadas com Socket A.
A princípio qualquer versão do Athlon pode ter uma versão do Duron correspondente, mas na prática não é o que tem ocorrido. A AMD tem dado prioriadade em produzir Athlons com clocks mais altos e Durons com clocks mais baixos. Enquanto eram oferecidos Athlons entre 800 e 1200 MHz, o Duron era oferecido em versões de 700 a 850 MHz.
Deixando de lado a cache L2, que no Duron tem apenas 64 kB, todas as suas demais características são idênticas às do Athlon, como a cache L1 de 128 kB, o barramento externo de 200 MHz e a unidade de ponto flutuante de alto desempenho. É um excelente substituto de alto desempenho para o K6-2, voltado para o mercado dos PCs de baixo custo.
Note que o Duron não foi produzido em versões de cartucho. O Duron passou a ser produzido já na versão T-Bird, com encapsulamento PGA.

VIA Cyrix III

Apesar deste processador ser bastante raro no Brasil, não poderíamos deixar de fazer uma citação. Afinal a Cyrix sempre foi o terceiro maior fabricante de processadores para PCs. Durante seus áureos tempos, chegou a produzir processadores melhores que os da AMD e Intel. Era o Cyrix 6x86 PR200, mais veloz e mais barato que o Pentium-200. Produziu ainda processadores 6x86MX e M-II, ambos com tecnologia MMX. Infelizmente a Cyrix mudou de dono duas vezes ao longo dos útlimos anos. Foi comprada pela National Semiconductors, que praticamente a sucateou. Passou muito tempo sem novos lançamentos, até que foi finalmente comprada pela VIA Technologies. Atualmente o processador chama-se Via Cyrix III. Ele é na verdade uma espécie de Celeron, tendo alguns pontos superiores e outros inferiores. Os pontos superiores são:
  • Barramento de 66, 100 ou 133 MHz
  • Clocks mais elevados, como 700 MHz
  • Cache L1 com 128 kB
  • Instruções 3D Now e MMX
  • Utiliza o Soquete 370, compatível com placas para Pentium III e Celeron
  • Baixa dissipação de calor
  • Baixo custo
Seu ponto fraco é a cache L2, inexistente. Isso mesmo, a Cyrix preferiu aumentar o tamanho da cache L1 e acabar com a cache L2. Isso lembra os primeiros processadores Celeron, que também não tinham cache L2.
Figura 3.23
Processador VIA Cyrix III.
 
 
 
Esses processadores têm tudo para ocupar uma fatia no mercado de PCs de baixo custo, assim como ocorreu com antigos modelos da Cyrix, desde que, é claro, consigam produzi-los em quantidade. Pelo menos no Brasil é muito difícil encontrá-los.

Overclock

Overclock é uma técnica de envenenamento do processador, fazendo-o traba­lhar mais rápido que o normal. Por exemplo, é possível fazer um K6-2/450 trabalhar com 550 MHz, programando o seu multiplicador para 5.5x, ao invés de 4.5x, ou fazer um Pentium III/700 trabalhar em 933 MHz, programando o seu clock ex­terno para 133 MHz, ao invés de 100 MHz. Praticamente todos os processadores po­dem ser acelerados por overclock, mas é preciso que você conheça alguns fatos a respeito.
1) Nem sempre o overclock funciona
Se um processador foi projetado para trabalhar com um determinado clock, e o colocarmos para operar com um clock mais elevado, poderá apresentar comporta­mento errático.
2) O processador aquece mais
Com maior aquecimento, o processador pode durar menos, ou mesmo danificar-se.
3) Os demais circuitos podem não suportar a velocidade
Especificamente quando aumentamos o clock externo do processador (por exem­plo, usando 133 MHz ao invés de 100 MHz), os demais circuitos do computador po­derão não funcionar. Por exemplo, as memórias terão menos tempo para encontrar os dados requisitados, e poderão não conseguir fazê-lo. O barramento PCI, como opera com uma fração do clock externo do processador na maioria dos chipsets, também ficará acelerado, e as placas de expansão poderão apresentar erros.
4) Não é recomendado pelos fabricantes
Oficialmente, os fabricantes produzem chips em grandes quantidades, e testam cada um deles, determinando qual é o máximo clock que pode ser usado de forma confiável. Se for usado um clock mais elevado, a confiabilidade será menor.
Além desses argumentos contrários, existem argumentos favoráveis:
1) Se funcionar no meu PC, qual é o problema em usá-lo?
O overclock deve ser feito de forma experimental, individual, e de certo modo, artesanal. Algumas vezes é preciso trocar as memórias ou outras placas. Algumas vezes é preciso instalar um segundo ventilador. É muito difícil fazer isto em série, e é uma desonestidade quando é feito por revendedores de PCs, que oferecem um processador mais barato, operando com overclock. Mas se um usuário assume o risco de fazê-lo, e funciona bem, é se ele é dono do seu nariz, é difícil dar um ar­gumento contrário.
2) Melhorando a refrigeração, diminuem os riscos
Se o maior inimigo do overclock é o excesso de aquecimento, o uso de um se­gundo ventilador, um gabinete espaçoso, e mesmo a instalação do computador em um ambiente refrigerado, diminuem o perigo do overclock.
3) Se o processador durar 2 anos ao invés de 20, qual é o problema?
Os processadores podem durar muitos anos se usados em condições normais. Trabalhando em temperaturas elevadas, podem durar muito menos. Se um processa­dor queimar depois de 2 anos de uso, não será um grande problema. Um chip com 2 anos já está provavelmente obsoleto, ou então pode ser comprado por preços bastante baixos.
4) Os fabricantes enganam a velocidade
Existe o argumento de que na verdade todos os processadores, ou pelo menos quase todos, são capazes de operar com clocks mais altos. Por exemplo, a mesma forma produz o Athlon de 800, 850, 950 e 1000 MHz. Depois dos testes, seriam separados de acordo com a máxima velocidade suportada. Se todos puderem funcionar a 1000 MHz, alguns deles serão marcados com clocks menores apenas para poderem ser vendidos também nesta faixa de mercado. Ao comprar um des­ses chips de 800 MHz, por exemplo, poderíamos seguramente colocá-lo para trabalhar em 1000 MHz.
Este autor desaconselha o uso indiscriminado do overclock. Muitos usuários o fazem por sua própria conta e risco. Se você faz overclock de forma consciente, um amigo seu com pouco conhecimento técnico poderá gostar e fazer o mesmo, sem conhecer os prós e contras.
Thomas Pabst, brilhante autor do brilhante site Tom’s Hardware Page, recomenda, ensina e incentiva o uso do overclock. Sugerimos que os interessados no assunto não deixam de visitar o seu excelente site:

Overclock interno

Este tipo de overclock resulta em aumento na velocidade de processamento, e não altera o funcionamento das memórias, barramentos e demais circuitos do computa­dor. A velocidade mais alta existe apenas dentro do processador. Consiste em utili­zar um multiplicador acima do recomendado. Por exemplo, em um K6-2/450 o multiplicador usado deveria ser 4.5x, mas se for usado 5,5x, o clock interno será aumentado para 550 MHz. Um pouco mais de desempenho no processamento, mantendo em operação normal os demais circuitos do PC. No manual da sua placa de CPU existem instruções para a programação desses multiplicadores. Note que muitos processadores modernos são “travados”, ou seja, não aceitam a alteração dos multiplicadores.

Overclock externo

Este tipo de overclock atua diretamente sobre o clock externo do processador. Ao invés de usar os típicos 133 MHz, usamos opções como 140 ou 150 MHz, disponíveis na maioria das placas de CPU modernas. Conseguimos assim melhorar mais ainda o desempenho do PC, pois a memória cache, a memória DRAM, e todas as placas de expansão estarão operando com velocidade mais elevada. Como todo o computador é acelerado, é também maior a chance de ocorrerem incompatibilida­des. Podem ocorrer problemas nas transferências do disco rígido, no funciona­mento da placa de vídeo, erros na cache e na DRAM.

Overclock interno e externo

A velocidade fica ainda maior, mas a chance do processador funcionar fica ainda mais reduzida. Consiste em aumentar, não só o clock externo, como também o multiplicador.

 

0 comentários: sobre Como montar um PC - parte 3: Processadores modernos

Postar um comentário para Como montar um PC - parte 3: Processadores modernos

Related Posts Plugin for WordPress, Blogger...