Ivy Bridge част 2 – Core i7 3770K

февруари 1st, 2013

Кеш архитектура

През последните години наблюдаваме разширяване на броя на нивата на кешовете в новите процесори. Докато преди години архитектурите доволстваха с две нива, в наши дни в повечето случаи и се ползват 3 и дори почват да се появяват и 4 нива. При Интел нещата са дори по-крайни, като за тях основното ниво на кеш паметта в новите им процесори е именно L3 (в терминологията на Intel това е означено като LLC или Last Level Cache/Кеш от последно ниво). Разбира се, запазени са базовия L1 кеш за данни с обем 32 КБ и 16-кратна асоциативност, който има латентност 4 такта, като L2 кеш паметта вече изпълнява по-скоро функцията на филтър на част от достъпите до L3, вместо основна роля както в оригиналната Core архитектура. Размера й е много малък, едва 256 KB (8 пъти по-малко от тази на модула в Bulldozer), но за сметка на това е изключително бърза, като достъпа до нея става за едва 12 такта (за сравнение при Bulldozer е от порядъка на 20 такта). L3 кеш паметта на свой ред обаче е огромните 8 MB, като латентността й варира между 26 и 31 такта и освен това работи на тактовата честота на процесорните ядра. Нещо повече, L3 кеш паметта е разделена на 4 дяла (по един на ядро), които имат на свой ред гранулярност от 0,5 МБ, като в зависимост от нуждите могат да бъдат деактивирани един или повече от тези блокове. Заедно с това Intel въвежда в масовите си процесори кръгова шина, която свърза отделните L3 кеш блокове, процесорните ядра, графичното ядро и така наречения системен агент, който съдържа контролерите на паметт, PCI Express шината и QPI шината за връзка с чипсета.

Кръговата шина не е нещо ново в света на компютрите, като естествено тя си има предимства и недостатъци. При процесорите на Intel тя за първи път по-масово беше използвана в Westmare поколението. Всъщност, за да сме точни, връзката между блоковете се осъществява не от една от цели 4 отделни шини – една за заявки, една за потвърждение на заявките, една за данни (с ширина 256 бита) и една за филтриране на заявките за кохерентност. Голямото предимство на кръговата шина е, че тя увеличава сложността си линейно на броя на свързаните консуматори, а не квадратично, както при по-масово използваните кросбар комутиращи мрежи. Това позволява и по-висока модулност на архитекутрата, като добавянето на нови ядра например се осъществява чрез просто добавяне на допълнителна „спирка” по кръговата шина („спирката“ е входно-изходен блок свързан с даден консуматор/източник на данни – ядро, кеш контролер и т.н.), докато това би наложило цялостно препроектиране на кросбар средата. Недостатъка на кръговите шини е в непостоянната латентност на достъпите, като в зависимост на това къде се намират данните се добавя поне по един такт на спирка по кръговата шина. Още един недостатък на реализацията на кръговата архитектура в случая на * Bridge процесорите е, че заради нуждата L3 кеша да работи на честотата на процесорните ядра, когато се използва, се налага и те на свой ред да се поддържат на същата честота, ако има друг потребител на данни, например графичното ядро. Като цяло обаче може да се каже че тези недостатъци не могат да неутрализират големите предимства откъм гъвкавост и пропускателна способност, които предлага реализацията на intel.

Заедно с това контролера на паметта в Ivy Bridge чиповете е сериозно подобрен, като макар официално максимално поддържната спецификация на паметта да е DDR3-1600, той разполага с делители и за доста по-високи честоти, до DDR3-2800, като могат да се използват както 100 МХц (200 MT/c), така и 133  МХц(266 МТ/С) стъпки. Заедно с това, отново благодарение на кръговата шина, всяко ядро, както и графичния адаптер, могат при нужда да използват пълните способности на контролера, нещо което не е възможно при процесорите на AMD, които са ограничени от отделните си шини за връзка с L3 кеша и контролера паметта.

Освен подобрения контролер на паметта, в Ivy Bridge Intel са развили и вградения в чипа PCI Express контролер, който вече поддръжа PCI Express 3.0, която удвоява пропускателната способност за такт спрямо 2.0 спецификацията и въвежда някои полезни функции за енергоспестяване. Заедно с това, новия конролер може ад се конфигурира и освен в популярните 16х/8х+8х режими за работа с един или два графични ускорителя, но също и като 8х+4х+4х, за работа с 3 видеоадаптера в SLI/CrossFire режими или за добавяне на някаква допълнителна функционалност, която има нужда от високоскоростна шина, като например SSD устройство, изпълнено като разширителна карта. Хубавото в случая е че благодарение на PCIe 3.0 поддръжката, ако използвате видеокарти от серията Radeon HD 7000 или GeForce GTX6xx, ще получите пропускателна способност еквивалентна на 16х+8х+8х конфигурация с PCIe 2.0 поддръжка, а този формат в общи линии предоставя достатъчно добро скалиране на многочиповите графични конфигурации.

За връзка с останалата част от системата се използват шина QPI, която представлява вариация на PCI Express. При *Bridge архитектурите, нейната базова честота е 100 МХц, като се използва множител 48х за предаване на данните, т.е. ефективно генерирайки 4800 MT/с. Ширината на шината е 20 бита, което дава максимална скорост на трансфер от 12 ГБ/с. В новата платформа обаче има и една много голяма уловка от страна на Intel  – тактовия генератор вече е интегриран в състава на чипсета, което би трябвало да улесни производителнтие на дънни платки, като намали разходите им за външен чип. За съжаление обаче това рязко усложнява живота на овърклокърите, като означава че всички вътрешни честоти в процесора и чипсета са вързани през някакъв множител с вградения тактов генератор и за съжаление далеч не всеки множител има възможност да се регулира. Практическо това означава край на овърклокването по шина на процесорите на Intel, тъй като честотите на SATА, PCI Express и някои други контролери са твърдо вързани към тази честота и на повечето дънни платки максимума, до който може да се регулира базовата честота, е в рамките на 105-108 МХц. Всичко би било не чак толкова страшно, ако процесорите бяха масово с отключени множители поне за ядрата/кеша и паметта. За съжаление това не е така, като в рамките на двете поколения компанията предостави само по 2 процесора с изцяло отключени множители (означени със суфикса K след продуктовия си номер), които се оказаха освен това и най-скъпите екземпляри на i7 и i5 моделите.

По съвместителство тези две серии са и единствените които използват Turbo Boost технологията, като някакви трохи към по-бюджетно ориентираните ентусиасти бяха подхвърлени под формата на ограничено отключване на максималния Turbo множител, който при не-K процесорите може да бъде увеличен с 4 стъпки над стандартния на дъна използващи някои от чипсетите на компанията (най-вече Z68/Z77).  При двуядрените модели от фамилиите i3/Pentium/Celeron Turbo Boost отсъства, както липсват и K-модели, което унищожава овърклокването при бюджетните модели като възможност. Тези 5-8% възможни от овърклок на шината просто не си струват заниманието и рисковете, като реалната полза за потребителите практически незабележима. Единствено при честотата на графичното ядро и паметта беше оставена малко повече свобода, но това не са сред най-привлекателните за овърклокърите цели.

22-нанометровата технология

През последните години Intel успя да се отдалечи драстично напред в технологиите за производство на процесори, като разликата във времето на усвояване на дадена технологична норма с AMD и вече отделеното му като отделно предприятие подразделение за производство нарастна от 9-12 на почти 24 месеца или приблизително толкова време, колкото отнема на самата Intel прехода между два процеса. По този начин компанията на практика води на конкурента си с цяло едно ниво в технологиите на производство което, логично, й дава огромно предимство като консумация на чиповете и възможности за нарастване на тактоват честота.

С 22-нанометровия процес нещата се усложняват още повече, като компанията за първи път започна да използва транзистори с триизмерна структура, вместо познатите досега двуизмерни транзистори. Основната разлика идва от използването на обемен дрейн, при който дрейна на транзистора е изграден като гребен, влизащ в гейта на транзситора, увеличавайки по този начин контактната площ. Това от една страна подобрява електрическите показатели на транзситора, като намалява утечките и от друга намалява самия размер на транзистора, като според компанията ползата е особено голяма по-ниски напрежения, като економията на енергия може да премине 30%, т.е. доближавайки се близко до спестяването, възможно от прехода между две цели стъпки на технологичния процес. Сумарно всичко това дава едно огромно предимство на Intel от гледна точка на технология на производството, ползите от която се равняват на едва ли не предимство от още половин-една процесна стъпка. Предимство, което конкурентите на Intel, не само от Global Foundries, но и от TSMC и другите контрактни производители на интегрални схеми, няма да са в състояние да компенсират поне още 3 до 5 години. А това, логично, означава че на конкурента на Intel, AMD, ще му е изключителмно трудно да се конкурира като чиста производителност и като консумация на чиповете си с огромния си съперник.

Чипът

Всъщност Ivy Bridge поколението се състои от поне 4 отделни чипа, като има вариции на темата с 4 и с 2 процесорни ядра, както и между вече описаните GT1 и GT2 версии на графичното ядро, които се оказва че имат достатъчно голяма разлика в размера си. За подобна модулност е помогнала както кръговата  шина, така и самото проектиране на чиповете, обособявайки достатъчно лесни за замяна отделни блокове. За да не навлизаме в излишни засега подробности, нека поговорим само за най-големия от чиповете, който включва 4 пълноценни ядра, както и GT2 версията на графичното ядро, т.нар. Ivy Bridge-HE-4 чип. При все че използва 1,4 млрд. транзистора, неговия размер е едва 160 кв.мм., което е наполовина на Bulldozer чипа на AMD, който има сходен брой транзистори, което демонстрира доста явно огромното технологично превъзходство на Intel пред конкурента й. Чипа разполага с пълната спецификация с 4 ядра, работещи с 8 нишки и с общо 8 MB L3 кеш. На негова база е изграден и най-бързият за момента модел на компанията за цокъл LGA1155, а именно i7-3770K. Базовата тактова честота на чипа е 3,5 ГХц с максимална турбо честота  от 3,9 ГХц, като TDP е 77 W. Официалната му цена  $332, което на нашия пазар се транслира като 590-600 лв с ДДС към момента на написването на статията.


Тъй като нямах много време да се запозная отделно с възможностите за овърклок на чипа, трябва да отбележа че без особени проблеми той покори 4,6 ГХз с повишаване на множителя до 46х и с повишаване на базовото напрежение с 0,125В, но за съжаление опитите ми за по-висока честота бяха неуспешни. За съжаление, отзивите в интернет говорят че новите модели за пръв път от доста време сеовърклокват по-зле от по-старите екземпляри от поколенито Sandy Bridge. Причината за това е прекалено малкия кристал на чипа за модел от подобен порядък, което причинява изключително плътен топлинен поток в рамките на процесорните ядра, което води до много бързо нарастване на температурита на процесорите. Изглежда все пак голямото технологично превъзходство не води само до плюсове. От Intel не са помогнали особено на овърклокърите, като за пръв път от доста време компанията използва обикновена термопаста вместо спойка за връзка на кристала на процесора с топлоразпределителната капачка. Според различни експерименти премахването на капачката, води до поне 7-10 градуса спад в температурата и повишаване на овърклокръския потенциал. Все пак 4,6 ГХз е една съвсем не лоша честота. Тя отговаря на 30% повишение над базовата и 18% над максималната турбочестота.

Страници: Предишна 1 2 3 4 5 6 7 Следваща