Още няколко думи за Bulldozer

ноември 24th, 2011

Преминаваме към неигровите приложения. Отново имам два ясни шаблона. От една страна са еднонишковите тестове, които не виждат абсолютно никаква разлика между 3-те конфигурации.Към тях може би трябва да добавим и PCMark 7, който при все че има многонишкови секции изглежда в голяма степен е ограничен от еднонишковите си блокове и/или други фактори, като дискова производителност и памет например. Донякъде резултатите са добри, като означават че в този случай двата клъстера не си пречат, т.е. споделянето е достатъчно ефективно реализирано. В същото време това означава и че двата клъстера по никакъв начин не си помагат при работа в еднонишков режим. В известен смисъл това е и оправдание на твърденията на AMD за 8-ядреността на Bulldozer.











Втората група тестове са многонишковите. В този случай 4C/4T конфигурацията изостава много сериозно зад 4C/8T конфигурацията. Докато това е напълно оправдано за целочислените тестове (7-zip, WinRAR, TrueCrypt), то изоставането в тежките тестове с плаваща запетая в голяма степен може да се каже, че не е очаквано. Изглежда че все пак единствения целочислен клъстер просто не може да насмогне да захранва с данни двата FMAC блока или може би обяснението за начина на разпределяне на нишките върху копроцесора не е съвсем прицизно и всъщност копроцесора реализира едновременно многонишково изпълнение базирано на времеделене, като нишките се редуват твърдо през такт. По този начин за всеки от клъстерите изглежда, че използва целия копроцесор, но работещ на половината тактова честота. Така че по време на работата с плаваща запетая производителността на 4C/4T конфигурацията е едва около 60% от тази на 4C/8T варианта. Това е една от причините за слабото представяне на процесора в еднонишковите изчислителни приложения. В същото време варианта със само две работещи ядра дава още по-слаби резултати, така че споделянето на копроцесора от двата клъстера явно не е безплатно.  Разликата достига 20-25%, което е в съгласие със заявленията на на AMD. По-интересният момент е, че целочислената производителност не изостава толкова, като е в рамките на до 10-11%.

Още няколко интересни факта – в редица случаи процесорът показва забележително добра скалируемост, като разликата между 2C/4T и 4C/8T в редица случаи достига 98-100% (Cinebench, POV-Ray), което означава на практика перфектна работа на всички ядра. Също отличен е и резултата на 4C/4T режима в Cinebench, който показва 3,98х подобрение от еднонишков към многонишков режим. Малко по-зле стоят нещата при архиваторите и кодирането на видео, но там причината е в зависимостта от производителността на паметта. На свой ред това доказва, че подсистемата на паметта на Bulldozer е достатъчна, за да задоволи изискванията му за работа с 8 нишки.

Страници: Предишна 1 2 3 4 Следваща