Radeon 5670 – DX11 за всички

февруари 17th, 2010

Тестова система

Процесор: Phenom II X4 955
Памет: GSkill Pi-8800 @ DDR2-1066 5-5-5-15-2T
Дънна платка: Asus M4A78-E, AMD 790GX
Графични адаптери: ATI Radeon HD 5670 512 MB, Sapphire Radeon HD 5750 1 GB и 4670 512 MB
Твърди дискове: Hitachi P7K500, 500GB, Western Digital Caviar 800JJ, 80 GB
Захранване: Chieftec CFT-650-14C
Охлаждане: Noctua U-12P
Монитор: BenQ E2220HDP
Операционна система: Windows 7 Ultimate 32-bit
Драйвер: ATI Catalyst 8.69_RC3

За сравнение използвах предишното поколение от същия клас – 4670 както и модел от по-високия клас на компанията – 5750. Честотите и на двaта бяха стандартните. 5750 на свой ред е малко или повече представителен за производителността на 4850, която общо взето е в рамките на +/- 10% от неговите показатели. За съжаление не разполагах с модел на конкурецият от NVidiа.

Тестове и настройки

Миксът от приложения за тестване включва игри, синтетични и полусинтетични тестове. Избрах да използвам само 2 разделителни способности – 1440х900 и 1920х1080 (FullHD) с цел опростяване на процедурата и диаграмите. 1440х900 има почти идентичен брой пиксели с 1280х1024, тъй че е удобна отправна точка и за всеки притежаващ 17- или 19-инчов дисплей 4:3 дисплей. FullHD избрах вместо 1680х1050, тъй като в момента огромна част от новите монитори с диагонал от 20 инча нагоре използват нея, а е показателна и ако решите да използвате качествен LCD телевизор за игра. Ето и конкретните приложения:

3DMark Vantage: докато все още няма DX11 съвмести тест от този калибър, ще продължа да използвам популярното приложение за сравнение на показателите на графичните адаптери. Използвана беше настройката Performance.

Unigine Heaven: този тест е беазиран на реален графичен енджин, разработван от компанията Unigine и демонстрира възможностите на DX11, най-вече теселацията. По време на теста използвах максимални настройки с 16х анизотропна филтрация и изключен антиалайзинг.

Crysis Warhead: това остава все още една от най-тежките игри. Настройката беше Gamer при разделителни способности 1400х900 с и без включен антиалайзинг и  в 1920х1080 без АА. Резултатите са получени като теста е изпълнен трикратно, първият резултат е отхвърлен и са усреднени вторите два.

World in Conflict: една от първите DX10 игри, като все още остава достатъчно сериозно предизвикателство за графичните адаптери. Използвах настройката Very High, с усилена до 16х анизотропна филтрация. Използваните резолюции бяха същите като при Crysis Warhead. Резултата е усреднен от две изпълнения на вградения тест.

DIRT 2: втората част на автомобилния симулатор е една от първите игри интегриращи DirectX11 в графичния си енджин. Промените не са особено очебийни, но ги има. Играта беше тествана на максималните възможни настройки, като през един от файловете беше активирана работата с DX11 или DX9. Играта не поддръжа DX10. В DX9 бяха използвани познатите ви резолюции, а DX11 – 1400х900 и 1920х1080 без антиалайзинг. Тестът е достатъчно дълъг и с ниска варируемост на крайните резултати, затова е използвано едно изпълнение на вградения бенчмарк.

FarCry 2 е достоен наследник на известния си предшественик, който дълго време беше еталон за тестване на графичната производителност. Графичния енджин е отличен и на максимални настройки е доста натоварващ.  За тестовете използвах Ultra High профил с познатите ви резолюции – 1400х900 без АА, 1400х900 с 4х АА и 1920-1080 без АА. Резултатите са усреднени от 3 пускания.

S.T.A.L.K.E.R. : Call of Pripyat – поредния експанжън на играта, развиваща се във фантастична версия на зоната около Чернобилския реактор. За тестовете изполвах официалния бенчмарк, базиран на енджина на играта, който поддръжа DirectX 11. Тестовете бяха проведени на максимални настройки без използване на AA, като използвах и DirectX10.1, и DirectX11 режими на работа. Резолюциите са 1440х900 и 1920х1080 без АА. Тестът е с изключителн ниска варируемост и много голяма продължителност, затова резултатие са от едно изпълнение.

H.A.W.X: макар че сигурно феновете на реалистичните авиосимулатори едва ли ще им хареса използването точно на тази игра като представител на жанра, все пак я избрах заради удобния вграден тест. Тъй като играта е достатъчно лека използвах 4х антиалайзинг и за двете разделителни способности (1440х900, 1920х1080), като настройките бяха максималните възможни с включна подръжка на DirectX 10.1. Резултатите са усреденени от две пускания.

Rеsident Evil 5: на базата на популярния зомби сървайвъл хорор има много удобен тест, който използвах. Подобно на H.A.W.X., играта е достатъчно лека, за да се използва 4х антиалайзинг и за двете резолюции. Настройките за качеството бяха максимално възможните. Резултатът е от едно стартиране  на Fixed Benchmark, тъй като варируемостта е изключително ниска.

Dragon Age: Origins – новото отроче на Bioware е поредната много добра ролева игра на компанията, която предлага увлекателно преживяване и добра графика. Тестовете бяха проведни при максимални настройки с включен 4х АА, като с помощта на FRAPS се засичаха кадрите при обикола из пазара на град Denerim, едно от най-тежките места в играта. Резултатите са усреднени от по 3 преминавания за двете разделителни способности.

Battleforge: мултиплейърната реалновремева стратегия е третата игра, която може да използва DX11. За съжаление не успях да намеря начин да форсирам работата с друга версия на графичния API, за това  моделите от серията 5000 използват DX11, а 4670 използва DX10.

The Elder Scrolls IV: Oblivion – тази порядъчно старата ролева игра игра използвах за сравнение на производителността при използване на новите режими на антиалайзинг в моделите от серията 5000. Играта е с добавен Quarl’s Texture Pack III, тестовете се провеждаха само в 1920х1080. За моделите от серията 5000 използвах 4х антиалайзинг, като през драйверите променях режима между суперсемплинг, мултисемлинг и мултисемлинг + адаптивен антиалайзинг на прозрачните текстури. За 4670 използвах само мултисемплинг и мултисемплинг + адаптивен АА с настройка Quality, поради липсата на суперсемплинг. От драйверите беше активирана и 16х анизотропна филтрация. Тестът представляваше спускане от крепостта на град Chaydenhall и разходка из него, като резултата е усреднен от 3 изпълнения, а производителността се засичаше с FRAPS.

SiSoftware SANDRA – последните версии на този тестов пакет съдържат бенчмаркове за производителността на видеокартите при GPGPU изчисления, като се поддържат както собствените интерфейси на компаниите (CUDA  и STREAM) , така и универсалните OpenCL и Direct Compute. Макар че резултата е чисто синтетичен, той дава все пак някаква представа за съотношението на силите.

Media Show Espresso – още един тест за приложимостта на графичните адаптери за общи изчисления. Програмата се изполва за прекодиране на видеофайлове, като за целта се използва и помощ от графичния адаптер. За целта прекодирах 155 МБ клип от MPEG в MPEG4 формат.

Резултати

За начало да започнем със синтетичните тестове от 3DMark Vantаge:

Резултатите на теста за Texture Fillrate (Feature Test1)  са разделени на 60, за да дадат някакви смислени стойности, тъй като връщаните от програмата резултати са отвъд всякакви теоретични възможности на чиповете. 60 не е избрано произволно, а защото дава относително близки до предполагаемите стойности, т.е. може да се мисли че всъщност FT1 не мери производителността за секунда, а за минута:). Лесно се вижда в случая че въпреки 32-та си текстуриращи модула и относително високата си честота, 4670 е зад двата по-нови модела. Причината, освен наличието на само 16 интерполатора на текстурни адреси, вероятно се крие и в недостига на пропускателна способност, тъй като теста използва FP16 формат и не би трябвало да е ограничен от тях. Използването на интерполация от шейдерните процесори пък позволява на 5670 да разкрие пълните си възможности и да изпревари по-стария модел. Тестът за скорост на запълване пък е пряко свързан с пропускателната способност на паметта и логично резултатите са правопропорционални на нея. По тази причина 5750 не успява да “дръпне” много пред 5670, въпреки по-големите си функционални възможности. Parallax Oclusion Mapping пък симулира сложен шейдер, който имитира релеф върху голяма текстура. Въпреки относително добрите си изчислителни възможности на 4670, той отново изостава значително. Причината може би се крие в променената шейдерна архитектура и добавянето на глобална споделена памет в новите чипове. Разликата между другите два чипа е пропорционална на изчислителните им възможности, така че явно проблемът не е в драйвера или системата.

Втората част от тестовете акцентира на геометричната и изчислителната производителност на чиповете. В случая за ниските резултати на 4670 единственото оправдание е ниската пропускателна способност на паметта, тъй като 5670 не разполага с кой знае колко по-сериозни ресурси в това отношение. Интересна е относително малката разлика в двата геометрични теста (GPU Cloth, GPU Particles) между 5670 и 5750. Обяснението може да бъде както в пропускателната способност на паметта, особено в първия случай, така и в настигане на възможностите на сетъп енджина на графичните процесори, който и за двата може да обработва максимум до 1 полигон на такт. Изглежда че началната фаза на графичния конвейер може би започва да става тясно място за все по-бързите графични чипове. Perlin Noise е малко или повече ясен, като 4670 явно е спънат от производителността на паметта, докато другите два чипа успяват да разгърнат изчислителния си потенциал.

Като за начало какви изводи можем да направим? Преди всичко 5670 просто не е на нивото на 5750, което може и да се очаква. При все това, ако в някоя игра нещата опрат до геометричната производителност на чиповете можем да очакваме относително близки резултати. Засега това трудно може да се получи, но с навлизането на теселацията не е изключено да получим подобни ситуации. 4670 на свой ред очевидно е доста спънат от недостига си на пропускателна способност, така че за 5670 едва ли ще е трудно да го победи, въпреки неголямата разлика като функционални възможности. Потвърждение за това можем да получим и от обобщените резултати на 3DMark:

Фиг. 5

Unigine Heaven е първият тест който използва DX11 и възможностите за теселация на новия API. Той се базира на реалния игрови енджин Unigine, който се използва няколко игри, макар и не сред топ заглавия. Резултатите са както в DX10 режим, така и в DX11 за 5760 и 5750.  В първия случай съотношението между графичните адаптери е общо взето пропорционално на изчислителните им възможности, тъй като 4670 е относително близко до новия модел 5670 (около 15%), като дори при активирането на антиалайзинг разликата не се увеличава, т.е. нещата практически не опират в производителността на паметта, а в скоростта на самия чип. Активирането на DX11 без използването на теселация води до лек спад в производителността на моделите от серията 5000, а активирането на теселацията води до рязък спад с около 30% и за двата адаптера. Противно на очакванията ми явно проблемът в случая не е геометричната производителност на чиповете, а цялостно увеличеното натоварване от допълнителната детайли, в противен случай спдът нямаше да е равномерен. При все това даже 5750 не е способен да предостави достатъчно висока производителност дори в ниската резолюция. Тестът обаче е достатъчно тежък сам по себе си, за да си вадим генерални изводи за производителността в бъдещите игри.

Страници: Предишна 1 2 3 4 Следваща