Изчислителна производителност.
Като начало да разкрием „тайната“ на прекрасната производителност на AMD адаптерите в Dirt:Showdown.
Както виждате причината е в използването на Global Illumination алгоритъма. Но защо се получава толкова драстичен спад, след като без този осветителен вариант, производителността на адаптерите е сравнима. Уловката е, че той вкарва допълнителен пас, при който се използва Direct Compute за изчисляване на глобалното осветление. И както се вижда с увеличаването на натоварване на адаптера, този пас засилва тежестта си при NVidia адаптерите. Причината за това е, че докато изчислителните ресурси на чипа са драстично увеличени, то не може да се каже същото за достъпната им пропускателна способност към кеш паметта. И в момента в който алгоритъма не може да се справя само с помощта на локалните регистри, производителността на чипа рязко спада. При Tahiti това съвсем не е така, тъй като силно подобрената му кеш подсистема осигурява в някои ситуации до 5 пъти по-висока пропускателна способност за АЛУ. Това ще го видим и в другите тестове.
В Bitcoin и Luxmark изчисленията изоставането на GK104 е просто ужасяващо. Докато за Bitcoin едва ли някой е очаквал кой знае какво, въпреки че увеличения брой АЛУ би трябвало да намали разликата в производителността, то поне в Luxmark се предполагаше Kepler да се представя на задоволително ниво, поради сложния изчислителен алгоритъм. Както виждаме това изобщо не е така, като преимуществото на Tahiti е 3-4 пъти.
Криптографският тест на SiSoftaware SANDRA в голяма степен се съгласува с предходните тестове, като преимуществото на GCN архитектурата отново се измерва в пъти. При това ползването на CUDA не помага особено на Kepler, а в двата случая по-високи са резултатите с използване съответно на openCL и Direct Compute.
GPGPU изчисленията с единична точност Kepler най-накрая успява да вземе нещо като реванш, като при използване на Compite Shader се доближава плътно до Tahiti. В същото време при използване на OpenCL GCN архитектурата се представя значително по-добре, като Radeon HD 7950 е на нивото на ОC версията на Gigabyte в Compute Shader, а след овърклок разликата се разшираява дори до 50% предимство на AMD. При това сравняване CS за Nvidia със OpenCL за AMD, тъй като OCL резултата на Кеплер е доста по-слаб. CUDA в тоя случай се намира като производителност между двата други изчислителни API.
За съжаление резултатите с единична точност са единствения проблясък на Kepler, тъй като с двойна точност трагедията от предходните тестове се повтаря. Това донякъде не е учудващо, предвид факта че производителността на GK104 е 1/24 от производителността с единична точност, а на Tahiti е едва 1/4, но разликите са дори по-големи от това. В случая CUDA e най-ефективния API за Kepler, плътно следвана на OpenCL
Макар разбира се да не претендирам с особена изчерпателност на проведените тестове, все пак резултатите в този си вид са меко казано ужасяващи. Защо? Ами защото компанията от G80 насам ни проглушава ушите колко е важна производителността на графичните адаптери при общи изчисления и как това е едно безмерно предимство на тяхната архитектура и т.н., и т.н. Само че какво излиза – новият им “флагман” се представя просто трагично на фона на върховия модел на конкуренцията. Не просто това – в някои от тестовете той е дори по-слаб от предишния върхов модел на компанията, GeForce GTX580. И докато в предишните години ситуацията беше, че адаптерите на двете фирми си разменяха победи и загуби, то този път предимството изглежда изцяло и напълно на страната на GCN архитектурата на AMD. Нещо повече, съвременните игри започват все повече да използват GPGPU изчисления и то за важни части от графичния си енджин, а не просто за поразкрасени физически ефекти, както е с технологията PhysX на Nvidia. И както виждаме от Dirt: Showdown, Metro 2033 и Sniper Elite 2 това има потенциала да се превърне в бъдещо бедствие за Kepler.