GCN обаче не е само игрова производителност. Много по-важен е GPGPU аспекта. За това проведох няколко теста и в тази област.
„Копаенето“ биткоини придоби огромна популянрост през изминалата година, благодарение на отлична възвращемост на инвестицията. Макар нещата да се поуталожиха, това остава сигурно най-популярния начин да се натоварят графичните адаптери с общи изчисления. 7970 ви дава 45% прираст в производителноста, което е малко над чистата разлика в изчислителните възможноти. Тъй като това е ранна поддръжка има потенциал за бъдещо нарастване. Овърклокването носи отличен прираст, съизмерим с разликата в чесотата на ядрото (не е тайна, че копаенето на биткоини практически не зависи от производителността на паметта), като води до почти двойен прираст спрямо 6970.
SmallLuxPPT е тест на друга потенциална сфера на приложение на графичните адаптери – финален рендъринг на 3D сцени. Тук е дадено съотношението спрямо централния процесор, като ясно демонстрира къде са отишли допълнителните транзистори в чипа – прирастът спрямо 6970 е чудовишен, над 2 пъти! В същото време явно програмата е и лакома за пропускателна способност, като овърклокването води до 60% прираст спрямо стандартните честоти или до 3,5 пъти по-голяма производителност от 6970!
Накрая няколко теста с помощта на SiSoftware SANDRA. Използвах двата изчислителни GPGPU теста в програмата, като се опитах да сравнява разликата между OpenCL и Compute Shader архитектурата на DirectX. В първия тест, който изчислява фрактал Mandelbrot, се вижда че GCN се справя значително по-добре с OpenCL, докато VLIW4 – с Compute Shader. Докато при изчисленията с единична точност в CS разликата е едва 30%, то във всички останали случаи предимството на GCN е много по-голямо, като особено ярък е случая с двойната точност, където разликата е 60-70%. Съотнасянето на най-добрите резултати с единична точност (7970 в OCL срещу 6970 в CS) отново дава над 75% прираст. Овърклокването носи 30% отгоре, на практика колкото е разликата в честотата на ядрото и крайният резултат е над два пъти по-голям в сравнение с 6970.
Втората група тестове са криптиране и хеширане на данни. Този път и двете архитектури се справят по-добре с Compute Shader, като прирастът при хеширането е над 2,5 пъти. Именно в този случай е най-малка разликата, като GCN побежава VLIW4 „само“ с 83%. При криптрането обаче нещата вече отиват към абсолютна гавра, като разликата е над 6 пъти, Общата разлика в пропускателна способност е от порядъка на 3,5 пъти. Овърклокването дава стабилни 30% като увеличава разликата с 6970 до още по абсурдни нива.
След тези резултати надявам се да ви е станало ясно, че допълните транизстори в чипа съвсем не са отишли напразно. Макар пиковата производителност да не се различава чак толкова сериозно (около 40%), с GCN може да получите много по-голяма средна използваемост на архитектурата. На практика прирастът в процентно отношение е далеч, далеч отвъд увеличението като брой транзистори. Изобщо с Tahiti AMD разполага в ръцете си наистина убийствен чип за GPGPU приложения, но трябва да се справи адекватно и с предизвикателството на поддръжката от софтуерна страна. Все пак все по-масовото навлизане на OpenCL ще увеличава приложението на подобни чипове и извън игрите.