torsdag 30 juni 2011

Varför minne är den svaga länken i AMD: s senaste Fusion chip

Intressanta nyheter på url:http://feeds.arstechnica.com/~r/arstechnica/everything/~3/SiW2M9M0onE/another-look-at-amds-llano.ars:

Llano, AMD: s andra posten i sin Fusion-familj av processorer som kombinerar en CPU och GPU i samma dö, lanserade tidigare denna månad till måttligt positiva recensioner. Men fram tills nu var liten detalj känt om exakt hur AMD hade hanterat integreringen av CPU och GPU om Llano Die.

David Kanter vid RealWorldTech har gjort en del grävande och sätta ihop en djupgående look på Llano, jämför dess CPU / GPU integration som Intels Sandy Bridge. Kanters bit svarar på några frågor om Llano som togs upp av recensioner.

Bortsett från dess svaga CPU-kärna, är den största brist Llano att kommentarer betonades att processorns GPU kärna otroligt begränsas av minnesbandbredd. Det Cypress GPU som används för Llano var avsedd för ett diskret grafikkort, där det skulle ha tillgång till en gigabyte eller två av hög bandbredd, dedikerad GDDR-minne. På Llano, däremot var GPU aktier främsta minne med CPU, och resultatet att resultatet var bottlenecked allvarligt. Kanters artikel ger en inblick i varför detta är.

Istället för att länka Llano CPU och GPU med hög bandbredd ring bussen och låta dem dela med en L3-cache (den Sandy Bridge strategi) lämnade AMD de två delarna relativt osammanhängande internt. Istället CPU och GPU använder primärminne för att kommunicera utan att kopiera data från en plats till den andra. Vid uppstart, blir GPU tillgång till 512 MB primärminne i ett separat minne, processorn får resten av RAM-minne.

Internt finns det en liten dubbelriktad buss som ansluter GPU för att ställa av sammanhängande minne köer, och det finns en annan buss som ansluter GPU till DDR registeransvarige, men det är det. Processorn pratar med GPU med grafikdrivrutin och primärminne, och GPU kan prata med processorn använder koherent förfrågningar till speciella regioner i minne, men den senare är ganska långsam.

I alla då avsaknaden av en hög bandbredd intern länk mellan CPU och GPU, och beroendet av primärminne för kommunikation, innebär att Llano har grafikprestanda är ganska mycket kvävs av chip dual-channel DDR3-controller.

När det gäller framtiden för Llano, hade jag föreslagit att AMD kan överväga en pool av eDRAM att CPU och GPU skulle kunna använda för delat minne och on-die kommunikation, men Kanter ger ett mer realistiskt alternativ för att öka ett framtida Fusion-processorn grafikprestanda: använder 3D chip stapling teknik för att sätta en liten mängd minne i samma paket som processorn. Mängden minne skulle inte behöva vara mycket, även 256 hög bandbredd, låg latens minne skulle dramatiskt öka Llano prestanda.

Allt detta återigen visar hur stor av en binda NVIDIA är nu i, och varför bolaget har att göra ett försök på utrymme på skrivbordet med Project Denver. Sandy Bridge och Fusion innebära början till slutet för den diskreta GPU marknaden, som fortfarande är Nvidias bröd och smör.

Läs kommentarer till detta inlägg


Inga kommentarer:

Skicka en kommentar