Generativ AI i allmänhet och ChatGPT i synnerhet har fortfarande, efter åtskilliga månader sedan intresset tog fart, ett starkt grepp om både media och folk i allmänhet. En sak är klar: generativ AI, och ChatGPT, är här för att stanna. Det ställer ökade krav på datacenter och gör arbetet med hållbarhet svårare, skriver Sami Holopainen på Equinix.
Datacenterbranschen, både leverantörer och kunder, påverkas av intresset för generativ AI i allra högsta grad. Det gäller både byggandet och driften av datacenter. Enkelt uttryckt ställer generativ AI väldigt höga krav på prestanda och kapacitet. Det behövs mycket järn i racken i datacentren.
Ökade krav på hårdvara beror på att generativ AI använder sig av stora neurala nätverk och datamängder. Följden blir ökad elförbrukning, behov av effektivare kylning och även av mer kraftfulla nätverk. IT-proffs är medvetna om det här, vilket framgår av undersökningen Equinix 2023 Global Tech Trends Survey. 42 procent av deltagarna med ledande IT-befattningar anger att de inte är säkra på att den IT-infrastruktur de har tillgång till kan hantera ökade behov av AI-lösningar.
Här är exempel på skillnader mellan generativ och ”traditionell” AI som påverkar krav på hårdvara:
Generativ AI klassificerar inte bara data och identifierar mönster, utan skapar även nytt innehåll.
Generativa AI-modeller representeras av mycket större neurala nätverk än andra AI-modeller. Det handlar ofta om flera miljarder, eller till och med biljoner, parametrar.
Infrastrukturen för att träna modeller är större med generativ AI.
Det finns fler exempel på att lösningar för generativ AI är mer krävande, och även på att de i vissa fall är mindre krävande, än andra AI-lösningar. Men sammantaget behövs mer tätpackade serverrack, och därmed mer effektiv kylning, i datacenter för att använda generativ AI. Traditionell luftkylning räcker inte, det krävs mera innovativa lösningar, som vätskekylning. I förlängningen blir det en större utmaning att bygga hållbara datacenter.
Det finns flera utmaningar med generativ AI, till exempel vad gäller geografisk placering av datacenter. Eftersom generativ AI slukar mer energi än andra tillämpningar är det smart att placera datacenter nära billig energi. Men eftersom generativ AI kräver mycket data är det också smart att placera datacenter nära datakällor. Om en geografisk plats inte uppfyller båda kraven, billig el och snabb tillgång till data, blir placeringen en kompromiss.
En förmildrande omständighet är att modeller för generativ AI inte är lika känsliga för avbrott som många andra tillämpningar. Det är enklare att starta om en körning från ett tidigare läge. Det gör att design av datacenter kan förenklas, vilket resulterar i lägre kostnader.
Avslutningsvis påverkas även kraven på förbindelser. Eftersom modeller för generativ AI ofta använder många olika externa datakällor krävs det många snabba förbindelser av olika typer till datacenter där modeller utvecklas och körs. Det gäller inte minst om olika typer av data behöver hanteras, som video och bilder, förutom text.
Sammantaget ställer generativ AI nya krav på design och drift av datacenter. I de flesta fall handlar det om ökade krav som påverkar arbetet med hållbarhet för datacenter.
Skriven av: Sami Holopainen, Equinix