AMD

Zatvori

Nova generacija AMD AI akceleratora

AMD Instinct MI350P PCIe GPU nudi visokoučinkovit AI hardver koji se može implementirati unutar postojeće serverske infrastrukture.

Kako organizacije usvajaju umjetnu inteligenciju, mnoge otkrivaju da njihova infrastruktura teško prati promjene. Pokretanje umjetne inteligencije u oblaku je opcija, ali oblak može donijeti probleme s privatnošću i nepredvidive troškove.

Nadogradnja lokalne infrastrukture je još jedna mogućnost, ali podrška velikim platformama s GPU akceleratorima može zahtijevati skupe redizajne napajanja i hlađenja podatkovnih centara.

AMD je predstavio novu generaciju AI akceleratora – Instinct MI350P PCIe GPU, namijenjen organizacijama koje žele ubrzati implementaciju umjetne inteligencije bez velikih infrastrukturnih ulaganja. U trenutku kada sve više tvrtki prelazi iz faze eksperimentiranja u produkciju, ključni izazovi ostaju isti, troškovi clouda, pitanja privatnosti i kompleksnost modernizacije podatkovnih centara.

AMD ovim lansiranjem nudi alternativu – visokoučinkovit AI hardver koji se može implementirati unutar postojeće serverske infrastrukture.

Instinct MI350P dolazi u PCIe formatu s dvostrukim utorom, dizajniran kao „drop-in“ rješenje za standardne, zračno hlađene servere. To znači da tvrtke mogu implementirati AI inference radna opterećenja bez potrebe za promjenama u napajanju, hlađenju ili rack infrastrukturi.

Ovakav pristup posebno je relevantan za organizacije koje traže ravnotežu između performansi i ulaganja – nudeći više snage od CPU rješenja, ali bez potrebe za potpunim prelaskom na specijalizirane GPU platforme.

Prema AMD-u, sustavi mogu podržati do osam GPU akceleratora, što ih čini pogodnima za male, srednje i velike AI modele, uključujući inference i RAG pipelineove.

Jedan od ključnih naglasaka ovog lansiranja je optimizacija povrata ulaganja (ROI). MI350P donosi niz tehničkih unapređenja koja izravno utječu na performanse i operativne troškove, odnosno do 4.600 TFLOPS performansi u MXFP4 preciznosti, 144 GB HBM3E memorije s propusnošću do 4 TB/s, podršku za niske preciznosti (MXFP6, MXFP4) za veći throughput i optimizaciju putem sparsity tehnologije za INT8 i BF16 formate.

Ove značajke omogućuju organizacijama učinkovitiju obradu AI radnih opterećenja uz smanjene zahtjeve za energijom i hlađenjem.

MI350P je dizajniran za rad s širokim spektrom softverskih alata i frameworka, uključujući PyTorch, Kubernetes GPU Operator i cloud-native inference servise.

Poseban naglasak stavljen je na open-source AI stack bez licencnih troškova, koji omogućuje veću transparentnost i smanjenje operativnih troškova. Postojeća radna opterećenja mogu se migrirati uz minimalne izmjene koda, čime se ubrzava prelazak u produkciju.

AMD-ov novi GPU već ima snažnu podršku ključnih partnera iz IT industrije. Tvrtke poput Dell Technologies, HPE-a, Cisca, Lenova i Supermicroa ističu kako MI350P omogućuje bržu implementaciju AI infrastrukture uz visoku razinu učinkovitosti i skalabilnosti.

Istodobno, softverski partneri poput Red Hata, VMwarea (Broadcom), Akamaija i Nutanixa naglašavaju važnost otvorene i hibridne AI arhitekture koja olakšava prijelaz iz

„U eri u kojoj umjetna inteligencija postaje ključna poslovna komponenta, rješenja poput MI350P mogla bi imati važnu ulogu u ubrzavanju prijelaza s pilot-projekata na stvarne, skalabilne implementacije“, kaže AMD.