Witold Kepinski - 22 maart 2023

NVIDIA brengt AI naar elke branche

NVIDIA brengt AI naar elke branche image

Van AI-training tot implementatie, halfgeleiders tot softwarebibliotheken, systemen tot cloudservices, NVIDIA CEO Jensen Huang schetste hoe een nieuwe generatie doorbraken binnen handbereik zal worden gebracht. "ChatGPT is nog maar het begin."

NVIDIA-oprichter en CEO Jensen Huang kondigde een brede reeks partnerschappen aan met Google, Microsoft, Oracle en een reeks toonaangevende bedrijven die nieuwe AI-, simulatie- en samenwerkingsmogelijkheden bieden voor elke branche.

"De warp-aandrijfmotor is versneld computergebruik en de energiebron is AI", zei Huang in zijn keynote op de GTC-conferentie van het bedrijf. "De indrukwekkende mogelijkheden van generatieve AI hebben bedrijven een gevoel van urgentie gegeven om hun producten en bedrijfsmodellen opnieuw uit te vinden."

In een uitgebreide presentatie van 78 minuten die het vierdaagse evenement verankerde, schetste Huang hoe NVIDIA en zijn partners alles aanbieden, van training tot implementatie voor geavanceerde AI-services. Hij kondigde nieuwe halfgeleiders en softwarebibliotheken aan om nieuwe doorbraken mogelijk te maken. En Huang onthulde een complete set systemen en diensten voor startups en ondernemingen die racen om deze innovaties op wereldwijde schaal aan het werk te zetten.

Huang onderbrak zijn lezing met levendige voorbeelden van dit ecosysteem aan het werk. Hij kondigde aan dat NVIDIA en Microsoft honderden miljoenen Microsoft 365- en Azure-gebruikers zullen verbinden met een platform voor het bouwen en exploiteren van hyperrealistische virtuele werelden. Hij gaf een kijkje in hoe Amazon geavanceerde simulatiemogelijkheden gebruikt om nieuwe autonome magazijnrobots te trainen. Hij sprak over de opkomst van een nieuwe generatie razend populaire generatieve AI-diensten zoals ChatGPT.

En om de fundamentele aard van NVIDIA's innovaties te onderstrepen, legde Huang uit hoe, samen met ASML, TSMC en Synopsis, NVIDIA computationele lithografie- doorbraken een nieuwe generatie efficiënte, krachtige 2-nm halfgeleiders mogelijk zullen maken.

De komst van versneld computergebruik en AI komt precies op tijd, nu de wet van Moore vertraagt en industrieën krachtige dynamiek aanpakken - duurzaamheid, generatieve AI en digitalisering, zei Huang. "Industriële bedrijven racen om te digitaliseren en opnieuw uit te vinden in softwaregestuurde technologiebedrijven - om de ontwrichter te zijn en niet de ontwrichte", zei Huang.

Versnelling stelt bedrijven in staat deze uitdagingen aan te gaan. "Versnelling is de beste manier om vermogen terug te winnen en duurzaamheid en Net Zero te bereiken", zei Huang.

GTC: de Premier AI-conferentie

GTC, nu in zijn 14e jaar, is een van 's werelds belangrijkste AI-bijeenkomsten geworden. De conferentie van deze week bevat 650 toespraken van leiders zoals Demis Hassabis van DeepMind , Valeri Taylor van Argonne Labs , Scott Belsky van Adobe , Paul Debevec van Netflix , Thomas Schulthess van ETH Zürich en een speciale open haard chat tussen Huang en Ilya Sutskever, mede-oprichter van OpenAI, de maker van ChatGPT .

Meer dan 250.000 geregistreerde aanwezigen zullen zich verdiepen in sessies over alles, van het herstellen van de verloren Romeinse mozaïeken van 2000 jaar geleden tot het bouwen van de fabrieken van de toekomst, van het verkennen van het universum met een nieuwe generatie enorme telescopen tot het herschikken van moleculen om de ontdekking van geneesmiddelen te versnellen, tot meer dan 70 lezingen over generatieve AI.

Het iPhone-moment van AI

De technologieën van NVIDIA zijn fundamenteel voor AI, waarbij Huang vertelt hoe NVIDIA er was aan het begin van de generatieve AI-revolutie. In 2016 leverde hij met de hand aan OpenAI de eerste NVIDIA DGX AI-supercomputer - de motor achter de grote doorbraak in het taalmodel die ChatGPT aandrijft.

ChatGPT, dat eind vorig jaar werd gelanceerd, werd vrijwel onmiddellijk mainstream en trok meer dan 100 miljoen gebruikers aan, waardoor het de snelst groeiende applicatie in de geschiedenis is. "We zijn op het iPhone-moment van AI," zei Huang.

NVIDIA DGX-supercomputers, oorspronkelijk gebruikt als een AI-onderzoeksinstrument, draaien nu 24/7 bij bedrijven over de hele wereld om gegevens te verfijnen en AI te verwerken, meldde Huang. De helft van alle Fortune 100-bedrijven heeft DGX AI-supercomputers geïnstalleerd.

"DGX-supercomputers zijn moderne AI-fabrieken", zei Huang.

NVIDIA H100, Grace Hopper, Grace, voor datacenters

Het implementeren van LLM's zoals ChatGPT is een belangrijke nieuwe inferentiewerklast, zei Huang. Voor inferentie in grote talen, zoals ChatGPT, kondigde Huang een nieuwe GPU aan: de H100 NVL met dual-GPU NVLink.

Gebaseerd op de Hopper-architectuur van NVIDIA, beschikt de H100 over een Transformer Engine die is ontworpen om modellen te verwerken, zoals het GPT-model dat ChatGPT aanstuurt. Vergeleken met HGX A100 voor GPT-3-verwerking is een standaardserver met vier paren H100 met dual-GPU NVLink tot 10x sneller.

"H100 kan de verwerkingskosten van grote taalmodellen met een orde van grootte verlagen", zei Huang.

Ondertussen is cloud computing de afgelopen tien jaar met 20% per jaar gegroeid tot een industrie van $ 1 biljoen, zei Huang. NVIDIA ontwierp de Grace CPU voor een AI- en cloud-first wereld, waar AI-workloads GPU-versneld zijn. Grace is nu aan het samplen , zei Huang.

NVIDIA's nieuwe superchip, Grace Hopper, verbindt de Grace CPU en Hopper GPU via een supersnelle 900GB/sec coherente chip-to-chip interface. Grace Hopper is ideaal voor het verwerken van gigantische datasets zoals AI-databases voor aanbevelingssystemen en grote taalmodellen, legt Huang uit.

"Klanten willen AI-databases bouwen die enkele ordes van grootte groter zijn", zei Huang. "Grace Hopper is de ideale motor."

DGX de blauwdruk voor AI-infrastructuur

De nieuwste versie van DGX bevat acht NVIDIA H100 GPU's die aan elkaar zijn gekoppeld om als één gigantische GPU te werken. "NVIDIA DGX H100 is de blauwdruk voor klanten die wereldwijd AI-infrastructuur bouwen", zei Huang, die deelde dat NVIDIA DGX H100 nu in volle productie is.

H100 AI-supercomputers komen al online.

Oracle Cloud Infrastructure heeft de beperkte beschikbaarheid aangekondigd van nieuwe OCI Compute bare-metal GPU-instances met H100 GPU's.

Bovendien kondigde Amazon Web Services zijn aanstaande EC2 UltraClusters van P5-instanties aan, die kunnen worden opgeschaald tot 20.000 onderling verbonden H100 GPU's.

Dit volgt op de private preview-aankondiging van Microsoft Azure vorige week voor zijn H100 virtuele machine, ND H100 v5.

Meta heeft nu zijn door H100 aangedreven Grand Teton AI-supercomputer intern ingezet voor zijn AI-productie- en onderzoeksteams.

En OpenAI zal H100s op zijn Azure-supercomputer gebruiken om zijn voortdurende AI-onderzoek aan te drijven.

Andere partners die H100 beschikbaar stellen, zijn Cirrascale en CoreWeave , die beide vandaag algemene beschikbaarheid hebben aangekondigd. Daarnaast zijn Google Cloud, Lambda , Paperspace en Vultr van plan H100 aan te bieden.

En servers en systemen met NVIDIA H100 GPU's zijn verkrijgbaar bij toonaangevende servermakers, waaronder Atos, Cisco, Dell Technologies, GIGABYTE, Hewlett Packard Enterprise, Lenovo en Supermicro.

DGX Cloud: AI direct naar elk bedrijf brengen

En om DGX-mogelijkheden te versnellen voor startups en ondernemingen die racen om nieuwe producten te bouwen en AI-strategieën te ontwikkelen, kondigde Huang NVIDIA DGX Cloud aan , via partnerschappen met Microsoft Azure, Google Cloud en Oracle Cloud Infrastructure om NVIDIA DGX AI-supercomputers "naar elk bedrijf te brengen, van een browser."

DGX Cloud is geoptimaliseerd om NVIDIA AI Enterprise uit te voeren , 's werelds toonaangevende versnellingssoftwaresuite voor end-to-end ontwikkeling en implementatie van AI. "DGX Cloud biedt klanten het beste van NVIDIA AI en het beste van 's werelds toonaangevende cloudserviceproviders", aldus Huang.

NVIDIA werkt samen met toonaangevende cloudserviceproviders om DGX Cloud-infrastructuur te hosten, te beginnen met Oracle Cloud Infrastructure. Microsoft Azure zal naar verwachting volgend kwartaal DGX Cloud gaan hosten, en de service zal binnenkort worden uitgebreid naar Google Cloud en meer.

Deze samenwerking brengt het NVIDIA-ecosysteem naar cloudserviceproviders en vergroot tegelijkertijd de schaal en het bereik van NVIDIA, aldus Huang. Ondernemingen kunnen maandelijks DGX Cloud-clusters huren, zodat ze snel en gemakkelijk de ontwikkeling van grote trainingsworkloads met meerdere knooppunten kunnen opschalen.

Superchargerende generatieve AI

Om het werk te versnellen van diegenen die generatieve AI willen gebruiken, kondigde Huang NVIDIA AI Foundations aan , een familie van cloudservices voor klanten die aangepaste LLM's en generatieve AI moeten bouwen, verfijnen en gebruiken, getraind met hun eigen gegevens en voor domeinspecifieke taken.

AI Foundations-services omvatten NVIDIA NeMo voor het bouwen van op maat gemaakte tekst-naar-tekst generatieve modellen ; Picasso, een dienst voor het maken van visuele taalmodellen voor klanten die modellen op maat willen bouwen, getraind met gelicentieerde of eigen inhoud ; en BioNeMo, om onderzoekers te helpen in de medicijnontdekkingsindustrie van $ 2 biljoen.

Adobe werkt samen met NVIDIA om een reeks AI-mogelijkheden van de volgende generatie te bouwen voor de toekomst van creativiteit.

Getty Images werkt samen met NVIDIA om verantwoorde generatieve tekst-naar-beeld- en tekst-naar-video-basismodellen te trainen.

Shutterstock werkt samen met NVIDIA om een generatief tekst-naar-3D-basismodel te trainen om het maken van gedetailleerde 3D-assets te vereenvoudigen.

Medische vooruitgang versnellen

En NVIDIA heeft aangekondigd dat Amgen de diensten voor het ontdekken van geneesmiddelen versnelt met BioNeMo. Daarnaast zijn Alchemab Therapeutics, AstraZeneca, Evozyne, Innophore en Insilico allemaal early access-gebruikers van BioNemo.

BioNeMo helpt onderzoekers bij het maken, verfijnen en bedienen van aangepaste modellen met hun eigen gegevens, legde Huang uit.

Huang kondigde ook aan dat NVIDIA en Medtronic , 's werelds grootste leverancier van zorgtechnologie, gaan samenwerken om een AI-platform te bouwen voor softwaregedefinieerde medische apparaten. De samenwerking zal een gemeenschappelijk platform creëren voor Medtronic-systemen, variërend van chirurgische navigatie tot robotondersteunde chirurgie.

En vandaag heeft Medtronic aangekondigd dat zijn GI Genius-systeem, met AI voor vroege detectie van darmkanker, is gebouwd op NVIDIA Holoscan, een softwarebibliotheek voor real-time sensorverwerkingssystemen, en rond het einde van dit jaar zal worden verzonden.

"De wereldmarkt voor medische instrumenten met een waarde van 250 miljard dollar wordt getransformeerd", zei Huang.

Snellere implementatie van generatieve AI-applicaties

Om bedrijven te helpen bij het implementeren van snel opkomende generatieve AI-modellen, kondigde Huang inferentieplatforms aan voor AI-video, beeldgeneratie, LLM-implementatie en aanbevelingsinferentie . Ze combineren NVIDIA's volledige stapel inferentiesoftware met de nieuwste NVIDIA Ada-, Hopper- en Grace Hopper-processors, waaronder de NVIDIA L4 Tensor Core GPU en de NVIDIA H100 NVL GPU , beide vandaag gelanceerd.

• NVIDIA L4 voor AI Video kan 120x meer AI-aangedreven videoprestaties leveren dan CPU's, gecombineerd met 99% betere energie-efficiëntie.

• NVIDIA L40 voor het genereren van afbeeldingen is geoptimaliseerd voor grafische en AI-ondersteunde 2D-, video- en 3D-beeldgeneratie.

• NVIDIA H100 NVL voor grootschalige implementatie van taalmodellen is ideaal voor het op grote schaal implementeren van enorme LLM's zoals ChatGPT.

• En NVIDIA Grace Hopper for Recommendation Models is ideaal voor graph-aanbevelingsmodellen, vectordatabases en graph neurale netwerken.

Google Cloud is de eerste cloudserviceprovider die L4 aan klanten aanbiedt met de lancering van zijn nieuwe G2 virtuele machines, die vandaag beschikbaar zijn in privépreview. Google integreert ook L4 in zijn Vertex AI-modelwinkel.

Microsoft, NVIDIA brengen Omniverse naar 'Honderden Miljoenen'

Met de onthulling van een tweede cloudservice om ongekende simulatie- en samenwerkingsmogelijkheden voor ondernemingen te versnellen, kondigde Huang aan dat NVIDIA samenwerkt met Microsoft om NVIDIA Omniverse Cloud, een volledig beheerde cloudservice, naar de industrieën van de wereld te brengen .

"Microsoft en NVIDIA brengen Omniverse naar honderden miljoenen Microsoft 365- en Azure-gebruikers", zei Huang, en onthulde ook nieuwe NVIDIA OVX-servers en een nieuwe generatie werkstations aangedreven door NVIDIA RTX Ada Generation GPU's en Intel's nieuwste CPU's die zijn geoptimaliseerd voor NVIDIA Omniverse .

Om de buitengewone mogelijkheden van Omniverse te laten zien, NVIDIA's open platform gebouwd voor 3D-ontwerpsamenwerking en digitale tweelingsimulatie, deelde Huang een video die laat zien hoe NVIDIA Isaac Sim, NVIDIA's robotsimulatie- en synthetisch generatieplatform, gebouwd op Omniverse, Amazon helpt tijd en geld te besparen met full-fidelity digitale tweelingen.

Het laat zien hoe Amazon werkt aan het choreograferen van de bewegingen van Proteus, de eerste volledig autonome magazijnrobot van Amazon, terwijl het bakken met producten van de ene plaats naar de andere verplaatst in de spelonkachtige magazijnen van Amazon, samen met mensen en andere robots.

Digitalisering van de auto-industrie van 3 biljoen dollar

Om de omvang van het bereik en de mogelijkheden van Omniverse te illustreren, verdiepte Huang zich in de rol van Omniverse bij het digitaliseren van de auto-industrie van $ 3 biljoen . Tegen 2030 zullen autofabrikanten 300 fabrieken bouwen om 200 miljoen elektrische voertuigen te maken, zei Huang, en batterijfabrikanten bouwen nog eens 100 megafabrieken. "Digitalisering zal de efficiëntie, productiviteit en snelheid van de industrie verbeteren", aldus Huang.

Wat betreft de acceptatie van Omniverse in de hele industrie, zei Huang dat Lotus Omniverse gebruikt om lasstations virtueel samen te stellen. Mercedes-Benz gebruikt Omniverse om assemblagelijnen voor nieuwe modellen te bouwen, optimaliseren en plannen. Rimac en Lucid Motors gebruiken Omniverse om digitale winkels te bouwen op basis van daadwerkelijke ontwerpgegevens die hun auto's getrouw weergeven.

In samenwerking met Idealworks gebruikt BMW Isaac Sim in Omniverse om synthetische gegevens en scenario's te genereren om fabrieksrobots te trainen. En BMW gebruikt Omniverse om operaties in fabrieken over de hele wereld te plannen en bouwt een nieuwe fabriek voor elektrische voertuigen, volledig in Omniverse, twee jaar voordat de fabriek wordt geopend, zei Huang.

Afzonderlijk. NVIDIA heeft vandaag aangekondigd dat BYD, 's werelds toonaangevende fabrikant van nieuwe NEV's voor energievoertuigen, het gebruik van het NVIDIA DRIVE Orin gecentraliseerde rekenplatform zal uitbreiden naar een breder scala van zijn NEV's.

Doorbraken in halfgeleiders versnellen

Door leiders op het gebied van halfgeleiders zoals ASML, TSMC en Synopsis in staat te stellen het ontwerp en de fabricage van een nieuwe generatie chips te versnellen, aangezien de huidige productieprocessen de grenzen naderen van wat de natuurkunde mogelijk maakt, kondigde Huang NVIDIA cuLitho aan, een doorbraak die versneld computergebruik naar het gebied van computationele lithografie.

De nieuwe NVIDIA cuLitho-softwarebibliotheek voor computationele lithografie wordt door TSMC, 's werelds toonaangevende gieterij, en Synopsys, leider op het gebied van elektronische ontwerpautomatisering, geïntegreerd in hun software, productieprocessen en systemen voor de nieuwste generatie NVIDIA Hopper-architectuur GPU's.

Leverancier van apparatuur voor het maken van chips ASML werkt nauw samen met NVIDIA aan GPU's en cuLitho, en is van plan ondersteuning voor GPU's te integreren in al hun softwareproducten voor computationele lithografie. Met lithografie aan de grenzen van de fysica, stelt NVIDIA's introductie van cuLitho de industrie in staat om naar 2nm en verder te gaan, zei Huang.

"De chipindustrie is de basis van bijna elke industrie", zei Huang.

Het versnellen van 's werelds grootste bedrijven

Bedrijven over de hele wereld zijn het eens met de visie van Huang.

Telecomgigant AT&T gebruikt NVIDIA AI om gegevens efficiënter te verwerken en test Omniverse ACE en de Tokkio AI-avatarworkflow om virtuele assistenten te bouwen, aan te passen en in te zetten voor de klantenservice en de helpdesk voor medewerkers.

American Express, de US Postal Service, Microsoft Office en Teams, en Amazon behoren tot de 40.000 klanten die gebruikmaken van de krachtige NVIDIA TensorRT inference optimizer en runtime, en NVIDIA Triton, een multi-framework datacenter inference serving software.

Uber gebruikt Triton om honderdduizenden ETA-voorspellingen per seconde uit te voeren.

En met meer dan 60 miljoen dagelijkse gebruikers gebruikt Roblox Triton om modellen voor game-aanbevelingen te dienen, avatars te bouwen en inhoud en marktplaatsadvertenties te modereren.

Microsoft, Tencent en Baidu maken allemaal gebruik van NVIDIA CV-CUDA voor AI-computervisie. De technologie, in open bèta, optimaliseert de voor- en nabewerking en levert 4x besparingen op in kosten en energie.

Helpen het onmogelijke te doen

Ter afsluiting van zijn toespraak bedankte Huang NVIDIA's systemen, cloud- en softwarepartners, evenals onderzoekers, wetenschappers en medewerkers.

NVIDIA heeft 100 versnellingsbibliotheken bijgewerkt, waaronder cuQuantum en de nieuwe open-source CUDA Quantum voor quantum computing, cuOpt voor combinatorische optimalisatie en cuLitho voor computationele lithografie, kondigde Huang aan.

Het wereldwijde NVIDIA-ecosysteem, zo meldde Huang, omvat nu 4 miljoen ontwikkelaars, 40.000 bedrijven en 14.000 startups in NVIDIA Inception.

'Samen,' zei Huang. "We helpen de wereld het onmogelijke te doen."

Trend Micro BW BN week 10-11-13-14-2024 Copaco | BW 25 maart tm 31 maart 2024
Trend Micro BW BN week 10-11-13-14-2024