Fujitsu a présenté une technologie innovante de middleware en intelligence artificielle (IA) qui optimise le rendu du GPU, en particulier dans un contexte de développement de connaissances global de ces ressources. Cet outil, basé sur l’attribution intelligente et dynamique du GPU développé par Fujitsu, permet une distribution adaptative du GPU en temps réel pour maximiser votre utilisation efficace et accélérer le processus d’optimisation moyen avancé.
Après avoir finalisé une série d’essais pilotes avec succès, l’entreprise TRADOM Inc. a commencé à mettre en œuvre des solutions basées sur cette technologie à partir d’octobre 2024. De forme similaire, SAKURA Internet Inc. a lancé un studio de viabilité pour évaluer l’incorporation de cette société. technologie dans vos opérations de centres de données. De plus, Fujitsu est arrivé au début du mois de mai 2024 avec des sociétés comme AWL, Inc., Xtreme-D Inc. et Morgenrot Inc., observant de meilleurs notables dans leurs opérations, y compris une augmentation de 2,25 fois dans la L’efficacité informatique de certains processus d’IA, ainsi qu’un incrément significatif dans le nombre de processus gérés simultanément dans les infrastructures de services et de noyaux.
La disponibilité commerciale de cette technologie au Japon est programmée pour le 22 octobre 2024, et s’étendra à d’autres marchés mondiaux dans des étapes ultérieures. Fujitsu a pour objectif de continuer à s’adresser aux utilisateurs finaux en tant que fournisseurs de services dans le noyau qui cherchent à réduire les coûts du GPU et à augmenter la capacité opérationnelle en IA.
Enfrentar la creciente demanda de IA et le défi énergétique
Avec la croissance exponentielle des applications d’IA, en particulier dans l’IA génératrice, la nécessité de GPU a augmenté de manière considérable, et on espère que la demande se multipliera environ d’ici 20 pour 2030. Cela a créé une préoccupation supplémentaire concernant la consommation d’énergie en centres de données, cela exigera peut-être de représenter les 10 % de l’électricité mondiale pour 2030.
Le middleware attribue dynamiquement les ressources du GPU par GPU, optimisant l’attribution des ressources et la gestion de la mémoire sur diverses plates-formes et applications d’IA.
Pour ce faire, Fujitsu a développé en novembre 2023 sa technologie de désignation adaptative de GPU, capable d’optimiser l’utilisation des ressources CPU et GPU en temps réel, en priorisant les processus avec une plus grande efficacité d’exécution. Cette technologie a été testée sur plusieurs plates-formes, montrant sa capacité à maximiser l’amélioration de l’infrastructure.
Caractéristiques du nouveau middleware d’intermédiation en IA
Le nouveau middleware fait office d’intermédiaire intelligent, intégrant l’attribution adaptative de GPU avec des techniques avancées d’optimisation de processus, ce qui permet de gérer et d’optimiser automatiquement l’attribution de GPU entre plusieurs processus d’IA.
Au lieu d’attribuer des ressources au niveau de la carte, cette technologie d’intermédiation distribue les ressources au niveau du GPU individuel, ce qui permet une plus grande disponibilité et une meilleure administration de la mémoire du GPU. Il est possible que les entreprises puissent exécuter de nombreux processus d’IA de forme simultanée, y compris dans des conditions de haute demande de recours.
Les essais ont démontré un incrément d’environ 2,25 fois dans la capacité de traitement du GPU et la capacité de gestion jusqu’à 150 Go de données dans les processus d’IA, en plus de la capacité physique du GPU.