Crise Raptor Lake : un futur #MeToo hardware ?

    Vous n’êtes pas sans savoir que depuis quelques mois (disons début 2024), certains possesseurs de CPU Intel de la famille Raptor Lake-K (13x00K* et 14x00K*) se plaignent d’instabilités notoirement récurrentes. Dès le mois d’avril, NVIDIA avait brutalement tiré la sonnette d’alarme, appuyé en cela par plusieurs développeurs de jeux basés sur le nouveau Unreal Engine 5, comme Inflexion Games (Nightingale) et Gearbox (Remnant 2).

    Après quelques semaines d’analyse, Intel avait alors rejeté la faute sur les fabricants de cartes mères et leurs « optimisations aux petits oignons », ce qui s’était traduit courant mois de mai par une bordée de nouveaux BIOS dotés du tout nouveau tout beau ‘Intel Baseline Profile’ (aka. « molo sur la nitro mon coco »), sans que cela ne règle vraiment le problème tout en impactant notablement les performances. Acculé, Intel a continué l’analyse et a publié fin juin un guide de stabilité censé corriger l’erreur eTVB qui, s’il améliore bien la situation, ne résout pas non plus le problème.

    Alors, où en sommes-nous ?

    La semaine dernière, c’est Alderon Games, développeur du jeu Path of Titans basé lui aussi sur UE5, qui s’est fendu d’un communiqué cinglant contre Intel. Au-delà d’un ton particulièrement virulent, et assez inhabituel dans le milieu, que retenir de ce message ?

    Primo, le studio confirme que le problème est de nature évolutive, c’est-à-dire que des CPU initialement sains finissent inexorablement par devenir instables. Nous étions nombreux à le suspecter, car il était étrange qu’un problème aussi grave apparaisse plus d’un an après la commercialisation des premiers Raptor Lake-K en octobre 2022 (et l’Unreal Engine 5 avait bon dos), mais sa confirmation pratique est une étape importante. Il est juste dommage qu’Alderon Games ne fournisse aucune donnée statistique à l’appui de son affirmation, ce qui entache sa crédibilité.

    Segundo, le studio ne fait aucune distinction entre Raptor Lake K et non-K et laisse donc entendre que 100% des CPU de 13e et 14e génération sont ou seront concernés par le problème. Cette affirmation est nouvelle et tout aussi grave. Une fois encore, plus d’informations détaillées nous auraient été utiles, par exemple les modèles de CPU non-K avec lesquels Alderon Games a constaté le problème, ainsi que le nombre de chaque type, histoire d’en évaluer la valeur statistique.

    Tertio, le studio affirme que le problème a bien été constaté sur les desktops des joueurs et des développeurs (jusqu’ici rien d’anormal), mais aussi sur les serveurs dédiés au jeu, que ce soit en auto-hébergement ou chez des hébergeurs de la communauté. Il recommande même de ne pas utiliser ou commercialiser des serveurs utilisant des Raptor Lake pour héberger des sessions de Path of Titans. Cette position est troublante, car elle est de nature à jeter la suspicion sur d’autres gammes de CPU chez Intel. En effet, dans le monde de l’hébergement professionnel sérieux (je ne parle pas de l’auto-hébergement domestique), on n’utilise pas de processeurs des gammes S d’Intel, tout simplement parce qu’ils sont rarement supportés par les logiciels professionnels d’infrastructure (ex : VMware ESXi). À la place, on utilise des gammes dédiées comme Emerald Rapids qui, et ce n’est pas anodin dans notre contexte, partage la même architecture que Raptor Lake, aka. Raptor Cove. Emerald Rapids n’étant commercialisée que depuis 6 mois, et vu l’absence de données statistiques fiables, il sera difficile ici de conclure, mais il aurait été intéressant qu’Alderon Games étaye ses accusations avec des preuves solides pour que nous puissions savoir si le problème reste cantonné au petit marché des gamers « Enthusiast » ou si nous sommes potentiellement à la veille d’un scandale plus vaste touchant aussi le marché professionnel.

    Que peut-on vraiment en conclure ?

    Le fait que le problème soit évolutif et touche d’autres CPU non-K de la gamme Raptor Lake, si cela est confirmé par d’autres sources un peu plus sérieuses, est extrêmement grave, car cela signifie qu’il n’est pas seulement de nature transitoire et environnementale (càd. « c’est la faute aux cartes mères »), mais aussi intrinsèque au design des CPU. Par conséquent, tous les CPU des gammes Raptor Lake & Raptor Lake Refresh seraient susceptibles d’être touchés un jour ou l’autre, les modèles K survitaminés et surexploités n’étant finalement que les premières victimes visibles de l’épidémie. Cela signifie aussi que le problème pourrait potentiellement être intrinsèque à l’architecture Raptor Cove et pas seulement au design Raptor Lake, et donc pourrait aussi concerner rapidement la gamme professionnelle Emerald Rapids, les CPU serveurs étant au moins aussi sollicités que ceux des gamers. Enfin, l’architecture Raptor Cove étant une évolution mineure de Golden Cove, il n’est pas totalement exclu que le problème s’étende à terme à d’autres gammes de CPU comme Alder Lake et Sapphire Rapids. Mais là, ça serait vraiment une énorme catastrophe pour Intel.

    Et maintenant ?

    Dans d’autres secteurs industriels, quand on a ce genre de problème, on procède à un rappel des produits défectueux qui sont alors échangés ou remboursés. C’est d’ailleurs ce que réclame Alderon Games, mais on peut très sérieusement douter qu’Intel cède. Il suffit pour s’en convaincre de regarder comment le fondeur a procédé avec un autre scandale récent, celui des chipsets réseau i225/226-V. Cela fait 4 ans que la commercialisation du i225-V a été lancée et qu’il s’est révélé instable. Deux révisions (B2 & B3), une nouvelle version matérielle (i226-V), ainsi qu’une multitude de fix et de nouveaux firmwares n’ont jamais vraiment réussi à résoudre le problème, alors que de grandes quantités de cartes mères se sont vendues sans qu’un programme de rappel et/ou de remboursement ne soit lancé.

    Aujourd’hui encore, des milliers de clients du fondeur sont confrontés à l’instabilité chronique de leur interface réseau filaire sans que ça ne chagrine personne. Alors il est vrai qu’on ne parle pas de la même chose : un chipset réseau c’est pas cher (moins de 3$), et on peut toujours utiliser le WiFi ou mettre une autre carte réseau s’il ne fonctionne pas, mais ça n’augure rien de bon. D’ailleurs, le fait qu’Intel cherche à accélérer la sortie des Arrow Lake-S est assez révélateur d’une envie de passer rapidement et discrètement à autre chose.

    Reste alors la pression médiatique : le coup de gueule d’Alderon Games pourrait donner lieu à un grand mouvement populaire semblable à un #MeToo hardware qui pourrait alors enclencher une réponse judiciaire avec éventuellement des actions de groupe dans les pays où elles sont possibles. Nous n’en sommes pas encore là, mais si Intel ne trouve pas rapidement une solution pour calmer la foule, la situation risque de s’emballer à la rentrée.


     

    2 Commentaires

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici

    Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.