DeepSeek heeft de introductie van zijn R2-model naar verluidt uitgesteld, omdat het niet gelukt zou zijn om het model te trainen met chips van Huawei. Volgens de Financial Times liep het Chinese bedrijf tegen 'aanhoudende technische problemen' aan.
FT schrijft dat de autoriteiten DeepSeek hebben aangemoedigd om de Ascend-processor van Huawei te gebruiken in plaats van de chips van Nvidia. Het bedrijf liep volgens bronnen echter tegen 'aanhoudende technische problemen' aan bij het trainen van het R2-model met Ascend-chips. Daarom gebruikt het bedrijf naar verluidt nu Nvidia-chips voor de training en Huawei-chips voor de inferentie. Het model liep naar verluidt ook vertraging op omdat het datalabelingsproces, waarbij ruwe data worden gelabeld om context te bieden aan het model, langer zou hebben geduurd dan verwacht.
Naar verluidt kampen chips van Chinese makelij met stabiliteitsproblemen, tragere connectiviteit tussen chips en inferieure software in vergelijking met de chips van Nvidia. Huawei heeft eerder een team ingenieurs naar het kantoor van DeepSeek gestuurd om het bedrijf te helpen met het gebruik van zijn Ascend-chip voor de training van het R2-model. Ook met de Huawei-medewerkers wist DeepSeek echter geen succesvolle testrun uit te voeren.
DeepSeek heeft nog geen officiële releasedatum gedeeld voor het R2-model. Volgens Chinese media wordt het model mogelijk al binnen de komende weken uitgebracht.