Het grote taalmodel DeepSeek V4 draait naar verluidt op chips van Huawei. Tot dusver was het Chinese bedrijf achter de AI-dienst afhankelijk van Nvidia-processors, die onder Amerikaanse exportrestricties vallen. Naar verwachting komt het model deze lente uit.
Dat schrijft The Information op basis van meerdere betrokkenen, aldus Reuters. DeepSeek en Huawei zouden voor het project samengewerkt hebben om het taalmodel voor Ascend-hardware van het laatstgenoemde bedrijf te optimaliseren.
Het is gebruikelijk dat AI-modelmakers samenwerken met chipmakers om het model voor specifieke hardware te optimaliseren. Reuters schreef in februari dat DeepSeek echter nog niet met Amerikaanse bedrijven had samengewerkt. Dit zou nu verklaard kunnen worden, aangezien DeepSeek met Huawei lijkt samen te werken.
Soevereiniteit voor China
DeepSeek is voor zover bekend het meest geavanceerde Chinese taalmodel, dat kan concurreren met modellen van OpenAI, Microsoft, Google en Anthropic. Het functioneren van V4 op Huawei-gpu's zou een grote stap in de Chinese AI-industrie zijn. Vooralsnog zijn de bedrijven namelijk afhankelijk van hardware van vooral Nvidia. Vanwege exportrestricties en geopolitieke spanningen tussen China en de Verenigde Staten wil het Aziatische land onafhankelijker zijn van Amerika.
Het taalmodel DeepSeek is een large language model met 'open weight'-principe, wat betekent dat de parameters van het model door gebruikers aangepast mag worden. Het model zelf wordt onder een MIT-opensourcelicentie ontwikkeld. Toch is DeepSeek omstreden vanwege mogelijke betrokkenheid bij Chinese militaire operaties, omzeiling van exportrestricties en privacyinbreuk.
/i/2008103400.webp?f=imagenormal)
/i/2008103388.png?f=imagemedium)
:strip_exif()/i/2008103382.jpeg?f=imagemedium)
:strip_exif()/i/2008103380.jpeg?f=imagenormal)