Xiaomi introduceert eigen AI-redeneermodel MiMo

Xiaomi brengt zijn eigen AI-model uit MiMo uit. Uit de benchmarks die de Chinese elektronicafabrikant deelt, blijkt dat het redeneermodel beter presteert dan o1-mini van OpenAI en de Qwen-modellen van Alibaba.

Volgens Xiaomi is het model specifiek ontworpen voor redeneertaken, waarbij het model niet alleen antwoord geeft, maar ook toont hoe het tot het antwoord is gekomen. De elektronicafabrikant claimt dat MiMo beter presteert dan OpenAI's o1-mini en Alibaba's QwQ-32B Preview in benchmarks voor wiskundig redeneren en coderen. Xiaomi MiMo is openbaar toegankelijk, net als onder meer DeepSeek R1.

Xiaomi voegt zich bij het groeiende aantal Chinese bedrijven dat zich op AI-modellen richt. De aankondiging van MiMo volgt een dag nadat techgigant Alibaba zijn Qwen 3-taalmodel uitbracht. In januari van dit jaar werd de AI-app van DeepSeek in korte tijd enorm populair vanwege het R1-taalmodel. Ook techgigant Baidu en ByteDance hebben een eigen chatbot. De Chinese overheid steunt de ontwikkeling van AI in het land om op dat vlak te kunnen concurreren met de Verenigde Staten.

Xiaomi MiMo AI-model

Door Sabine Schults

Redacteur

30-04-2025 • 14:00

9

Reacties (9)

9
9
4
0
0
4
Wijzig sortering
Net gedownload binnen LM Studio. Als je hem vraagt wie en wat hij is, dan is dit een model dat "gemaakt is door Google". :+
Hij is getrained op Gemini 2.5
Heb je hiervoor een bron?

Want "trainen op een model" is niet echt iets, gezien je traint op data.
Wel kun je zogenaamd destilleren*, wat ik meen voor DeepSeek R1 ook zo goed werkte. (En verder gaan met een eerder getraind model op jouw nieuwe data, of een stukje van een model nemen (transfer learning)).

*In de loss function van het model dat je traint neem je dan ook de output van een teacher model mee, wat in dit geval dan Gemini 2.5 zou zijn. Ik vind hier iig niets over
distillation is een grotere LLM gebruiken om een kleiner mopdel te trainen. Beetje mierenneuken van jouw kant dus. Xiaomi heeft recent wat talent van DeepSeek overgenomen en ik neem aan dat het model dan ook met dezelfde technieken geproduceerd is.
Gemini 2.5 is niet open-source, dus dat kan niet.
Je hebt enkel de output van gemini nodig voor distillation. Een partij zo groot als Xiaomi kan dat prima regelen zonder dat google argwaan krijgt.
(speculatie) het zou deels op Google Gemma 3 getraind kunnen zijn, die is wel open source.
Merk op dat ze vergelijken met Qwq en Qwen 2.5 en niet met de nieuwste Qwen 3. De titel dus met een korrel zout nemen.


Om te kunnen reageren moet je ingelogd zijn