Microsoft AI introduceert eerste AI-modellen die in-house zijn ontwikkeld

Microsoft AI heeft zijn eerste in-housemodellen onthuld. MAI-Voice-1 is een spraakgeneratiemodel dat al beschikbaar is in onder meer Copilot Daily. MAI-1-preview biedt 'een voorproefje van toekomstige functies binnen Copilot', schrijft het bedrijf.

Volgens Microsoft kan MAI-Voice-1 in minder dan een seconde een minuut audio genereren op één gpu. Microsoft gebruikt het model al voor zijn Copilot Daily- en Podcasts-functie. Nu wordt het model ook beschikbaar gemaakt in Copilot Labs. Daar kunnen gebruikers invoeren wat het AI-model moet zeggen en welke stem en spreekstijl het moet gebruiken.

MAI-1-preview is een in-house mixture-of-expertsmodel dat volgens Microsoft getraind is op ongeveer 15.000 Nvidia H100-gpu's. Het is het eerste volledig door Microsoft AI getrainde foundationmodel. Vorig jaar werd Mustafa Suleyman, de medeoprichter van onder andere DeepMind, aangenomen als ceo en evp van Microsoft AI. Die nieuwe divisie binnen Microsoft richt zich op het verbeteren van de consumenten-AI-producten van het bedrijf en onderzoek op dit gebied.

Microsoft test MAI-1-preview op LMArena en maakt het model beschikbaar voor 'betrouwbare testers'. Om toegang te krijgen tot de api, kunnen geïnteresseerden een formulier invullen. MAI-1-preview zou nuttig zijn voor mensen die behoefte hebben aan een model dat instructies kan opvolgen en 'nuttige antwoorden kan geven op alledaagse vragen'.

In de komende weken maakt Microsoft MAI-1-preview ook beschikbaar binnen Copilot voor 'bepaalde tekstuele gebruiksgevallen'. Wat dat precies inhoudt, is niet duidelijk. Het bedrijf wil de tests binnen Copilot gebruiken om het model op basis van gebruikersfeedback te verbeteren.

Momenteel maakt Microsoft voor zijn AI-diensten vooral gebruik van de llm's van OpenAI. De relatie tussen Microsoft en OpenAI is de laatste maanden echter verslechterd. Bestuurders van OpenAI zouden zelfs hebben overwogen een antitrustzaak tegen Microsoft te starten. Omdat Microsoft een van de grootste aandeelhouders van OpenAI is, moet het de omvorming van OpenAI naar een commercieel bedrijf goedkeuren. De onderhandelingen daarover verlopen echter moeizaam. Eind juli meldde Bloomberg nog dat Microsoft een nieuwe deal naderde over het gebruik van de modellen van OpenAI, maar er is vooralsnog geen definitief akkoord.

Update, 13.11 uur: Eerder stond in het artikel dat MAI-1-preview het eerste model van Microsoft is. Dat moet Microsoft AI zijn. Het artikel is hierop aangepast.

Door Imre Himmelbauer

Redacteur

29-08-2025 • 12:08

39

Reacties (39)

Sorteer op:

Weergave:

Ben zelf wel fan van Bing het geeft kort gebonden antwoorden met overzichtelijke informatie en ben benieuwd hoe AI gebruikt gaat worden in de gaming industry met name persoonlijkheid en reacties van NPC kan AI een revolutie zijn en ook in extra frame ondersteuning met de Switch 2 zijn er bijzondere resultaten te zien door AI en ook met spel ontwikkeling kan AI veel tijd en geld besparen.

Het probleem met AI is denk ik dat bedrijven zoals MS teveel in AI gaan investeren met het doel om te besparen op personeel en de menselijke kant van creëren kun je niet vervangen en als er iets fout gaat dan heb je niet meer de mensen om het op te lossen en ben je afhankelijk van het probleem om het op te lossen en wie weet wat er gebeurd.

AI is een revolutie met zoveel potentie maar tot zover zijn er beperkingen en dat is maar goed ook want er zullen weet ik hoeveel fouten gemaakt worden in de ontwikkeling van AI voor doelen van zowel bedrijven als gebruikers en zowel die bedrijven als gebruikers moeten zich verantwoordelijk gedragen en niet één of andere excuus verzinnen..

Zoals met Roblox met hun Disclaimer Roblox Terms of Use – Roblox Support maar in de praktijk werkt het dus niet does roblox use ai - Search ik ga niet in details want als ouder zou het als horror klinken dus ga zelf op onderzoek uit op uw eigen verantwoordelijkheid.

Sommige volwassenen nemen geen verantwoording voor hun gedrag en sommige ouders nemen geen verantwoording voor hun kinderen en daarom al worden er maatregelen genomen voor de menigte die voor mij veel te ver gaan maar goed wat doe je er aan dat sommige individuen verkeerde bedoelingen hebben en dat sommige mensen het te druk met zichzelf hebben om meer contact met hun kinderen te hebben ?

Misschien heb ik makkelijk praten als kinderloze vrijgezel maar ik neem mijn verantwoordelijkheid en wordt als nog afgestraft na de controles met censuur dus wat is het doel ? ik krijg het idee dat het weer Smoke & Mirrors is voor nog meer controle op de menigte en dat het effect meer negatief zal zijn dan positief voor ons als burger en als klant en dat AI gebruikt gaat worden als Gatekeeper en dat een select aantal daar toezicht op heeft.. het zal tenminste geen Open AI zijn waar iedereen inzicht in heeft.
Zou Microsoft van plan zijn OpenAI te laten worstelen om het vervolgens te laten sterven en de nuttige onderdelen over te nemen om zo meteen de grootste te worden? Microsoft heeft z'n datacenterprojecten die voor OpenAI waren bedoeld stopgezet, ligt dwars bij omvorming tot for-profit (wat nodig is voor extra geld van o.a. Softbank), brengt nu eigen modellen uit, enz.

[Reactie gewijzigd door vickypollard op 29 augustus 2025 12:37]

Is Microsoft niet voor bijna 50% aandeelhouder?

Zou wel een hele grote kapitaal vernietiging zijn als ze dat zouden doen. Beter is dan huidig aandeel tegen een gunstige koers verkopen want we hebben het hier niet over een paar miljoen dollars
De lijst van bedrijven die door MS verdwenen zijn of een schaduw zijn van wat ze waren (vaak op illegale wijze) is lang. Al doen andere tech-giganten hetzelfde. Too big to fail, just means too big, was een gezegde over banken tijdens de bankencrisis, hetzelfde gaat volgens mij op voor techgiganten.
- Netscape (door via zijn monopolie Internet Explorer gratis mee te leveren en dan te weigeren standaarden te implementeren, ze doen hetzelfde met Office, Teams, OneDrive, Power Platform)
- Nokia
- Alle Office-alternatieven zoals Word Perfect, met achteraf het fake opensource maken van hun bestandsformaten
- Notes
- Slack
-...
Nee denk eerder dat er teveel conflicterende visies zijn. Plus alles beginnen en niets afmaken.
Was het niet zo dat heel OpenAI op Azure draait?
Ook een deel via Coreweave als ik me niet vergis.
Huh MS heeft toch ook de Phi modellen die ook inhouse zijn ontwikkeld/getraind?
https://huggingface.co/microsoft -> En wel meer ook.

Echter. Goed lezen :) "Microsoft AI" (het 'initiative' van Microsoft) heeft z'n eerste AI-modellen geproduceerd. Ik keek er ook 3x overheen ;)
nieuws: Microsoft introduceert 'klein' AI-taalmodel Phi-3 Mini getraind op AI... beschrijft niet dat die per se in-house ontwikkeld en/of getraind zijn, dat kan ook gewoon een subcontractor hebben aangeleverd.
Mustafa, CEO Microsoft AI noemt het zelf de eerste in-house model.
https://x.com/mustafasuleyman/status/1961111770422186452

Andere bron schrijft:
MAI-1-preview builds on earlier small-scale models released under the Phi name. But this marks the first time Microsoft has trained a foundation model of this size from start to finish. The effort reflects how the company has been building out its AI group since hiring Suleyman and many of his former colleagues from the startup Inflection.
Spijtig dat het weer geen stemmen zijn met vlaams accent. Ik vind zelf amper opties. Meestal zijn ze dan te duur of niet goed genoeg. Ik heb wel edge tts gevonden, wat goed is.

edit:
Microsoft hun model is geen simpele text to speech, maar genereert ook een tekst op basis van jouw prompt.

[Reactie gewijzigd door dragonlords1 op 29 augustus 2025 13:32]

Geweldig nieuws! Nu kan ik tenminste aan het werk en mijn AI-avatar laten deelnemen aan alle Teams meetings! :+

On topic heb ik weinig toe voegen, ben benieuwd wanneer de bubble klapt en hoeveel we tot die tijd nog te verduren krijgen aan 'toegevoegde waarde' in functionaliteit 'omdat de investeringen moeten worden terugverdiend'.

[Reactie gewijzigd door voipmeister op 29 augustus 2025 17:35]

On topic heb ik weinig toe voegen, ben benieuwd wanneer de bubble klapt en hoeveel we tot die tijd nog te verduren krijgen aan 'toegevoegde waarde' in functionaliteit 'omdat de investeringen moeten worden terugverdiend'.
Als ik zie hoe AI bij ons intern vele zaken aanzienlijk versneld en verbeterd heeft, denk ik niet dat AI de volgende 'internet bubbel' is. De meerwaarde is echt enorm.
Het zal bij ons vast ook geen omzet groei opleveren, maar wij (IT afdeling) hebben wel veel baad bij de hulp van AI. We gebruiken het vooral als vraagbaak hoe wij bepaalde zaken kunnen inrichten op bijvoorbeeld AWS, of om te helpen met een Python of Bash script. We worden er zelf veel productiever van en zijn minder afhankelijk van collega's.
Als je productiever wordt, moet de omzet toch ook omhoog gaan, of gaat de gewonnen tijd op aan hobby projecten?
Nee, want wij (= het team waar ik in zit) krijgen daar toch echt niet meer klanten door... ;) Wij kunnen dingen sneller doen, kunnen dan dus meer doen met dezelfde tijd. Geen idee hoe dat voor een IT afdeling de omzet verhoogt hoor? :?

[Reactie gewijzigd door CH4OS op 30 augustus 2025 01:39]

Twee mogelijkheden: met de overgebleven tijd kun je meer projecten doen, waardoor andere delen van het bedrijf meer omzet gaan maken of minder kosten hebben, of er kan op termijn iemand bij jullie de deur uit omdat er minder te doen is. Omzet blijft dan misschien hetzelfde, maar de winst gaat wel omhoog.
Ik moet hier het eerste nuttige gebruik nog meemaken. Wat ik bij ons hoor is voornamelijk vibe-based en niet onderbouwd/gekwantificeerd. Ben laatst ook weer veel tijd kwijt geweest aan prompt engineeren zodat het kreng eindelijk z'n taak goed zou doen (formatteren van het e.e.a., wat ik herhaaldelijk zou moeten doen), met als resultaat dat het nog steeds 9/10 keer fout ging. Had het uiteindelijk net zo goed handmatig kunnen doen 8)7

[Reactie gewijzigd door vickypollard op 29 augustus 2025 14:15]

Voor ons is de AI die wij gebruiken vooral als vraagbaak / rubber ducky. We laten AI niet zelf dingen voor ons doen of zo. Is ook veel te lastig voor onze werkzaamheden + we zijn graag zelf in control, maar de hulp van AI die wij gebruiken werkt gewoon prima.
LLM/AI bubbel gaat nooit meer barsten, er zit best wel wat meerwaarde in het slim weg automatiseren van domme processen.

Qua features zullen er een aantal zijn die blijven en sommige zullen een stille dood sterven. Maar als geheel gaat dit niet meer weg.
.com bubbel is ook gebarsten, het internet bleef bestaan.
Een bubbel is een overwaardering van iets, met een stevige koerscorrectie achteraf tot gevolg. Het betekent niet noodzakelijk dat iets waardeloos blijkt en ophoudt met bestaan nadat de bubbel barst. Zelfs tulpenbollen, de 'original bubbel', worden na al die eeuwen nog steeds verhandeld ;)
Ik heb vandaag toch weer mooi een aantal domme suggesties van Copilot kunnen afwijzen. Het houdt je van de straat.
50% van je prompts zou momenteel "Controleer je antwoord" moeten zijn.
Helaas zijn het dingen waar ik niet eens om gevraagd heb. Copilot in Dynamics 365 is bijvoorbeeld erg opdringerig en doet "handige suggesties" die je dan weer weg moet klikken omdat ze meestal niet kloppen
Dat je een simpele vraag stelt en vervolgens de volledige Encyclopedia Brittanica als antwoord krijgt.
Ik noem dat fenomeen 'humansplaining'.

Recent vroeg ik over hoeveel uur de lancering van Starship gepland was. Ik kreeg een antwoord maar het was drie paragrafen met waar, wanneer, hoe het kon worden berekend en dan de berekening. Het antwoord had simpelweg "over 6 uur" moeten zijn.
En als je dat dan als antwoord geeft, geeft hij dan ook toe dat hij dat anders had moeten doen. Alles valt of staat bij een goede prompt. Moet zeggen dat ik er 9 van de 10 keer goeie resultaten uit krijg, wat mij toch elke dag weer een uurtje ofzo bespaart aan zoek of rekenwerk.
Copilot is niet perse goed een voorbeeld waarin je ziet wat AI moment kan. Ik denk dat Copilot ervoor zorgt dat de meerheid denkt dat het “niet zo hard gaat”, terwijl het wél hard gaat.
Kan ik eindelijk stoppen met het gebruik van SAM (demo).
Dat is... lang geleden dat ik dat draaide op de Atari. Brings back memories.
Ik gok dat het (in verhouding tot het training van een AI-model die audio kan genereren en met de kennis van nu) misschien niet eens zo heel veel moeite zou zijn om het "alfabet" van SAM uit te breiden om alle klanken juist te genereren en het resultaat menselijk te laten klinken. In plaats van de minuut aan audio die nu in één seconde gegenereerd kan worden door MAI-Voice-1, kan deze tactiek waarschijnlijk in diezelfde seconde uren aan audio kunnen genereren.
Sowieso zijn natuurlijk veel van de AI flows qua performance veel efficienter als ze 'normaal' geprogrammeerd worden. Alleen dat kost veel werk van dure developers.
Dat is waar, al vraag ik me af of sommige dingen wel te programmeren zijn. Spraak genereren hebben "we" tot voor kort altijd al zo gedaan, door korte audiosamples achter elkaar te plakken. Het probleem daarbij is dat je afhankelijk bent van wat op is genomen, en je daar niet van af kunt wijken.

SAM genereert zelf klanken en plakt deze achter elkaar. Je zou (vergelijkbaar met het trainen van AI) het benodigde alfabet proefondervindelijk samen kunnen stellen door een acteur een tekst in te laten spreken en dan SAM dit na te laten bootsen, waarbij je de output vergelijkt tot deze voor 100% overeenkomt. Doe dit daarna nog een aantal keer met andere sprekers en je hebt 1) een alfabet waarmee je teksten voor kunt lezen, 2) een overzicht van de parameters die je aan kunt passen om andere stemmen en uitspraken te krijgen, terwijl je 3) voor het uitvoeren en genereren van een stem gewoon weer terug kunt vallen op ouderwets programmeren ipv een AI-model wat (honderd)duizenden tensors op de gok van een waarde voorziet en dit daarna in verschillende stappen terugbrengt naar het eindresultaat.
Dit is inderdaad behoorlijk complex en daarmee goed voor AI. Maar ik kreeg laatst een met AI gegenereerde verwacht bezorgdag van mn pakketje. Voor mijn gevoel is dat met een paar regels normale code ook prima te doen. In beide gevallen klopt er weinig van uiteindelijk ;-)
Het is misschien off-topic maar ik ben echt onder de indruk van bijv. Skyrim VR but all NPC's use CHATGPT AI geen idee hoe het technisch in elkaar zit maar een spel komt op deze manier echt tot leven en gezien MS officieel mod ondersteuning heeft vraag ik mij af of dit soort techniek ook als mods kunnen komen ^^
Natuurlijk wel door een flink deel van de privacy op te geven...

Op dit item kan niet meer gereageerd worden.