'Microsoft wil dat concurrerende AI-tools geen gebruik meer maken van Bing-data'

Microsoft wil naar verluidt dat concurrerende zoekmachines niet langer gebruikmaken van de zoekdata van Bing voor hun eigen AI-tools. Dat meldt Bloomberg op basis van gesprekken met ingewijden. Onder meer DuckDuckGo heeft een licentie voor die gegevens.

Microsoft heeft volgens Bloomberg gedreigd om de toegang tot de Bing-zoekindex te blokkeren als de rivaliserende zoekmachines er niet mee ophouden om die data als basis te gebruiken voor hun eigen AI-producten. Volgens de techgigant is dat namelijk in strijd met het licentiecontract. Microsoft zou minstens twee partijen hebben beschuldigd van contractbreuk, maar welke dat zijn is niet bekend.

Onder meer zoekmachines Yahoo, DuckDuckGo, You en Neeva gebruiken Bing-gegevens in licentie voor een deel van hun informatie, aangezien het indexeren van het gehele internet zeer kostbaar is. De zoekindex van Microsoft is een soort kaart van het internet, die in real time gescand kan worden. De drie laatstgenoemde zoekmachines hebben recentelijk allemaal een AI-tool uitgebracht.

Google en Microsoft zijn de enige twee bedrijven die het gehele internet zelfstandig geïndexeerd hebben. Google geeft geen licenties uit voor het gebruik van diens zoekindex, hetgeen betekent dat alle andere zoekmachines aangewezen zijn op Bing.

De AI-tool van DuckDuckGo, DuckAssist

Door Kevin Krikhaar

Redacteur

25-03-2023 • 12:41

88 Linkedin

Reacties (88)

88
83
47
1
0
26
Wijzig sortering
Google geeft geen licenties uit voor het gebruik van diens zoekindex, hetgeen betekent dat alle andere zoekmachines aangewezen zijn op Bing.
Is dit nu ook de reden dat Google Search geen api heeft en Bing wel?
Nee, of naja, ja.

De Bing API is er eigenlijk niet voor derden zoals DuckDuckGo, alleen om Bing beter te trainen/uit te werken door marktaandeel. Het is er voornamelijk ten behoeve van de ondersteuning voor hun zakelijke klanten. De Bing API is vooral een extraatje voor bedrijfsapplicaties. Toevoeging op Dynamics, Power (BI) etc. Daar zit het grote geld voor Microsoft.

Wel coole API trouwens, ik heb er jaren geleden een keer een simpel rts html5 spelletje gemaakt dat de echte wereld gebruikte. En gebruikte het voor IRC en Discord bots, stuk makkelijker in gebruik dan Google's meuk, waar je voor de helft in principe gewoon een browser faked te wezen.

Google is in die zakelijke markt buiten Chrome bijna volledig afwezig.
Als je niet deelt hoef je ook geen api toe te staan.
Nooit geweten dat DuckDuckGO AI gebruikte. Dacht altijd dat ze gewoon queries op zoekmachines afvoerden en die bundelden. Of krijgen we een AI inflatie?
AI-inflatie sowieso. Alles wat met een algoritme werkt, wordt tegenwoordig AI genoemd.
Zelfs zonder algoritme hoor. Vorig jaar heb ik voor een klant gewerkt die een "AI" had ontwikkeld voor een Android applicatie.

20.000 regels if else statements. :+
20.000 regels aan if else statements is toch gewoon een algoritme?
Nee zeker niet, maar snowfall zegt toch:

“Zelfs zonder een algoritme noemen klanten het al een AI. Want een klant had 20.000 regels geschreven met alleen maar if else statements.”

Tenminste zo las ik het, dat snowfall die 20.000 statements niet als algoritme zag en de klant het als een AI zag.
ChatGPT schrijft er het volgende over ;-) Ik vroeg het mezelf ook af na deze discussie hier, wat is ai en wat is gewoon intelligente code?

Artificial Intelligence (AI) en intelligent code schrijven zijn beide gericht op het maken van slimme systemen, maar er is een verschil tussen de twee.

AI verwijst naar het vermogen van een computer of machine om mensachtig gedrag te vertonen, zoals het leren, redeneren, plannen en herkennen van patronen. AI-algoritmen zijn in staat om complexe problemen op te lossen en kunnen zelflerend zijn, wat betekent dat ze hun prestaties verbeteren naarmate ze meer gegevens krijgen en feedback ontvangen.

Intelligente code schrijven daarentegen is gericht op het ontwikkelen van slimme en efficiënte software door middel van programmeren. Dit kan bijvoorbeeld betrekking hebben op het schrijven van algoritmen die specifieke taken uitvoeren of het ontwerpen van systemen die automatisch beslissingen nemen op basis van vooraf bepaalde regels.

Het onderscheid tussen AI en intelligent code schrijven is soms vaag, omdat AI-technieken vaak worden gebruikt om intelligente code te schrijven. Over het algemeen kan gezegd worden dat als een systeem in staat is om zelf te leren en te evolueren, het eerder als AI beschouwd zal worden. Als het systeem echter gebaseerd is op vooraf bepaalde regels en handmatig geschreven code, zal het eerder beschouwd worden als intelligent code schrijven.
Duidelijk! Goed verhaal!
Een paar decennia geleden zou dat het hoogst bereikbare zijn met kunstmatige intelligentie.
Och, als het gewenste doel bereikt wordt en de met buzzwords geobsedeerde managers van je nek af gaan is het alleen maar winst
"Bio" is ook zo'n commerciele tag die zo werkt. Of waar vroegee overal "i" (hammerhead iEagle) voor werd geplekt en nu vaak "e" (eFuels)
Machine learning is ook een algoritme, alleen misschien een wat bredere vorm en niet deterministisch. Daarnaast, mijn nichtjes gaan denken ik tic-tac-toe verliezen van een computer. Er is dus zeker wel een argument te verzinnen dat een algoritme een vorm van intelligentie heeft. Laag en niet lerend, maar dan nog.
tic-tac-toe is a solved game: als geen van beide spelers fouten maakt is het altijd 'niemand wint'

dus als je nichtjes tic-tac-toe verliezen dan doen ze het fout :P
boter kaas & eieren is een goed moment voor mij om MENACE te noemen. Een lerend algoritme van Donald Michie. Voor zovef ik weet een van de eerste die werkte met machine learning/AI. https://en.m.wikipedia.or...oughts_and_Crosses_Engine
Het is gewoon big data met een interessante naam.
De wereldwijde interesse ligt meer bij het hebben van een apparaat dat beslissingen maakt die niemand hoeft te verantwoorden.
Ik ben bang dat het kwestie van tijd is dat de hele wereld wordt geprofileerd op grond van niet-herleidbare informatie.
Waarmee je het vervolgens gewoon gaat negeren, wat toch ‘fake’. Die taktiek is al van ver voorv de ai hype
Taktiek? Wat is precies het doel dan?
Ik denk dat ik het ongeveer net zo hard nodig heb als ipv6, 6 jaar geleden :+.
Alleen voor Wikipedia volgens mij. En het is niet standaard beschikbaar, maar voor een selecte groep gebruikers.
Op welke manier gebruiken ze AI voor Wikipedia dan? Volgens mij klopt dat niet; ze tonen daarvan enkel hun eigen OpenGraph descriptions.

DDG levert een soort AI assistent in hun app. Dat is beperkt tot die app, en niet werkzaam op de website.

Bron: https://spreadprivacy.com/duckassist-launch/
Ik verwacht dat dit specifiek gaat om you.com welke naar mijn weten bing gebruikt.
Dat is met de jaren steeds verder gegroeid geloof ik. Jammer wat mij betreft, ik zou graag weer de mogelijkheid hebben om te zoeken met fixed parameters om alleen simpel de resultaten op die parameters te krijgen in plaats van alle mogelijk gerelateerde rommel eromheen. Dit was voor mij ooit de hoogreden om over te stappen naar ddg, naast privacy.

Vraag me wel af wat ddg nog blijft als ze die api koppeling missen. Hoop dat ze wel hebben gewerkt aan eigen crawlers
Monopolistisch gedrag van Google en Microsoft. Tijd dat de mededingingsautoriteiten hier naar kijken.
Dus als je voor vele miljarden een infrastructuur opbouwt, dan moet je die volgens jou dan weggeven aan anderen? Raar idee. Denk je dat Google en Microsoft en anderen dan nog in infra zouden investeren? Nee, zo werkt economie niet!
Echter wordt die data in licentie afgegeven. Dus zal er wel geld op de bankrekening van Microsoft verschijnen door die licentieafnemers. Er is dus van "weggeven" geen sprake.

Als Microsoft dit doordrukt, dan word er wel een precedent neergezet. En dat mag op het 1e gezicht wel logisch lijken, maar is het niet. Het precedent deelt het internet ook op. AI tools gaan er komen, maar de betrouwbaarheid van de AI resultaten word wel aangetast. Als men hetzelfde had gedacht ten tijde van het ontwikkelen van het Ethernet dan waren er zoveel verschillende standaarden geweest dat het internet als we dat nu kennen nooit van de grond zou zijn gekomen, Of erger, dat het alleen beschikbaar zou zijn geweest voor de 1%, want dat zou dan zo'n beetje de enige groep van personen zijn geweest die dat zouden kunnen betalen.

Het punt is dat het nooit slim om tijdens de beginfase van eenderwelk wat de commerciele belangen te zwaar laten wegen over het algemeen belang.

Daarnaast is er nog een ander ding waardoor Microsoft als een zeurend kind overkomt. Ja, zij hebben grof geld neergelegd voor de AI tools. AI tools die zijn getraind met data. En die data had Microsoft nooit zelf kunnen genereren. Die data komt vooral van jou en mij en iedereen. Is daar ooit voor betaald? Kunnen wij daarom gratis van de AI dienst gebruik maken?

Nee, wij worden er niet voor betaald en nee, gratis gaan die AI tools nooit worden. Misschien de half-getrainde AI van 1 a 2 generaties terug, gevuld met een nooit ge-updated dataset. Woohoo!

Microsoft had er beter aan gedaan om hun licenties beter te bewoorden zodat hun licentieafnemers of extra betalen voor die data of met een licentie aankomen zetten die het gebruik van die data in zeer duidelijke termen verbied. Dat is een Microsoft probleem. En alleen een Microsoft probleem. Niet een probleem van jou, niet van mij en niet van de licentie-afnemers.
Denk je dat Google en Microsoft en anderen dan nog in infra zouden investeren? Nee, zo werkt economie niet!
Omdat die infra dubbel en dwars terug wordt verdiend door pure reclame-inkomsten. Dat die infra nogmaals dubbel en dwars wordt terugverdient door het aanbieden van dataprofielen (voor meer dan reclame doeleinden) aan 3e partijen.

Google maakt daar geen geheim meer van. Microsoft zegt dat zij dat niet doen, maar denk je echt dat Microsoft dat geld op de tafel laat liggen? Als je dat nog steeds gelooft, dan ben je een stuk naiever dan je zelf denkt. Het enige dooel van Microsoft is geld verdienen. Zoveel mogelijk en zo snel mogelijk. Dat er zoveel mensen zijn die geloven dat Microsoft (na Gates/Ballmer) zichzelf op dat gebied zich waardiger gedraagt dan Google, daar kan ik met mijn verstand niet bij. Microsoft en Google ontlopen elkaar amper tot niet. Beide bedrijven zijn rijk genoeg om een eventuele boete na jarenlang gesteggel in rechtszalen af te schrijven als "Costs of doing business". Want dat is hoe hun economie werkt.
Je doet de aanname dat Microsoft niet wil licenseren. Daar gaat het artikel niet over. Het gaat erom dat in de huidige contracten deze API niet gelicenseerd is.

Voor de rest vind ik dat je in mijn opmerking allerlei dingen leest die er niet in staan. Ik ben niet naïef.

In je laatste alinea toon je een soort afkeer bedrijven zoals Microsoft, Google. Ik zal zeker niet beweren dat bij hen alles volgens de regels verloopt. Maar de investeringen in de huidige infra zijn zo gigantisch dat ik echt niet zou weten hoe het anders zou moeten. Jij wel? De enige manier om de miljarden investeringen in de benodigde infra vanuit liefdadigheid terugverdienen? Of de overheid die meebetaald (proest!)? Elke burger betaalt jaarlijks een bijdrage? Of maar gewoon het kapitalisme laten werken? Voorlopig hebben we niets anders.
Als Microsoft dit doordrukt, dan word er wel een precedent neergezet. En dat mag op het 1e gezicht wel logisch lijken, maar is het niet. Het precedent deelt het internet ook op. AI tools gaan er komen, maar de betrouwbaarheid van de AI resultaten word wel aangetast. Als men hetzelfde had gedacht ten tijde van het ontwikkelen van het Ethernet dan waren er zoveel verschillende standaarden geweest dat het internet als we dat nu kennen nooit van de grond zou zijn gekomen, Of erger, dat het alleen beschikbaar zou zijn geweest voor de 1%, want dat zou dan zo'n beetje de enige groep van personen zijn geweest die dat zouden kunnen betalen.
Er zijn zat concurrende standaarden geweest waar na "enig gevecht" iemand een miljardeninvestering moet afschrijven. Bijvoorbeeld een Microsoft die over moet stappen naar de Chromium rendering engine. Als je met de grote jongens wilt concurreren, dan kun je niet verwachten dat je hun broodwinning zomaar kunt afpakken.
Het punt is dat het nooit slim om tijdens de beginfase van eenderwelk wat de commerciele belangen te zwaar laten wegen over het algemeen belang.
Dus moet je een miljardeninvestering maar doneren aan het algemeen belang. Ik weet niet in wat voor fantasiewereld je leeft, maar dat is gewoon onrealistisch. Het is een bedrijf, geen filantropische instelling.
Daarnaast is er nog een ander ding waardoor Microsoft als een zeurend kind overkomt. Ja, zij hebben grof geld neergelegd voor de AI tools. AI tools die zijn getraind met data. En die data had Microsoft nooit zelf kunnen genereren. Die data komt vooral van jou en mij en iedereen. Is daar ooit voor betaald? Kunnen wij daarom gratis van de AI dienst gebruik maken?

Nee, wij worden er niet voor betaald en nee, gratis gaan die AI tools nooit worden. Misschien de half-getrainde AI van 1 a 2 generaties terug, gevuld met een nooit ge-updated dataset. Woohoo!
Je had het ook achter een paywal kunnen zetten. Maar het indexeren van het internet is een krankzinnig dure operatie (ik heb vroeger aan de Ilse zoekmachine gewerkt, dus ik ken de economics), en het hosten van die paar sites valt daar volledig bij in het niet. Microsoft is vrij liberaal in het toegankelijk houden van haar data voir onderzoek, waar Google dit echt lomp wegpest. Maar men trekt terecht een grens bij commerciele toepassing waar een ander gaat verdienen aan jouw werk.
Omdat die infra dubbel en dwars terug wordt verdiend door pure reclame-inkomsten. Dat die infra nogmaals dubbel en dwars wordt terugverdient door het aanbieden van dataprofielen (voor meer dan reclame doeleinden) aan 3e partijen.
Dat is niet wat Microsoft doet. Dus daar gaat je hele betoog ....
Google maakt daar geen geheim meer van. Microsoft zegt dat zij dat niet doen, maar denk je echt dat Microsoft dat geld op de tafel laat liggen? Als je dat nog steeds gelooft, dan ben je een stuk naiever dan je zelf denkt. Het enige dooel van Microsoft is geld verdienen. Zoveel mogelijk en zo snel mogelijk. Dat er zoveel mensen zijn die geloven dat Microsoft (na Gates/Ballmer) zichzelf op dat gebied zich waardiger gedraagt dan Google, daar kan ik met mijn verstand niet bij. Microsoft en Google ontlopen elkaar amper tot niet.
Ken vrij veel mensen in de product groups in Redmond, inclusief product managers bij Bing. Dit is gewoon BS.
Wat een flauwekul, je hoeft niets weg te geven, maar je kan niet van je mono of duopoly gebruik maken om concurrentie tegen te gaan.

Google’s en Microsoft’s search tak zouden hun andere takken zoals OS en AI niet moeten voortrekken. Dat is immers precies hoe Microsoft en Google in de problemen zijn gekomen met Internet Explorer en Chrome.
Zij maken gebruik van andermans data. Ik heb nog geen vergoeding gezien.
Een infrastrictuur? Volgens mij is het allemaal gebaseerd op data-mining met grof kapitaal erachter. Die "AI" is het creatief filteren en presenteren van die data.
Een lelijk gevolg van de hype is dat dankzij app-ecosystemen, het grootste deel van de individuele bijdragen automatisch in bezit komen van MS, Google, enz...
Hoezo monopolostisch dan? Iedereen kan zelf lekker alles indexeren als ze willen. Daar hebben ze geen monopolie op en er zijn ook geen blokkades voor.
Het is niet een standaard mono/oligopolie. Door de overweldigende investeringen die gedaan moeten worden, is dit niet betaalbaar/haalbaar voor kleinere partijen. Vergelijk het een beetje met de aanleg van glasvezel: Als anderen je al zijn voorgegaan wordt het voor latere partijen zeer moeilijk om in die markt te stappen. Want mogelijke afnemers zitten al bij die eerste partij.
Dus moet een partij het maar gratis weggeven? Verwacht jij ook dat je een gratis auto krijgt omdat je daar behoefte aan hebt? Als iedereen maar gewoon data moet weggeven die miljarden per jaar kost om te vezamelen, dan gaan die partijen het ook gewoon niet meer doen.
Wie heeft het hier over gratis? Er bestaat zoiets als een licentie.
Ze verzamelen andermans data waaronder mijn data. Ik heb nog geen vergoeding gezien.
Jij redeneert één kant op.
Ze verzamelen andermans data waaronder mijn data. Ik heb nog geen vergoeding gezien.
Jij redeneert één kant op.
Ze indexeren het, en tonen het als je zoekt, waarna mensen kunnen doorklikken. Dit is als klagen dat je vindbaar gemaakt bent in een telefoonboek. Als je iets op het web zet wil je toch dat het gevonden wordt, toch?

En Microsoft levert nog steeds gratis Outlook.com en OneDrive?
Als niemand in het telefoonboek wil - en die mogelijkheid heb je - dan komt er helemaal geen telefoonboek.

De leverancier van telefoonboeken geeft ook geen adressen weg, want de adressen zijn niet van de leverancier van de telefoonboeken.

Met de gouden gids is het als volgt: wil je als bedrijf vindbaar zijn, dan betaal je voor vermelding in de gouden gids. De samensteller van de gouden gids zorgt er vervolgens voor dat de gids geproduceerd en gratis verspreid wordt.

Elke analogie komt er op neer dat de onderneming achter de zoekmachine niet de eigenaar van de gegevens is. Anders zou Microsoft bijvoorbeeld kunnen beslissen dat jij je adresgegevens niet meer aan anderen mag verstrekken.
Wat een onzin weer, om dit weer op deze manier te roepen. Er zijn ook andere AI initiatieven, daarnaast kan een andere organisatie ook een search engine opzetten, in het verleden zijn er ook anderen geweest. Microsoft is ook later met Bing begonnen dan Google, daarnaast is Bing lang niet zo populair.
Andere bedrijven zijn vrij het internet te indexeren.
Een monopolie (uit het Grieks monos / μονος (alleen, enkel) + pōlein / πωλειν (verkopen)) is een situatie waarin een product of dienst slechts door één (markt)partij wordt aangeboden.
Aangezien je in dezelfde adem Google en Microsoft noemt (en er zijn er uiteraard meer), geeft dat al aan dat dit geen monopolie kan zijn. Hooguit een oligopolie, waarbij het aantal aanbiedende partijen beperkt is.

Niettemin lijkt me dit eigenlijk helemaal niet zo'n probleem. Zoals @_Dune_ en @Zapato al aangeven staat het anderen vrij om ook het internet te indexeren en via een zoekmachine aan te bieden. Waarom zouden Microsoft en Google de tools daarvoor moeten overhandigen?
Omdat het niet zo eenvoudig is om het internet te indexeren, omdat het internet zich heeft aangepast aan de schaal en regels van Google.

En het zou kunnen dat ze hun tools moeten aanbieden als het niet aanbieden er van een poging is een oneerlijke voorsprong te krijgen:

https://www.ftc.gov/advic...pply-chain/refusal-supply
Zoals in je bron te lezen valt, zijn ze niet verplicht om te leveren en is het alleen "unlawful" als Google hierover afspraken met de andere indexerende partijen maakt.
Het goed indexeren van het hele internet is een extreem dure en tijdrovende klus. Dus waarom zou je je als partij moeten laten beroven van je harde werk zodat een ander ermee kan gaan pronken? Als ze zo graag zoekmachine willen spelen, dan moeten ze ook het vervelende werk doen....

[Reactie gewijzigd door J_van_Ekris op 25 maart 2023 15:48]

Google en Microsoft zijn de enige twee bedrijven die het gehele internet zelfstandig geïndexeerd hebben.

Valt hieronder ook het Darkweb / Tor?
Het gehele internet kennen de meeste mensen als Google en zoekopdrachten invullen en naar de desbetreffende pagina navigeren. Eigenlijk leef je in een grote gecreëerde circulaire bubbel van bijvoorbeeld Google.
Alles daarbuiten is onbekend terrein.
Waarschijnlijk zouden deze bedrijven een redelijke index kunnen maken op basis van links op het normale internet.
Wat content betreft is het waarschijnlijk niet heel relevant omdat veel achter logins zit en dus niet direct toegankelijk is.
Wanneer je zelf bijvoorbeeld een forum opzet en accounts alleen handmatig activeert zal google/ms die content ook niet kunnen indexeren.

Wat betreft bubbels hebben zoekmachines het internet alleen maar groter gemaakt. Bedenk even hoe je informatie zou vinden zonder een zoiets als google.
Je zal dan mensen moeten vragen of beginnen op een index met gecategoriseerde links, zoiets als startpagina vroeger.
Moeilijk te geloven maar voor google waren er ook andere zoekmachines.
Maar dan zat je dus in de bubbel van die zoekmachine. Toen ik overstapte op Google van Altavista was dat voornamelijk doordat Google betere resultaten gaf.
Het probleem dat mensen met Google hebben is ook meestal niet de resultaten van een zoekopdracht maar meer de tracking en de grootte van het bedrijf.
Als ik iets zoek vind ik meestal wat ik moet hebben op de eerste pagina en zo niet dan geeft dezelfde zoekopdracht in een andere zoekmachine geen betere resultaten omdat 't iets heel specifieks is.

Mijn punt was echter meer in het grotere geheel. Het internet is toegankelijker met zoekmachines dan zonder ondanks dat je in de bubbel van de zoekmachine zit.
"Het probleem dat mensen met Google hebben is ook meestal niet de resultaten van een zoekopdracht "

dat was ooit zo totdat...
ze begonnen met 'sponsored results' en andere commercieel en politiek georienteerde manipulatie van de resultaten...
sindsdien worden de zoekresultaten van google steeds slechter
Tja, je moet het maar zien als de Telefoongids denk ik. Iedereen staat er automatisch in, tenzij je bewust er niet in wilt komen. Tor is dan meer een soort 0906 lijn, je maakt contact en kunt dan vanuit daar verder naar een telefoonlijn naar je keuze.
Nee, en in principe klopt die claim ook niet. Ik heb ook een paar websites die niet geïndexeerd zijn, dus daarmee vervalt dat hele statement al. Tenzij ik die adressen hier neerzet, dan gaat het niet lang duren.

Correcter zou zijn: Google en Microsoft zijn de enige twee bedrijven die in principe het gehele internet proberen te indexeren.

Maar we snappen wel wat er bedoeld wordt.

[Reactie gewijzigd door xFeverr op 25 maart 2023 17:48]

Aan de ene kant begrijpelijk dat men niet wil dat hun kostbare data of AI output gratis wordt gegraaid door anderen.

Aan de andere kant is de visbare data vijver erg leeg aan het raken als iedereen zijn eigen afgeschermde subvijver aanlegt. Kan je nog zoveel AI en algoritmes op loslaten, als er bijna geen vis in zit, vang je niets.

Als steeds meer resultaten uitkomen bij de bekende SOE giganten, AliE, Bol, Amazon etc, heb je geen zoekmachine meer nodig. Bij de rest loop je tegen irritante "installeer onze app" spam aan van bijvoorbeeld LinkedIn, Twitter, Facebook, Instagram (...), of het is door AI gegenereerde junk ("how to make instant coffee, an EXE is an executable application of AI gegenereerde literaire boeken / NFT).
Het is niet zo dat de data zelf afgeschermd is, maar de indexatie. Meerdere zoekmachines/indexen kunnen dezelfde data bevatten. De “vis” verdwijnt dus niet uit de vijver, meerdere bedrijven kunnen dezelfde vis opnemen in hun index.
Google en Microsoft zijn de enige twee bedrijven die het gehele internet zelfstandig geïndexeerd hebben.
Brave Search heeft ook zijn eigen index.
Wikipedia: Brave Search uses its own web index. As of May 2022, it covered over 10 billion pages and was used to serve 92% of search results without relying on any third-parties
Hoewel 92% inderdaad geen 100% is, ben ik wel benieuwd hoe we weten dat Microsoft en Google het gehele internet hebben geïndexeerd.
Google geeft geen licenties uit voor het gebruik van diens zoekindex [waardoor] alle andere zoekmachines aangewezen zijn op Bing.
Behalve Brave Search dus. Die kan gewoon hun A.I. summarizer blijven gebruiken neem ik aan.
92% van de zoekresultaten komen uit de eigen index. De andere 8% uit andere indexes (waarschijnlijk dus Bing als dat de enige andere index is waarop toegang mogelijk is). Maar dat betekent natuurlijk niet dat hun index 92% van het internet geïndexeerd heeft. Het zegt alleen iets over hun index t.o.v. die van Microsoft.
Maar t artikel gaat ervanuit dat google en bing wel het "hele" internet geindexeerd hebben. Dat betekent dus dat bing bijna evenveel geindexeerd heeft en slechts 8% mist van het "hele" internet
Maar we weten denk ik allebei dat dat niet zo is. Zo indexeren ze geen NNTP berichten, volgens mij ook geen Discord servers. Sowieso dus al niet het “gehele internet”. Als we ons beperken tot via http/https bereikbare webpagina’s dan nog zal geen partij 100% dekking hebben.
Dat klopt niet helemaal. Je kan waarschijnlijk een index maken van 10% van het internet waarmee je 50% van je search queries kan beantwoorden. Dat doe je door te focusen op de grotere websites.

Voor de tweede 50% zal je veel meer werk moeten doen, want om die overige queries te kunnen beantwoorden zal je veel meer en obscuurdere websites moeten indexeren.

Dus 92% van de search queries kan je waarschijnlijk beantwoorden met een index dat minder is dan 92% van het internet.
Google geeft geen licenties uit voor het gebruik van diens zoekindex, hetgeen betekent dat alle andere zoekmachines aangewezen zijn op Bing.
Dat klopt niet, startpage.com gebruikt Google.
Kagi en Startpage licenseren Google’s resultaten nog steeds, ook al zegt dit artikel dat dat niet kan.

Kagi licenseerde vroeger ook Bing’s resultaten (om ze te mixen met die van Google en hun eigen) maar door deze maatregelen zijn ze er mee op gehouden.
Niemand denkt hiermee toch de zondevloed te kunnen tegenhouden? Als dit zo doorgaat kunnen dit soort modellen binnen de kortste keren een complete mental map opbouwen van alle werkzaamheden die binnen het team van Bing waarschijnlijk gebeuren en daarmee aan de slag. Wat een gerommel in de marge weer.
Ze hebben hun model getrained en nu dus niet meer verdere data nodig om het te trainen. Dus nu gooien ze het dicht voor de concurrentie om het hun moeilijker te maken. Wel weer jammer dit.

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee