EU steekt 120 miljoen in Duitse zoekmachine

De Europese Commissie heeft een subsidie van 120 miljoen voor het Duitse Theseus-project goedgekeurd. Onder andere SAP, Siemens en Deutsche Thomson gaan met het geld aan een semantische zoekmachine werken.

Theseus - met de bekende rode draad - in het doolhof van de MinotaurusHet Theseus-project beoogt de bouw van een zoekmachine die niet op losse woorden zoekt, maar informatie teruggeeft aan de hand van de betekenis van een zoekterm. Door context en samenhang van de verschillende woorden van die zoekterm in ogenschouw te nemen, moet een gebruiker veel sneller bij de juiste informatie terecht komen - maar de bouw van dergelijke software valt niet mee. Het Frans-Duitse samenwerkingsproject Quaero heeft in de afgelopen twee jaar alleen een pagina met wat 'zakelijke' informatie opgeleverd. Achter de schermen werd wel druk gebakkeleid over de te varen koers: het maken van een keus tussen semantische functionaliteit, het doorzoeken van rich media en geavanceerde beeldherkenning bleek echter te hoog gegrepen. Eind vorig jaar maakte de Duitse regering dan ook bekend dat ze zich op een eigen Web 2.0-zoekmachine wilde richten. Dit zogenoemde Theseus-project heeft nu dus de steun van de EU verworven, waarmee Quaero definitief verleden tijd lijkt te zijn.

Of Theseus wel in staat zal blijken om een zoekmachine-met-meerwaarde te produceren, blijft voorlopig onzeker. De ambitieuze doelstellingen van het Duitse project staan op gespannen voet met de agressieve marktbenadering van spelers als Google en Microsoft. Die kunnen weliswaar nog niet bogen op 'semantisch zoeken' en dergelijke Web 2.0-features, maar zij zijn wel in staat om hun zoekmachines in hoog tempo uit te breiden en te verbeteren, al is dat dan met kleinere stapjes. Aan de andere kant zal de EU graag zien dat er vanuit Europa tegenwicht aan het marketinggeweld van de Amerikaanse zoekgiganten wordt geboden. Volgens analist Trip Chowdhry van onderzoeksfirma Global Equities wordt Theseus echter hoe dan ook geen concurrent van bedrijven als Google: 'Zelfs als ze met een semantisch web op de proppen komen, zal Google domweg opdrachten aan Theseus doorgeven en de resultaten weer aan de eigen gebruikers presenteren, precies zoals ze dat met Wikipedia gedaan hebben.' Wel staat vast dat bedrijven als SAP en Siemens een flinke pot met geld mogen verdelen, en als alles volgens plan verloopt zal vervolgens een schare kleinere bedrijven worden ingezet om de verschillende onderdelen van Theseus uit te werken.

Door René Wichers

Eindredacteur

24-07-2007 • 17:45

65

Bron: CNN

Lees meer

Reacties (65)

65
56
20
8
1
12
Wijzig sortering
Goh, ik lees hier verbluffend veel reacties van mensen die vinden dat dat beter voor pakweg belastingsvermindering zou worden gebruikt. Sorry, maar de werkelijkheid zit iets ingewikkelder ineen.

1) Het gaat over de EU, die innen geen belasting van je. Het systeem van landen die geld ontvangen of geld geven in de EU is een complexe (begortings)evenwichtsoefening. Dat heeft hier helemaal geen uitstaans mee.
2) 120 miljoen euro belastingskorting, dat zal ongeveer 1 euro / man zijn (geen idee hoeveel percent van de EU onder de noemer actieve bevolking valt en te lui om het op te zoeken). Ontzettend grote belastingskorting nietwaar? :p
3) Dit is gewoon R&D, net zoals de deeltjesversneller in Lausanne en vast ook wel enkele Nederlandse en Belgische onderzoeksprojecten.
4) Het betreft toch wel een innovatie zeker? "Het Theseus-project beoogt de bouw van een zoekmachine die niet op losse woorden zoekt, maar informatie teruggeeft aan de hand van de betekenis van een zoekterm."
Het systeem van landen die geld ontvangen of geld geven in de EU is een complexe (begortings)evenwichtsoefening. Dat heeft hier helemaal geen uitstaans mee.
1) De eu landen betalen geld aan de eu en waar denk je dat deze landen hun geld vandaan halen? Juist, gewoon inkomsten belasting, accijns, btw etc etc
2) Dat is een beetje kul argument. Dat het per inwoner niets voorstelt is geen reden om maar geld over de balk te smijten. Als NL 120 mil meer te besteden heeft kun je daar best wel wat leuks voor doen.
3) Het wordt in de titel een DUITSE zoekmachine genomend. Dit heeft meer weg van een manier om geld terug te laten stromen van de EU naar duitsland. Juist op die terugstroom van geld doet NL het heel slecht wat dus betekend dat wij als klein landje mee moeten helpen om het duitste bedrijfsleven te financieren.
4) De bedrijven zullen uiteraard wel wat doen met dat geld, maar 120 mil voor een paar artikeltjes en wat interessante ideeen vind ik weggegooid geld. Een bedrijf als google heeft veel en veel meer tot zijn beschikking (kennis & mensen) om een veel betere zoekmachine te maken dus bij voorbaat staat al vast dat het niets wezenlijks zal opleveren.
Volgens mij weten weinign mensen maar wat met een semantische zoekmachine wordt bedoeld...

Kijk google is een text-search zoek machine die werkt met page-ranking en andere tweaks (bold gedrukt is belangrijker, kopjes zijn belangrijker etc etc )..

Een semantische zoekmachine analyseerd een pagina op semantiek ipv op losse woorden.
Voorbeeld. Stel een internetpagina X heeft de volgende gegevens:

"Een olifant is groter dan een aap" en
"Nijntje is een olifant"
"Pietje is een aap"


Als ik google zou vragen "is pietje groter dan nijntje" zou google gewoon een stomme lijst pagina''s weergeven waarin de woordnen 'is', 'pietje' 'groter' etc zou voorkomen..
Een ideale semantische zoekmachine zou simpel zeggen:

"Nee volgens pagina X is pietje niet groter dan nijntje, pietje is namelijk een aap en nijntje is een olifant: olifanten zijn groter dan apen".

De complexiteit van het maken van zo'n zoekmachine is ontzettend groot.

Het afleiden van deze informatie kan tegenwoordig al, maar zulke informatie uit een pagina halen is ontzettend moeilijk. Maar als het allemaal lukt kun je ontzettend complexe vragen aan een zoekmachine stellen.

IPV dat je (zoals je nu doet) termen intikt en daarop zoekt, type je gewoon de vraag zoals je die aan elk ander mens zou stellen. Jammer alleen dat je met HTML weinig semantische markup kunt geven.
Ik denk dat jij verwart met een logische zoekmachine (als er al zoiets bestaat, eigenlijk is dat dan geen zoekmachine meer). Een semantische zoekmachine in mijn oren is er eentje die, wanneer ik zoek naar 'italiaanse pasta', mij ook de volgende resultaten weergeeft:

spaghetti, canneloni, penne, tortellini ...

Of misschien zelfs meertalig bij 'konijn':

lapin, rabbit, kanin, konijn ...

Met andere woorden: de zoekmachine 'verstaat' de inhoud, de betekenis van het woord, en niet alleen de vorm van het woord. Op dit moment verstaat Google bijna alleen de woordvorm. Als je zoekt op 'taart' dan ziet Google dat in feite als 't', 'a', 'a', 'r', 't' (de vorm). Theseus zou het kunnen beschouwen als 'zoet gebak dat vaak, maar niet uitsluitend, op feestelijke gelegenheden gegeten wordt'.

Dit brengt natuurlijk wel met zich mee dat het makkelijker wordt om — indien gewenst — bepaalde inhoud makkelijker te weren. Bij Google moet je kinderporno weren door op woorden te gaan blokkeren, Theseus zou kunnen 'leren' wat kinderporno is en de juiste sites tegenhouden. Keerzijde van de medaille is dat dat ook wel met het Tien an Men-plein kan.
Nee dat is onjuist.

Je gebruikt de termen ook een beetje op een vage manier vindt ik.

Een semantische zoekmachine gebruikt gewoon de semantiek, de betekenis van de gegevens om er doorheen te zoeken: simpel as that.

En inderdaad dat gebeurd vaak doormiddel van logisch redeneren.

Als ik "italiaanse pasta" zoek, dan zoek je pasta dat uit italie komt. Een semantische zoekmachine begrijpt dat.


Ik heb het niet altijd bij het juiste eind, maar nu zit ik niet ver van de waarheid,
ik heb er vakken over gehad.

Zoek maar eens bij google naar "Semantische web" of "Web ontology language" dan zie je wat er allemaal te doen is hierom

[Reactie gewijzigd door tjerkw op 26 juli 2024 21:32]

Bah, italiaanse pasta, ok.
Maar wat doe je met 'lekkere broodjes' ?
Of mooie kunst?

Het probleem met semantiek is dat het contextgevoelig is!.
Semantiek betekent betekenis.

De zoekmachine zou dus in staat moeten zijn de -betekenis- van je vraag te ontleden door het in context te kunnen plaatsen.
De vraag is in hoeverre het mogelijk is voor een computer om zoveel informatie (als je op het web kan vinden) contextueel correct te relateren. En welke context IS correct? Want vaak zijn er meerdere contexten voor 1 woord.

Wij mensen gaan hele gesprekken/debatten met elkaar aan om onze context te verduidelijken. Dat zie ik nog niet zo snel gebeuren met een computer.

Dit project zal hooguit een paar grappige research tools opleveren maar zal niet in staat zijn grote bergen uiteenlopende informatie goed te relateren.
Je stelt het nu wel heel ideaal voor. Het semantische web is niets anders dan een web dat begrepen kan worden door machines. Hierdoor kunnen computers taken overnemen van gebruikers (voornamelijk filteren en combineren van gegevens).

Dit zal -zeker de komende jaren- nog niet eens in de buurt komen van jouw voorbeeld. Ik zal al blij zijn als deze voorbeelden werkelijkheid worden:
In theory, a semantic Web could receive a user request for information about fishing, for example, and automatically narrow the results according to the user's individual needs rather than blanket the user with pages related to numerous aspects of fishing.
(uit het bron artikel)
For example, a computer might be instructed to list the prices of flat screen HDTVs larger than 40 inches with 1080p resolution at shops in the nearest town that are open until 8pm on Tuesday evenings.
(uit de Wiki pagina over Semantic Web)

Het grootste obstakel vormt momenteel het feit dat het grootste gedeelte van het web is gemaakt voor mensen. Zolang dit niet verandert, wordt het een hele kluif voor een zoekmachine om er semantiek uit te halen. Zelfs 120 mln. verandert daar weinig aan.

[Reactie gewijzigd door Cameleon73 op 26 juli 2024 21:32]

Je hebt gelijk, maar dat zijn wel de uiteindelijke doelen :-)
Wij hebben het hier over een semantische ZOEKMACHINE en niet over het semantisch WEB.

Op zich is het wel zo dat een semantisch web een semantische zoekmachine zou kunnen helpen dingen in een bepaalde context te plaatsen.
Maar het kan ook heel gemakkelijk de oorzaak zijn van het incoorect relateren van gegevens.

Ik denk dat het veel beter zou zijn als een semantische zoekmachine geen gebruik maakt van hulpmiddelen (semantisch web) om tot een verband te komen. Dat is namelijk minder manipuleerbaar.
de Amerikaanse overheid koopt zeker geen reclame bij google?
daar zijn de amerikanen berucht om, om particulieren bedrijven aan kant te maken en vooral in andere landen.


net als Boeing en airbus, wij betalen Airbus omdat Boeing dankzij Amerikaanse overheid steun te groot is geworden.

[Reactie gewijzigd door stewie op 26 juli 2024 21:32]

Lekker nuttig dit, is dat geld niet ergens anders voor te gebruiken? Wat is er mis met Google.
Ja dit is zeker nuttig. Google is niet zaligmakend!! Waarom zou er niet een nieuwe zoekmachine gebouwd mogen/moeten worden die nog beter werkt dan welke er nu zijn.

En daarbij is het belangrijk dat Europe tegenwicht biedt tegen Amerika. Op alle vlakken. Je wilt toch niet afhankelijk worden/blijven van Amerika?
Anoniem: 175502 @mkools2424 juli 2007 17:52
Het Theseus-project beoogt de bouw van een zoekmachine die niet op losse woorden zoekt, maar informatie teruggeeft aan de hand van de betekenis van een zoekterm. Door context en samenhang van de verschillende woorden van die zoekterm in ogenschouw te nemen, moet een gebruiker veel sneller bij de juiste informatie terecht komen
Alleen zou die computer dan wetenschap moeten hebben over de door MIJ bedoelde context, aangezien ik de vraag stel. Om die context uit te leggen zou ik eerst een paar goede gesprekken moeten hebben met die computer. En dat voor die ene vraag.
Gaat dus gigantisch falen dit.

[Reactie gewijzigd door koelpasta op 26 juli 2024 21:32]

Hmm,, dit is toch ook het idee van Googles Pagerank? Hoe meer bezoekers, hoe hoger je rank! Oke, hier komt meer bij kijken..

Maar, wie zegt dat als de gebruikers er niet genoeg mee praten, dat er dan wel goede resultaten komen. Het blijft tenslotte een van zichzelf lerende zoekmachine welke dus steeds betere resultaten gaat geven.

Superfetch is toch ook ongeveer hetzelfde idee, wat dat doet is alleen gebruikers-info-ervaringen opslaan, en aan de hand daarvan zijn RAM volgooien.
Het verschil zal zijn dat je geen gesponsorde links zult krijgen neem ik aan. Dus geen notering die op commercie is ingegeven.
Dat lijkt mij sterk, het geld zal ergens aan moeten worden terugverdiend. Het gaat niet om liefdadigheid.
Daarom krijgen ze ook 120 miljoen van de EU aan subsidie ;)
Dus 'wij' betalen er eerst aan mee via belasting, zodat ze vervolgens via gesponsorde links weer geld mee verdienen. :?

Kan me niet herinneren dat Google, Yahoo of Ilse, etc ooit een subsidie hebben gehad van welke overheid dan ook om een zoekmachine te bouwen.

Lekker zinloos die EU geldspons
Tja, al het geld is ergens anders voor te gebruiken. Dat de EU geld steekt in zoek technologie is goed, al was het maar omdat sinds Google daarop de dominante partij is, het lijkt of er helemaal geen innovatie meer op dat gebied is. Wat ik me wel afvraag of 120 miljoen nou niet heel erg veel voor zoiets is.
Wat is er mis met Yahoo!?

Deze zoekmachine bied niet alleen een nieuwe methode van zoeken en zal ook niet afhankelijk zijn van reclame inkomsten of aandeelhouders.
Anoniem: 45450 @davidem24 juli 2007 22:24
Ik denk dat Blokker_1999 met "deze" verwijst naar Theseus en niet naar Yahoo
Aangezien Theseus word gefinanceerd en ontwikkeld in het publieke domein, door universiteiten en andere onderzoeks groepen zal dit resulteren in een paar duizend publicaties inplaats van patenten zoals bedrijven zouden doen :) .

Dus zal Google met deze publicaties (papers) al snel zijn eigen zoekmachine kunnen uitbreiden met symantisch zoeken. Inplaats van resultaten doorlinken als Analyst Trip Chowdhry suggereert.
Anoniem: 115055 @djexplo24 juli 2007 18:21
Lichterlijk achterhaalde aanname dat universiteiten en andere onderzoeksgroepen naast publicaties geen patenten zouden aanvragen?
Instituten en universiteiten kunnen toch ook patenten aanvragen? Ik denk dat het slim is van die 120 miljoen ook wat geld voor patentaanvragen te reserveren.
Ja, lekker slim, ons belastingsgeld uitgeven zodat anderen daar rijk van kunnen worden.
Normaalgesproken noemt men dat diefstal.
Verschil USA en EU: In de USA is Google een particulier bedrijf.
In de EU moet een Google-alike met overheidssteun ontwikkeld worden
8)7
En waarschijnlijk gaat niemand hem dan ook gebruiken en zijn ze verwonderd . Ze konden beter 120 miljoen aan de minder inkomensrijke mensen geven
Dit valt gewoon onder het kopje stimuleren van innovatie en wat mij betreft is daar niets mis mee.

Iedereen zegt altijd dat de overheid innovatie moet stimuleren, nu doen ze dat en dan kunnen ze het geld beter aan de "minder inkomensrijke mensen" geven.

Natuurlijk is het logisch om sceptisch te zijn na het mislukken van het eerdere project zoals ook in het artikel geschreven staat, maar dat wil nog niet zeggen dat er iets mis mee is om hierin te investeren.

Dit geld is een stuk beter besteed dan al die subsidies aan de landbouw die ervoor zorgen dat arme boeren in Afrika over de kop gaan door de dumpprijzen waartegen onze producten daar aangeboden worden.

[Reactie gewijzigd door Dragonslaughter op 26 juli 2024 21:32]

Als ze willen stimuleren moeten ze de 120 miljoen euro uitloven onder een aantal bedrijven die dan een prototype kunnen ontwikkelen. Prutsers.
Geld weggeven heeft nog nooit een mens gestimuleerd. Daar gaan onze belastingcenten, waarschijnlijk op aan salarissen van "belangrijke" managers.

Met google vind je alles, als iemand een beter idee heeft, laat hem dan zn eigen bedrijfje starten, patent aanvragen en 120 miljoen verdienen.

Beetje Staat-gereguleerde toestanden hier. Iemand nog een idee voor vernieuwing van de EU?...
uhmm.. stimuleren door geld te geven aan grote multinationals die alles dichtspijkeren met patenten en daar op gaan teren?? .. dacht het niet.

Bovendien is een semantische zoekmachine (zoals voorgesteld) naar mijn mening niet te realiseren, althans, niet op een goede manier.
Weggegooid geld dus.

Bedenk ook dat een semantische zoekmachine zo ongeveer de heilige graal is van zoekmachines. Er zijn particuliere bedrijven die -miljarden- te besteden hebben en die zijn OF al op hun bek gegaan OF durven het niet aan.

EU durft het wel aan, het is namelijk niet hun maar ons geld dat wordt uitgegeven.
Dit valt meer onder het kopje; "concurrentie vervalsing" alsof google steun heeft gehad om hier (lees: Europa) een poot aan de grond te krijgen. Google is er al, en goed ook. Waarom geld inversteren in een project dat nooit kan tippen aan een bedrijf met miljarden.
120 miljoen weggeven? Nee, doe dan de belasting maar omlaag en spoor de minder inkomensrijken aan zich te ontwikkelen en op de arbeidsmarkt te begeven.
laat die rijken dan relatief ook zoveel meebetalen.. hoe rijker hoe goedkoper het leven.. zie jij de logica? Waarom hoeft een rijk iemand relatief minder mee te betalen als een doorsnee bewoner?
Offtopic:
Dat kun je ook andersom zien, waarom moet iemand die meer verdient ineens overal de hoofdprijs voor betalen?
Ik leun zelf eerder tegen arm dan rijk aan, dus ben echt niet bevooroordeelt, maar vind het gewoon niet logisch. Meer inkomensbelasting ok, maar daar houdt het wat mij betreft ook op.
Ze konden beter 120 miljoen aan de minder inkomensrijke mensen geven

Als jij vindt dat we nog niet genoeg geld uitgeven aan werkweigerende uitkeringsgerechtigden, dan geef jij ze toch gewoon wat extra's?
Deze 120 miljoen willen we investeren in R&D (of het wat oplevert is een ander verhaal, maar bij jouw optie zeker niet)

[Reactie gewijzigd door DavidAxe op 26 juli 2024 21:32]

ja iedereen zit in de uitkering omdat het zo geweldig leuk is |:(
tegendeel is waar: enkele uitzuigers verpesten het voor mensen die echt even hulp nodig hebben. Degelijk reïntegratie programma zou al veel helpen.
Hoho, ik werk op dit moment voor een minimumsalaris -in afwachting op een betere baan- en draag netjes mijn belasting af: ik ben dus geen werkweigerende uitkeringsgerechtigde. Dat gezegd hebbende, vind ik die 120 miljoen een enorme verspilling van belastinggeld. Laat me liever minder belasting betalen en dat soort onzinprojecten achterwege.

Bovendien weten we allemaal hoe dit gaat, over een half jaar moet er nog eens 60 miljoen ingepompt worden omdat het allemaal niet zo verloopt als de onrealistisch optimistische schattingen hadden voorspeld ;(.

[Reactie gewijzigd door Top-Rob op 26 juli 2024 21:32]

Anoniem: 113966 @DavidAxe25 juli 2007 00:33
Ja sorry hoor, maar ik heb veel liever dat kansarme kinderen worden geholpen, desnoods in andere landen buiten de Unie, dan dat er geld word gesmeten in dit soort Kansloze projecten!

Van de loonbelasting die ik jaarlijks afdraag kunnen er 2 gezinnen modaal leven, en dat heb ik veel liever dan dat er geld wordt verbrand in een nutteloos project.

Mijn Box 3 heffingen zijn fenominaal! en dat stoppen ze daarin?!
Sorry maar begint mijn bloed echt van te koken!

Edit; typo

[Reactie gewijzigd door Anoniem: 113966 op 26 juli 2024 21:32]

Anoniem: 62011 @VonFoX24 juli 2007 17:56
Uiteindelijk betaald de gebruiker toch de rekening, dus maakt niet zo veel uit.
je kan als particulier niet concurreren met google..
in de VS is er ook geen concurrent, MSN/google en all die andere worden ook via-via betaald met overheids geld..

de EU is gewoon veel directer en speelt het niet via de achter kamertjes ala USA, de VS is echt niet zo'n particulier paradijs als je denkt, alle grote bedrijven in de VS worden betaald door de overheid op een of andere manier.

boeing word toch ook betaald door de Amerikaanse overheid, de reden waarom de VS gestopt is te klagen over Airbus...
Anoniem: 64619 24 juli 2007 18:18
Europa is al een tijdje bezig met het onafhankelijk worden van met name Amerika, dit is gewoon een van de (nog vele te komen) stappen daar naartoe

het is zelfs niet ondenkbaar dat over een paar jaar Europa ook begint met het ontwikkelen van een eigen besturingssysteem of dat het massaal linux gaat omarmen en het gebruik ervan gaat stimuleren

maar nogmaals dit is slechts een stap van de vele die we doen in alle richtingen om onafhankelijker te worden
Aan de kortzichtige en domme reacties van mijn mede tweakertjes hierboven te zien, denkt half ICT nederland bij het woord zoekmachine alleen maar aan een website waarmee je andere websites kunt opzoeken. En vergeet men voor het gemak even dat in vrijwel iedere software applicatie en OS een zoekmachine is ingebakken. En dat de afzet markt van een dergelijk product dan ook gigantisch is.
Aan de kortzichtige en domme reacties van mijn mede tweakertjes hierboven te zien, denkt half ICT nederland bij het woord zoekmachine alleen maar aan een website waarmee je andere websites kunt opzoeken.
Het artikel gaat dan ook over een Web 2.0-zoekmachine.
Eind vorig jaar maakte de Duitse regering dan ook bekend dat ze zich op een eigen Web 2.0-zoekmachine wilde richten. Dit zogenoemde Theseus-project heeft nu dus de steun van de EU verworven, waarmee Quaero definitief verleden tijd lijkt te zijn.
Anoniem: 217733 24 juli 2007 19:03
Ik vind het ongelooflijk dat balkenende flinke bezuinigingen heeft moeten doorvoeren en dat de EU met dit soort dingen geld over de balk smijt. Ik ben niet verbaasd dat de EU niet populair is in NL...

En al die mensen die betere dingen weten te doen met 120 mil... waarom zou je het uberhaupt uitgeven ?. Als de overheid dit over heeft gewoon terug geven aan de mensen die het hebben betaald (dwz belasting verlaging). Of desnoods de staatschuld omlaag brengen want dan heb je weer minder rente lasten.

[Reactie gewijzigd door Anoniem: 217733 op 26 juli 2024 21:32]

En weer wordt de onzinterm Web 2.0 gebruikt. :/

En ik wl idd ook niet mn belastingcenten aan een zoekmachines uitgeven hoor :|
Inderdaad de term 'Web 2.0' staat in principe voor niks: technisch gezien.

Marketing technisch gezien is het een superTerm!
En dus niet dom dat ze het gebruiken.

Op dit item kan niet meer gereageerd worden.