Het Semantic Web en netwerktechnologische cognitieve uitbreidingen
Final paper for the course Wikisofie
ABSTRACT
The Semantic Web is initiated as a project which would make the semantics of the information in the collection of documents which form the Web, understandable for machines. In this paper I will show some of the arguments for the statement that this project is too ambitious and in fact relies on strong AI. Therefore, it is in the foreseeable future impossible. Instead, I will show an alternative use of the Semantic Web, namely to make the information on the Web even better accessible to human users. By using the Semantic Web in Augmented Reality applications, the required information could be found easier and, more important, could be presented in ways which are better suitable than the natural language in which it is presented in on the Web. This would lower the information access cost significantly, especially when presenting more complex information, which makes the possibility of network-enabled cognition much more plausible.
Inleiding
Het Internet heeft ongelofelijk grote effecten op de samenleving: in de afgelopen jaren heeft het menselijke activiteiten als werken en communiceren getransformeerd. De vraag of het een soortgelijke invloed kan hebben op ons denken begint steeds relevanter te woorden. Ongeveer dit vraagstuk legt John Brockman aan 151 vooraanstaande denkers voor in het boek ‘Hoe verandert Internet je manier van denken?’ (Brockman, 2011)[1]. Interessanter nog dan dit vraagstuk, vind ik de vraag: ‘Kan het Internet onderdeel zijn van je denken?’. In deze paper wil ik, in het licht van de theorie van de uitgebreide geest, bespreken of een dergelijke netwerktechnologische cognitieve uitbreiding mogelijk is en wat de beperkingen zijn hierbij.
In het bijzonder zal ik de stelling doen dat het Semantic Web, hoewel oorspronkelijk bedoeld als representatie van het Web geoptimaliseerd voor computers, een belangrijke rol kan spelen in het presenteren van complexe informatie en daarmee in het cognitief transparanter toegankelijk maken van informatie op Internet, hetgeen bijdraagt aan de mogelijkheid van netwerktechnologische cognitieve uitbreiding.
Om tot deze stelling te komen zal ik eerst het project van het Semantic Web en de kritiek die het gekregen heeft bespreken. Vervolgens geef ik een brede benadering van de mogelijkheid van cognitieve uitbreiding met netwerktechnologie en de belangrijkste barrières hierbij. In het laatste hoofdstuk zal ik dan de potentiële functie van het Semantic Web hierin bespreken.
Semantic Web: een inleiding
In een artikel voor het populairwetenschappelijke tijdschrift Scientific American, getiteld ‘The Semantic Web‘ (Berners-Lee, Hendler, Lassila, 2001), wordt een introductie gegeven in de gelijknamige ontwikkeling binnen de ICT. Het Semantic Web[2] zou een revolutie zijn in de informatietechnologie doordat het verandert voor wie of wat de informatie op het Web geproduceerd is. Het ‘traditionele’ World Wide Web bestaat grotendeels uit documenten die in natuurlijke taal geschreven zijn en via hyperlinks met elkaar verbonden. Hiermee is de informatie geoptimaliseerd voor menselijke consumptie. Een belangrijk doel van het Semantic Web is volgens Berners-Lee, die overigens de uitvinder van het World Wide Web en directeur van het W3C[3] is, om de informatie op het Web te optimaliseren voor computers:
“The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents roaming from page to page can readily carry out sophisticated tasks for users.” (Berners-Lee et al., 2001)
Uit het volgende citaat (Berners-Lee and Fischetti, 1999) blijkt nog beter de hoge verwachtingen die Berners-Lee[4] heeft van het Semantic Web:
“[a Web in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.” (Berners-Lee and Fischetti, 1999)
Het Semantic Web vormt een uitbreiding op de via hyperlinks verbonden webpagina’s van het ‘traditionele’ Web. Door het toevoegen van data bedoeld voor computers aan bestaande webpagina’s en het creëren van nieuwe documenten die geoptimaliseerd zijn voor computers, wordt geprobeerd bovenstaande doelen te bereiken. Er wordt een aantal webtechnologieën en protocollen gebruikt om structuur aan te brengen in de enorme hoeveelheid semantische informatie die staat opgeslagen op het Web.
Ik zal hier twee van de belangrijkste protocollen en bijbehorende dataformaten bespreken die bijdragen aan het doel van het formeel beschrijven van de concepten, termen en begripsrelaties zoals die bestaan op het Web.
Het RDF (Resource Description Framework) Schema vormt een belangrijke methode in de kennisrepresentatie van het Semantic Web. Met het RDF-formaat worden twee begrippen, een subject en een object, met elkaar verbonden via een relatie. Voorbeelden van een dergelijke relatie zijn: ‘is de auteur van’, ‘ligt in’, of ‘is geboren in’. Elk concept krijgt hierbij een URI[5], waarmee net als bij webpagina’s een unieke verwijzing wordt vastgelegd. Met de koppeling tussen deze concepten kunnen bijvoorbeeld personen gekoppeld worden aan een huisadres, hoofdsteden aan een land, of papers aan auteurs. Met behulp van deze kennisrepresentatie zou een groot gedeelte van de beschikbare informatie op het Web kunnen worden vastgelegd op een wijze die eenvoudig leesbaar en manipuleerbaar is voor een computer.
Een ander belangrijk formaat is de OWL (Web Ontology Language). De ontologieën zijn bestanden waarin formeel wordt vastgelegd wat voor relaties er kunnen zijn tussen verschillende concepten, of wat voor verschillende termen er bestaan om te verwijzen naar een bepaald concept. Een belangrijke taak van deze bestanden is het oplossen van dataconflicten door verschillende naamgeving. Een ontologie bestaat typisch uit twee onderdelen: een taxonomie en een set van inferentieregels. In de taxonomie worden klassen en subklassen en de relaties hiertussen gedefinieerd. Door klassen bepaalde eigenschappen te geven, worden deze ook overgeleverd op de objecten van de subklassen. Een filosofiestudent bijvoorbeeld is van het type student en studenten hebben een studentnummer. Doordat de objecten van de subklasse ook de eigenschappen hebben van de bovenliggende klasse, kunnen we het nu hebben over de studentnummers van filosofiestudenten, zonder dat er een database bestaat die deze begrippen direct verbindt.
Het andere belangrijke onderdeel van een ontologie is de set van inferentieregels. De ontologie zou bijvoorbeeld de volgende regel kunnen hebben: Als een student een studentnummer heeft met eigenschap X, dan is de student een filosofiestudent. Een programma dat gebruikt maakt van deze data, kan dan de mail die naar alle studenten wordt gestuurd aanpassen aan de studierichting van de studenten.
Het Semantic Web kan volgens Berners-Lee een belangrijke rol spelen in de evolutie van de menselijke kennis. Onderlinge gebruikers kunnen eenvoudig nieuwe concepten ontwikkelen door een URI ervoor te maken, die vervolgens kunnen worden gedeeld met gebruikers over de hele wereld. Door de unieke URI, de bijbehorende definitie van een begrip en de OWL kunnen taalbarrières en verschillen in terminologie worden opgelost. Met behulp van de structuur van het RDF Schema kan betekenis worden uitgedrukt. Software agents kunnen de data in het Semantic Web op een betekenisvolle wijze lezen en met behulp van de inferentieregels van de ontologieën op logisch deductieve wijze manipuleren.
“(..) [and] all this without needing artificial intelligence on the scale of 2001’s Hal or Star Wars’s C-3PO” (Berners-Lee et al., 2001)
Semantic Web: science fiction of een realistische trivialiteit?
Gedurende de afgelopen jaren zijn de technologieën die zijn voorgesteld door Berners-Lee verder uitgewerkt. Specifieke domeinen van kennis zijn in kaart gebracht in ontologieën en RDF-bronnen. Het Semantic Web zoals het aanvankelijk werd voorgesteld, met het ambitieuze doel van het formaliseren van de semantiek in de informatie op het Web, is echter nog niet gerealiseerd. Mede hierdoor heeft het Semantic Web veel kritiek te verduren gehad in de loop der jaren.
Eén van die critici is Luciano Floridi, die de visie van Berners-Lee op het Semantic Web ridiculiseert. (Floridi, 2009) Wanneer het semantische aspect van het Semantic Web serieus wordt genomen is het project volgens Floridi science fiction; als dit niet gebeurt een realistische trivialiteit. De belangrijke revolutie van het Web ligt volgens hem in de verzameling ontwikkelingen die samen het Web 2.0 genoemd worden. Aangezien Floridi van mening is dat de doelstellingen van het Semantic Web, zoals Berners-Lee die formuleert in het artikel in Scientific American volkomen onrealistisch zijn, lijkt hij het niet echt nodig te vinden zijn argumenten erg constructief uit te werken en deze zijn daarom enigszins intuïtief van aard. Het volgende citaat illustreert deze positie:
“A decade or so later, it has become hard to disentangle a simple and clear definition of the Semantic Web, also known as Web 3.0, from a barrage of unrealistic and inflated hype or just unreliable and shameless advertisements.” (Floridi, 2009)
De basis van de argumentatie van Floridi is echter duidelijk. Berners-Lee gebruikt ten onrechte termen als ‘betekenis’, ‘semantiek’, ‘kennis en ‘intelligentie’ om het project van het Semantic Web te beschrijven.
” (..) it is data (not semantic information, which requires some understanding) and syntax (not meaning, which requires some intelligence) all the way through.” (Floridi, 2009)
Als deze termen serieus van toepassing zouden zijn op het Semantic web, en niet op een metaforische wijze zoals dit in de beschrijvingen van Berners-Lee soms lijkt te zijn, leunt het project op sterke KI. Voor semantiek is immers een vorm van begrijpen essentieel. Dit ontstaan van begrip in computers vormt de kern van de stelling van sterke KI. Deze stelling is gedurende de afgelopen jaren hevig bediscussieerd; Floridi vat de uitkomst van deze discussie samen met ‘in de nabije toekomst technologisch onhaalbaar’.
Het Semantic Web is geen intelligente automatisering van semantische inferentie. De data die het bevat wordt veelal door mensen gemaakt en geordend in ontologieën, wat het tot niets anders dan een taxonomie maakt. Floridi merkt op dat de doelstellingen van het Semantic Web door het W3C naar beneden zijn bijgesteld. Het semantische element hierin is grotendeels verdwenen, de nadruk is meer komen te liggen op de technische implementatie. Op de site van het W3C wordt het Semantic Web omschreven als:
“A common framework that allows data to be shared and reused across application, enterprise, and community boundaries.” (Semantic Web FAQ, W3C website)
In deze afgezwakte versie van het Semantic Web is de doelstelling veranderd naar het ontwikkelen van een structuur waarmee data van verschillende bronnen kan worden geïntegreerd en gecombineerd. Met deze minder ambitieuze doelstelling is het Semantic Web voor Floridi overgegaan van science fiction naar een realistische trivialiteit. Hij suggereert hierom een aantal afwijkende, volgens hem passender namen voor het Semantic Web: “the Machine-readable Web”, “the Web of Data“, of “the Metasyntactic Web” (Floridi, 2009).
Hoewel Floridi aangeeft dit Metasyntactic Web als een waardevolle ontwikkeling te zien, benadrukt hij ook dat deze afgezwakte versie weinig opwindend, onverkoopbaar en triviaal is.
Ik denk echter dat het Semantic Web in afgezwakte versie ook een belangrijke functie kan hebben in het op alternatieve wijze presenteren van informatie voor menselijke gebruikers. Door deze afwijkende presentatie kan de informatie op een transparantere manier worden gecommuniceerd naar onze cognitieve processen. Het Semantic Web kan hierom een belangrijke rol spelen in het uitbreiden van het menselijke cognitieve systeem met netwerktechnologieën. In het volgende hoofdstuk zal ik de mogelijkheden en barrières bespreken hiervan.
Cognitie en het Web
Het Internet en vooral het Web heeft een grote invloed op veel menselijke activiteiten: in een aantal decennia hebben deze netwerksystemen de manier waarop we werken en communiceren getransformeerd. Het Web biedt nieuwe mogelijkheden tot interactie met een globale verzameling van informatie. Het Web is voor veel mensen de belangrijkste bron van kennis geworden, voor instructies hoe je een bepaalde reparatie uitvoert, tot de laatste wetenschappelijke onderzoeksresultaten. Figuur 1 illustreert hoe veel invloed het gebruiken van de informatie die beschikbaar is op Wikipedia kan hebben op dagelijkse activiteiten.
Fig. 1: Randall Munroe – Extended Mind
Door gebruik te maken van deze gemeenschappelijke bron van kennis heeft het personage vlug de benodigde informatie gevonden waarmee hij de ander kan helpen. Hiermee slaagt het personage erin de ander te laten denken dat hij verstand heeft van auto’s[6]. Toch laat de cartoon van Randall Munroe ook zien wat de beperkingen zijn van de kennis op het Web en onze omgang daarmee. Een scenario zoals dat wordt geschetst in de cartoon is momenteel alleen mogelijk via een communicatiemiddel als een chatconversatie. Doordat er minder perceptuele gegevens worden gecommuniceerd en stiltes in het gesprek gangbaarder zijn, valt het de andere persoon niet op dat er tijdens het gesprek informatie op Internet wordt opgezocht. Tijdens een persoonlijk gesprek is het met de huidige technologie niet mogelijk om de ander te laten denken dat jij verstand hebt van een onderwerp, terwijl je een belangrijk deel van de informatie die je geeft van het Web afkomstig is. Interessanter nog dan deze schijn van kennis[7] lijkt me echter het vraagstuk of de informatie op het Web onder bepaalde omstandigheden ook daadwerkelijk onderdeel kan zijn van je eigen kennis.
Paul Smart onderzoekt de invloed die het Web heeft en kan hebben op onze cognitieve en epistemische profielen. (Smart, 2010; Smart, Engelbrecht Braines, Hendler, Shadbolt, 2008). Hij volgt hierin de theorie van de uitgebreide geest, initieel geformuleerd in de beroemde paper ‘The Extended Mind’ (Clark & Chalmers, 1998). In deze paper werden vooral eenvoudige technologieën als polshorloges en pen en papier als voorbeeld gebruikt om aannemelijk te maken dat menselijke mentale toestanden gedeeltelijk veroorzaakt worden door fysieke processen die zich niet in de hersenen, maar buiten het lichaam afspelen.
Smart et al. bestuderen de mogelijkheden van geavanceerdere technologie en beschouwen de enorme potentiële rol die kennis op het netwerk kan hebben op ons epistemica. Ze verdedigen de volgende stelling:
“Thesis of Network-Enabled Cognition: The technological and informational elements of a large-scale information network can, under certain circumstances, constitute part of the material supervenience base for an agent’s mental states and processes.” (Smart et al., 2008)
De belangrijkste uitdaging in de paper van Smart et al. is het verdedigen van bovenstaande stelling tegen de argumenten dat netwerktechnologieën de basiscriteria missen om in aanmerking te komen voor cognitieve uitbreiding.
Clark & Chalmers baseren hun bepaling of een extern element deel uitmaakt van het cognitieve systeem op het pariteitsprincipe. Dit stelt dat wanneer een deel van de wereld tijdens een taak functioneert op een wijze waarbij we niet zouden twijfelen dit tot het cognitieve proces te rekenen als het zich in het hoofd afspeelde, dat deel van de wereld (tijdelijk) deel uitmaakt van het cognitieve systeem (Clark & Chalmers, 1998). Ze delen deze eis op in drie criteria, welke ik als kapstok zal gebruiken om de bezwaren op de mogelijkheid van netwerktechnologische cognitieve uitbreiding te bespreken.
Beschikbaarheidcriterium
Dit eerste criterium van Clark & Chalmers stelt dat een technologisch hulpmiddel betrouwbaar toegankelijk en oproepbaar moet zijn voor een persoon om gerekend te kunnen worden als deel van het uitgebreide cognitieve systeem.
Door de enorm toegenomen draagbaarheid van onze netwerkapparaten in de vorm van smartphones en tablets, zijn onze hulpmiddelen voor Internettoegang vergelijkbaar beschikbaar als de eenvoudige hulpmiddelen als pen en papier, welke volgens Clark en Chalmers aan dit beschikbaarheidcriterium voldoen. Behalve de draagbaarheid zijn er echter wel andere beperkingen in de beschikbaarheid van onze netwerkapparaten: de kwetsbaarheid van de fijne elektronica en de beperkingen die worden veroorzaakt door de energieconsumptie van de apparatuur. De kwetsbaarheid zien we echter ook in de gevoeligheid van ons zenuwstelsel dat door allerlei ongelukken beschadigd kan raken, hetgeen we niet als reden zien om de rol van onze hersenen in het veroorzaken van mentale toestanden te betwijfelen. Het probleem van de energieconsumptie is reëel: het uitvallen van je smartphone vanwege een lege batterij kan aanvoelen als het tijdelijk verliezen van een vitale functie. Deze beperking zegt echter niets over de aard van netwerkapparaten, maar over de limieten van onze huidige apparatuur, waarvan verbeteringen in de nabije toekomst te verwachten zijn.[8]
Vertrouwenscriterium
Dit criterium vereist dat de van de externe hulpbron verkregen informatie altijd direct moet worden geloofd en vertrouwd door de gebruiker. Mensen hebben doorgaans een dusdanig groot vertrouwen in de informatie in hun biologische geheugen dat ze deze altijd voor waar aannemen. Eenzelfde vertrouwen moet er ook zijn in een extern proces.
Een belangrijk probleem bij de informatie die op het Web is opgeslagen is dat de consument vaak verschilt van de producent. Hierdoor is er veel kritiek geweest op de mogelijkheid dat dergelijke informatie tot de kennis van een persoon gerekend kan worden. De mens zou externe informatie altijd met een grote mate van scepticisme bekijken. Aangezien de informatie op Internet bestaat in een enorme, gedeelde, publieke ruimte, lijkt de mogelijkheid op opzettelijke manipulatie of misinterpretatie van de informatie veel reëler dan in onze innerlijke ruimte. Het kritiekpunt van gebrek aan vertrouwen is naar mijn mening echter vanwege een aantal punten overdreven:
– In mijn dagelijkse beleving hebben mensen juist veel vertrouwen in de kennis die ze op Internet vinden. Zelden bekijken gebruikers de bronnen van Wikipediaartikelen, of twijfelen ze aan de inhoud. Dat dit niet voor alle informatie op het Internet geldt, kan eenvoudig worden opgelost door afgebakende kennisdomeinen die intellectueel beter beschermd worden dan bij het huidige Web gangbaar is.[9]
– Het vertrouwen dat mensen in hun biologische geheugen hebben is erg groot, maar lang niet altijd is dit vertrouwen terecht. Hoe vaak gebeurt het niet dat je denkt iets zeker te weten, waarna toch blijkt dat je de informatie niet goed hebt onthouden?
– Daniel Dennett stelt:
“The primary source [of our greater intelligence] is our habit of off-loading as much as possible of our cognitive tasks into the environment itself – extending our minds (that is, our mental projects and activities) into the surrounding world.” (Dennett, 1996)
Het gebruiken van de omgeving voor cognitieve taken zit diep geworteld in de menselijke geest. Wanneer onze hersenen positieve feedback krijgen bij het gebruiken van informatie van Internet, zullen, dankzij de neuroplasticiteit, onze neurale netwerken zich herstructureren voor het gebruik van deze technologie, waarbij ook ons vertrouwen in deze externe bronnen zal toenemen.
– Het vertrouwen dat we leggen in onze omgeving blijkt ook uit een psychologisch fenomeen als onze onder bepaalde condities optredende blindheid voor verandering[10] (Smart et al., 2008). Uit dit fenomeen blijkt dat onze hersenen dusdanig veel vertrouwen leggen in de externe omgeving dat veranderingen in ons gezichtsveld niet opvallen en onze hersenen simpelweg aannemen dat er niets is veranderd.
Om de bovengenoemde redenen denk ik dat een gebrek aan vertrouwen in de informatie van het Internet geen belangrijke beperking zal vormen in het ontstaan van netwerkcognitie.
Toegankelijkheidscriterium
De hulpbron moet direct en eenvoudig toegankelijk zijn, hetgeen Clark omschrijft als de transparantie van een technologisch hulpmiddel (Clark, 2003). De kern van dit criterium bestaat uit de kosten van informatietoegang[11]. Deze kosten bestaan bijvoorbeeld uit de tijd en de cognitieve en fysieke moeite die nodig is om de informatie te verkrijgen. Er zijn duidelijke wetenschappelijke resultaten (Smart et al., 2008) die erop wijzen dat de relatieve kosten van informatietoegang bepalen of een persoon kiest voor een interne (op het mentale vermogen gebaseerde) of externe (sensomotorisch gebaseerde) strategie voor een taak. Een bekend voorbeeld dat wordt aangehaald door Clark (Clark, 2003) gaat over het computerspel Tetris. Om de stukken hierbij op de juiste manier neer te laten komen, moeten blokken gedraaid worden. Om te bepalen met welke oriëntatie een blok het beste past, kan het blok zowel louter mentaal als ook op een sensomotorische[12] wijze gedraaid worden. Doordat deze laatste oplossing minder vraagt van onze cognitieve vermogens én het sneller is, kiest vrijwel iedereen voor deze methode.
In dit toegankelijkheidscriterium ligt de belangrijkste oorzaak dat we activiteiten zoals die van het personage in de strip (Fig. 1) niet zien als onderdeel van het cognitieve proces. De kosten van informatietoegang zijn te hoog: de gebruiker moet eerst fysieke en cognitieve moeite doen om de browser naar de juiste pagina te sturen, dan wachten op het downloaden van de pagina en vervolgens deze in natuurlijke taal geformuleerde informatie te doorzoeken. Onze huidige omgang met netwerktechnologie is niet transparant genoeg om een serieuze kandidaat te zijn voor cognitieve extensie.
Veel van de ontwikkeling in netwerktechnologie is er echter op gericht om de kosten van informatietoegang te verlagen. Telecomproviders blijven hun mobiele netwerk verbeteren, zodat downloadtijden aanzienlijk korter worden; softwareontwikkelaars voor smartphones maken onze omgang ermee steeds intuïtiever en vlotter. Daarnaast vinden er technologische ontwikkelingen plaats die de potentie hebben onze omgang met de netwerkapparaten ingrijpend te veranderen. Een mijns inziens invloedrijke, overkoepelende ontwikkeling hierin is de opkomst van Augmented Reality (AR). Hierbij wordt een extra laag van virtuele informatie over de werkelijkheid gelegd, in de vorm van computergegenereerde zintuiglijke informatie.
AR vormt een belangrijke manier waarop informatie aan ons kan worden gepresenteerd. In de afgelopen jaren zijn er veel toepassingen ontwikkeld die een vorm van AR tonen en heeft deze manier van informatie presenteren veel bekendheid gewonnen. Doorgaans draaien deze toepassingen op een smartphone waarbij de camera en het beeldscherm worden gebruikt om een extra laag van informatie over de werkelijkheid heen te leggen. We kijken via het beeldscherm en de camera naar de buitenwereld. Met behulp van beeldanalyse kunnen allerlei voorwerpen in het beeld van de camera herkend worden. Ook andere sensorische gegevens van de telefoon worden gebruikt: locatiegegevens gemeten door de GPS-ontvanger of informatie over de oriëntatie van de telefoon, gemeten door de accelerometers. Deze gegevens worden gebruikt om informatie op een contextgevoelige manier te kunnen presenteren.
Een voorbeeld van zo’n AR toepassing is de app CamTranslator die ik op mijn Android smartphone heb. Ik stel in de app in naar welke taal ik wil vertalen en oriënteer mijn telefoon zo dat het woord dat ik wil opzoeken in het vizier ligt. Ik raak het scherm aan en binnen een seconde of twee vertaalt de applicatie het woord naar de gewenste taal. Het gemak hiervan is verbazingwekkend, vermoedelijk zal ik deze app veel gaan gebruiken in het buitenland.
Aan de hand van de omgang met deze app wil ik een drietal aspecten bespreken die de kosten van informatietoegang verhogen.
Ten eerste is het via het beeldscherm kijken naar het beeld van de camera een belemmering. De fysieke moeite van het ophouden van de telefoon verhoogt de kosten van informatietoegang. Het kijken naar een beeldscherm is te ver verwijderd van onze echte perceptie van de omgeving. In plaats van te kijken naar de werkelijkheid, kijken we naar een weergave van de werkelijkheid, waarbij we slechts een klein gedeelte van ons gezichtsveld gebruiken[13]. Er zijn echter allerlei afbeeldingsystemen in ontwikkeling die de extra informatie direct op ons netvlies kunnen afbeelden. In 2010 presenteerde Brother bijvoorbeeld hun Retinal Imaging Display (RID) ‘Airscouter‘[14], die te zien is in Fig. 2. Brother geeft aan dit prototype op korte termijn te willen gebruiken voor industriële toepassingen en later voor consumentenproducten. Met een dergelijk product vormt de virtuele informatie echt een extra laag over onze normale perceptie.
Fig. 2 Airscouter
Een ander aspect dat de kosten van informatietoegang aanzienlijk vergroot is het feit dat je informatie actief moet opzoeken. In het voorbeeld van de vertaalapp moet je eerst je telefoon pakken, de app starten en bij deze vertalingapplicatie de camera richten op een woord, waarna je het scherm moet aanraken voordat de app vertaalt. Hier kan, en zal, een hoop winst gehaald worden met slimmere software en transparantere besturing. Wanneer de visuele informatie van het netwerkapparaat altijd in ons gezichtsveld ligt, zoals het geval van de bovengenoemde Airscouter, wordt het ook een stuk zinvoller voor software om constant te draaien. Een toekomstige versie van de vertaalapp zou bijvoorbeeld automatisch alle woorden die zichtbaar zijn voor de camera vertalen. Lerende algoritmes in de app houden bij wat voor woorden ik relevant vind om op te zoeken, welke woorden ik al vaak heb opgezocht en dus waarschijnlijk al ken, etc. Aan de hand hiervan wordt geselecteerd welke vertalingen worden weergegeven op mijn netvlies. De instellingen hiervoor kunnen worden bijgesteld met de controller, wat mogelijk gewoon je smartphone is. Deze instellingen kunnen ook nog contextgevoeliger worden. De software zou hiervoor extra informatie als de tijd, je agenda, en GPS-gegevens gebruiken om te bepalen aan hoeveel extra informatie je op dat moment waarschijnlijk behoefte hebt. Contextgevoelige automatische informatievoorziening zal belangrijk zijn in het verlagen van de kosten van informatietoegang tot het Web.
Een derde belangrijke beperking van onze toegang tot informatie op het netwerk wordt gevormd door de manier waarop kennis wordt gerepresenteerd op het Web, namelijk in de vorm waarin al vele eeuwen kennis wordt gerepresenteerd: in natuurlijke taal. Hierdoor doen zich drie problemen voor. Ten eerste moet de software de juiste informatie vinden in de enorme collectie gelinkte documenten. Daarnaast is informatie in natuurlijke taal moeilijk te verdelen in kleinere stukken, hetgeen als doel heeft de informatie beter op te nemen in de taak die wordt uitgevoerd. Als laatste is taal niet altijd de beste manier om informatie weer te geven, zeker als dit getoond moet worden in een AR-applicatie. Deze problemen doen zich niet voor het voorbeeld van de vertaalapp aangezien hierin erg eenvoudige informatie wordt gepresenteerd.
In het bovenstaande heb ik geprobeerd te laten zien dat veel van de beperkingen in onze toegang tot informatie op Internet worden gevormd door de limieten van onze huidige technologie. De besproken ontwikkelingen, en de talloze andere innovaties die ik verder niet heb besproken, zijn gericht op het verminderen van de kosten van informatietoegang. Het gebruik van Augmented Reality en automatische contextgevoelige informatievoorziening kan deze kosten aanzienlijk verlagen. In plaats van tijdelijk de taak waar we mee bezig zijn te moeten onderbreken om wat op te zoeken op het Web, wordt de informatie van het Web automatisch ‘bovenop’ onze zintuiglijke informatie gelegd, op een wijze waardoor de extra informatie relevant is voor de taak. Hiermee komt het idee van netwerktechnologische cognitieve uitbreiding dichterbij. Er doen zich echter belangrijke problemen voor bij het vinden van de benodigde informatie. De bron van de informatie is namelijk het Web, wat momenteel bestaat uit een grote collectie aan elkaar gelinkte documenten in natuurlijke taal. Hierbij is het niet alleen lastig voor computers om de juiste informatie te vinden, ook is die informatie niet functioneel voor het weergeven van complexe informatie in een AR toepassing. In het volgende hoofdstuk zal ik deze problemen verder bespreken en beargumenteren dat het Semantic Web hierbij een belangrijke rol kan hebben.
Het Semantic Web voor een transparantere toegang tot complexe informatie
Het Semantic Web werd geïnitieerd als een project dat de semantiek van de informatie in de gelinkte documenten die samen het Web vormen begrijpelijk zou maken voor machines. Software agents zouden de data in het Semantic Web op een betekenisvolle wijze kunnen lezen en met behulp van de inferentieregels van de ontologieën op logisch deductieve wijze kunnen manipuleren. De kritiek van Floridi laat echter zien dat de doelstellingen van het project samenvallen met die van sterke KI en daarom in de nabije toekomst onmogelijk zijn. Floridi ziet daarom een afgezwakte vorm van het Semantic Web, dat overeenkomt met de huidige omschrijving van het W3C: een veelgebruikt, op RDF-gebaseerd kader dat het mogelijk maakt data te delen over de grenzen van applicaties, bedrijven en gemeenschappen.
Paradoxaal genoeg kan deze afgezwakte vorm van het Semantic Web, wat bedoeld was om het Web leesbaar te maken voor machines, een belangrijke functie hebben bij het presenteren van informatie aan menselijke gebruikers. Hiermee kan het bijdragen aan het verlagen van de kosten van informatietoegang bij AR-applicaties die automatisch contextgevoelige informatie presenteren. Ik zal hier drie problemen bespreken die ontstaan wanneer dergelijke applicaties het Web als informatievoorziening gebruiken. Het Semantic Web zou deze problemen kunnen verminderen dan wel wegnemen.
Het eerste probleem komt voort uit de eis van automatische contextgevoelige informatie. Hiervoor moet de software relevante informatie vinden. In het dagelijkse leven gebruiken we een zoekmachine die de meest relevante documenten geeft bij bepaalde zoektermen. De automatische informatievoorziening heeft echter als doel deze stap, waarbij de gebruiker actief informatie moet opzoeken, weg te nemen. Daarom moet er gebruik worden gemaakt van andere metadata om de relevante informatie te vinden. In het vorige hoofdstuk noemde ik al voorwerpherkenning door geavanceerde beeldanalyse en GPS-gegevens. Bij het voorbeeld van de vertaalapp wordt tekstherkenning gebruikt om de metadata te vinden, namelijk het geselecteerde woord[15]. Hierna wordt de vertaling in de online databases opgezocht.
Laten we nu een wat ingewikkelder applicatie inbeelden die met behulp van de GPS-locatie, kompasgegevens en oriëntatie van het netwerkapparaat weergeeft welke (vaste) telefoonnummers zich bevinden in het gezichtsveld van de gebruiker. Het moge duidelijk zijn dat traditionele zoekmachines hier geen uitkomst bieden, daarvoor zou de gebruiker van elk huis afzonderlijk het adres moeten opzoeken. Ook kan voor deze taak waarschijnlijk geen database worden aangesproken die de gegevens van GPS-locaties en vaste telefoonnummers met elkaar verbindt. Bij dit betrekkelijk eenvoudige voorbeeld zien we de noodzaak van gekoppelde databases, hetgeen het Semantic Web probeert te bereiken. Elk adres krijgt hierbij een unieke URI, welke gekoppeld is met de GPS-coördinaten van het netwerkapparaat[16], bijvoorbeeld via de database van Google Maps. De databases van de Telefoongids zijn ook gekoppeld aan de URI van het adres waardoor de relevante telefoonnummers kunnen worden verkregen. In dit voorbeeld zien we hoe het Semantic Web kan bijdragen aan het vinden van relevante informatie voor een automatische contextsensitieve informatievoorziening. Dit biedt vooral voordeel bij complexe informatie, waarbij de informatie niet in een enkele database gevonden kan worden.
Het tweede probleem van het gebruik van het Web als informatievoorziening treedt op wanneer we taakrelevante informatie willen presenteren. Informatie relevant maken voor een taak vergroot de toegankelijkheid van de informatie, doordat het de extra informatie aan de gebruiker precies dan presenteert wanneer het nodig is. Het Web bestaat momenteel echter uit een verzameling documenten geschreven in natuurlijke taal. Deze informatie is alleen toegankelijk in de exacte vorm zoals het op Web staat. De informatie kan niet opgedeeld worden in taakrelevante bits. Bij het voorbeeld van de vertaalapp vormde de presentatie in natuurlijke taal geen probleem, aangezien hier slechts telkens een enkel woord werd gepresenteerd. Wanneer een AR-applicatie echter complexere kennis wil overbrengen, moet de mogelijkheid bestaan om de informatie op te delen in kleine delen. Met behulp van het Semantic Web kan informatie eenvoudig worden opgedeeld in losse verbanden, gepresenteerd in het RDF Schema. Door informatie te presenteren in taakrelevante bits wordt de cognitieve moeite om dat stuk informatie te verwerken in de taak verminderd, hetgeen de kosten van informatietoegang verlaagt.
Het derde probleem komt voort uit de eis van een transparante informatiepresentatie in Augmented Reality. Zoals gezegd moet de cognitieve moeite die gedaan moet worden om een stuk informatie op te nemen in de cognitieve taak geminimaliseerd worden. Natuurlijke taal is echter niet altijd de ideale manier om informatie over te brengen. Datavisualisatie is een belangrijk, ontwikkelend veld van onderzoek, waarmee geprobeerd wordt informatie in een oogopslag inzichtelijk te maken. Vooral bij het presenteren van complexe informatie valt hiermee veel te winnen. Door gebruik te maken van het Semantic Web, kan informatie op alternatieve wijzen worden gepresenteerd, waarmee de cognitieve moeite kan worden geminimaliseerd.
Het Semantic Web lijkt een oplossing te kunnen bieden op de problemen die optreden bij de informatievoorziening in natuurlijke taal op het Web. Hiermee kunnen de kosten van informatietoegang bij automatische, contextgevoelige informatievoorziening in AR-applicaties aanzienlijk worden verlaagd. Hiermee kan het Semantic Web bijdragen aan het kansrijker maken van de mogelijkheid van netwerktechnologische cognitieve uitbreiding.
Bibliography
Berners-Lee, T., & Fischetti, M. (1999). Weaving the Web: Origins and Future of the World Wide Web. San Fransisco: HarperCollins.
Berners-Lee, T., Hendler, J., & Lassila, O. (2001). The Semantic Web. Scientific American (284(5)), 34-43.
Brockman, J. (2011). Hoe verandert Internet je manier van denken? (T. Roozenboom, Trans.) Utrecht: Maven Publishing.
Brother. (2010, July 21). Airscouter. Retrieved July 6, 2011, from Brother: http://www.brother.com/en/news/2010/airscouter/
Clark, A. (2003). Natural-Born Cyborgs. Minds, Technologies, and the future of human intelligence. Oxford: Oxford Univ. Press.
Clark, A. (2008). Supersizing the Mind. Embodiment, Action and Cognitive Extension. Oxford: Oxford Univ. Press.
Clark, A., & Chalmers, D. (1998). The Extended Mind. Analysis , 10-23.
Dennett, D. (1996). Kinds of Minds: Toward an Understanding of Consciousness. New York USA: Basic Books.
Floridi, L. (2009). Web 2.0 vs. the Semantic Web: A Philosophical Assessment. Episteme (6 (1)), 25-27.
Munroe, R. Extended Mind.
Semantic Web. (n.d.). Retrieved June 25, 2011, from Wikipedia: The Free Encyclopedia: http://en.wikipedia.org/wiki/Semantic_Web
Shadbolt, N., Hall, W., & Berners-Lee, T. (2006). The Semantic Web Revisited. Intelligent Systems, IEEE , 21 (3), 96-101.
Smart, P. (2010 (In Press)). Cognition and the Web. Network-Enabled Cognition: The Contribution of Social and Technological Networks to Human Cognition .
Smart, P., Engelbrecht, P., Braines, D., Hendler, J., & Shadbolt, N. (2008). The Extended Mind and Network-Enabled Cognition. Retrieved June 24, 2011, from University of Southampton – School of Electronics and Computer Science: http://eprints.ecs.soton.ac.uk/16649/1/Network-Enabled_Cognitionv17.pdf
W3C. (n.d.). Semantic Web FAQ. Retrieved October 31, 2008, from W3C: http://www.w3.org/RDF/FAQ/
Weinberger, D. (2007). Everything is Miscellaneous: The Power of the New Digital Disorder. Times Books.
[1] Vertaling van ‘How Is the Internet Changing the Way You Think?’
[2] In deze paper zal ik verwijzen naar een aantal concepten waarvoor nog geen gangbare Nederlandse vertaling voor bestaat en waarnaar ik daarom met de Engelse termen verwijs.
[3] World Wide Web Consortium
[4] Berners-Lee heeft in verschillende papers en boeken, in samenwerking met verschillende mensen gewerkt. Aangezien hij een vast hoofdfiguur was bij de introductie van het Semantic Web zal ik naar hem verwijzen als de uitvinder van het Semantic Web.
[5] Universal Resource Identifier, waarvan de Universal Resource Locator (URL) een voorbeeld is.
[6] Hiermee slaagt het personage eigenlijk voor een soort afgezwakte variant van de Turing Test. In plaats van dat een computer een mens moet laten geloven een mens te zijn, moet een mens hierbij een andere mens laten geloven dat hij of zij geen gebruik maakt van externe computationele hulpmiddelen.
[7] Ook het onderschrift in de cartoon doelt op deze schijnbare kennis, daar het spreekt over het “apparent IQ“.
[8] Daarbij is de batterijduur gemakkelijk te verlengen met behulp van extra accu’s. Deze extra voeding heeft ook een biologische analogie: ook hersenen functioneren na enige tijd immers niet meer zonder extra voeding.
[9] Hierbij hoeft niet gedacht te worden aan een almachtige, overkoepelende media-autoriteit, maar bijvoorbeeld aan een aanpak zoals die van Wikipedia, waarbij met enkele regels en gebruikers met speciale rechten, informatie weerbaarder kan worden gemaakt tegen opzettelijke manipulatie.
[10] Een bekend voorbeeld hiervan is een experiment waarbij de proefpersonen wordt gevraagd naar een filmpje te kijken en te tellen hoe vaak een bal wordt overgegooid. De proefpersonen zijn geconcentreerd op deze taak en merken meestal totaal niet op dat er in de achtergrond van de video duidelijk een persoon in gorillapak voorbij loopt. (http://www.youtube.com/watch?v=vJG698U2Mvo)
[11] “information access cost” (Smart et al., 2008)
[12] Het blok draaien door de knop in te drukken en vervolgens te kijken of het blok past. In dit voorbeeld vindt het draaien in een virtuele wereld plaats.
[13] Daarbij verkennen we deze weergave ook niet zoals we de bij werkelijkheid doen, waarbij onze ogen constant saccades maken en scherpstellen op verschillende voorwerpen.
[15] Plus gegevens over in welke taal het woord geschreven is, en naar welke taal het vertaald moet worden.
[16] De applicatie meet de GPS-coördinaten van het netwerkapparaat en berekent aan de hand van de kompasgegevens welke coördinaten binnen een straal van <x> meter liggen.