Door AI te integreren met mobiele technologie ontstaan er voor blinden en slechtzienden niet alleen nieuwe mogelijkheden om taken te vereenvoudigen, maar ook om innovatieve manieren om te kunnen communiceren met de wereld om hen heen. Ontdek hoe deze technologieën onschatbare waarde bieden en fungeren als een extra ‘zintuig’, wat resulteert in een vergrote mate van zelfstandigheid voor deze doelgroep.

De introductie van smartphones heeft, nu meer dan 15 jaar geleden, een positieve impact gehad op ons dagelijks leven. Mobiele apps hebben onze interactie met de wereld om ons heen volledig getransformeerd. Tegenwoordig verloopt communicatie moeiteloos, is bankieren handig en toegankelijk, kunnen we tijdens het pendelen naar huizen zoeken, hebben we sportupdates binnen handbereik, en zo kunnen we nog wel even doorgaan. Met smartphones die steeds alledaagser werden, kwam ook artificiële intelligentie (AI) als een veelbelovende technologie die voortdurend de mogelijkheden van mobiele apps verbetert naar voren.

Hoe ChatGPT AI populair maakte

In de maanden na de release van GPT-3.5 door OpenAI in maart 2022, werd het duidelijk dat Large Language Models (LLMs) zoals de GPT-familie van kunstmatige intelligentie een nog grotere disruptie in ons dagelijks leven zouden veroorzaken dan smartphones. Om het volledige potentieel van deze soorten AI te onthullen, moeten we onszelf de vraag stellen hoe we ze kunnen gebruiken om een positieve impact te hebben op ons dagelijks leven. Hoewel standaard toepassingen zoals chatbots, zoekmachines, creatief schrijven en educatie al veel worden gebruikt en onze manier van denken en werken hebben beïnvloed, zijn de mogelijkheden ervan echter eindeloos.

AI en mobiele oplossingen voor visuele beperkingen

Veel van ons beschouwen visuele aanwijzingen als vanzelfsprekend. Echter, voor velen brengen eenvoudige dagelijkse taken en ervaringen, zoals zich door een kamer bewegen zonder obstakels of een kunstwerk bekijken, inherente uitdagingen met zich mee.

Ondanks dat image-to-text recognition tools deuren hebben geopend door objecten in de omgeving te identificeren, blijven ze beperkt in het volledig overbrengen van de volledige context. Deze tools kunnen een gebruiker attent maken op de aanwezigheid van een persoon, maar ze missen de nuances, zoals emoties, lichaamstaal en de handelingen die een persoon uitvoert. Het is deze kloof tussen basisidentificatie en een diepgaand begrip die kan worden aangepakt met een combinatie van kunstmatige intelligentie en mobiele applicaties.

De geavanceerde mogelijkheden van LLM's zoals GPT-4 overtreffen de basisfunctionaliteiten van traditionele image-to-text modellen. Stel je voor dat je niet alleen objecten in je omgeving identificeert, maar ook een diepgaand gesprek voert met de AI die de nuances van je omgeving uitlegt.

Zien en begrijpen via AI

GPT-4 kan complexe vragen en scènes interpreteren, waardoor een gesprek ontstaat dat bijna menselijk aanvoelt. Vragen als 'Waar staat mijn glas op tafel?' of 'Is er iemand in de kamer?' zijn slechts het begin. GPT-4 biedt veel geavanceerdere inzichten, vooral wanneer vragen worden gesteld die analytisch denken vereisen: 'Is deze kamer vrij van struikelgevaar?' of 'Welke emoties roept dit schilderij op?'.

De interactie met het AI-model is niet eenmalig maar conversatieel, en behandelt de context alsof je met een persoon praat. De gebruiker kan op een veilige manier door een kamer worden geleid, de emoties van een persoon in de foto analyseren, de kunstenaar van een schilderij identificeren of zelfs het verhaal achter een meme uitleggen die via WhatsApp is ontvangen. Deze gesprekken fungeren niet alleen als een extra ‘zintuig’ in de zin dat de gebruiker de wereld ‘ziet’ via de AI, maar stellen de gebruiker ook in staat om zich te verbinden met zijn omgeving en deze te begrijpen, iets wat ervoor onmogelijk was.

EMVI & ACA Group: Baanbrekende visuele assistentie in mobiele apps

Wanneer LLM's worden geïntegreerd in mobiele apps, worden ze geen tool maar assistenten die altijd binnen handbereik zijn. Native mobile device features zoals spraakinvoer/-uitvoer en spraakopdrachten versterken de gebruikerservaring verder. Deze combinatie stelt gebruikers in staat om zelfstandig te interageren met de visuele wereld, waardoor hun veiligheid en begrip van omgeving verbeteren. De LLM is niet langer een tool, maar wordt een verlengstuk van de zintuigen van de gebruiker.

De bovengenoemde visie van EMVI op de potentiële impact van technologie op blinden en slechtzienden inspireerde ACA Group om samen te werken bij de ontwikkeling van een waardevolle mobiele app. EMVI streefde naar meer dan alleen een visuele assistent; zij stelden zich een metgezel voor die een diepe verbinding bevordert tussen gebruikers en hun omgeving.

De EMVI app: Ontworpen voor toegankelijkheid

De EMVI-app geeft prioriteit aan de behoeften van blinden en slechtzienden op verschillende manieren:

  1. Toegankelijkheid verbeteren: Het streeft naar een vlotte gebruikerservaring die niet gericht is op hoe visueel bekwame personen een applicatie zouden hanteren, maar op hoe je de applicatie kan gebruiken zonder visuele aanwijzingen.
  2. Intuïtieve interactie: Native mobile functies maken interactie mogelijk via spraakopdrachten en één knop, met communicatie die wordt vergemakkelijkt door auditieve feedback zoals text-to-speech en mediaweergave.
  3. Visuele assistentie op aanvraag: Gebruikers kunnen de app opdracht geven om een foto te maken, waardoor een contextbewust gesprek met hun visuele assistent wordt gestart. De assistent geeft gedetailleerde beschrijvingen van de omgeving, identificeert mogelijke gevaren, lokaliseert objecten en interpreteert zelfs de emotionele sfeer.
  4. Focus op inclusiviteit: De app is niet alleen afgestemd op het begrijpen van de fysieke wereld om hen heen. In het digitale tijdperk van vandaag strekt inclusiviteit zich uit tot digitale communicatie. De EMVI-app integreert met verschillende applicaties, waardoor gebruikers visuele inhoud kunnen begrijpen en ermee kunnen omgaan, van sociale media tot berichtenapps.

Levens transformeren door gecombineerde technologie

Samen met EMVI heeft de ACA Group mobiele technologie gecombineerd met LLM's om een boeiende visuele assistent te bieden aan blinden en slechtzienden. Wat we hebben bereikt met deze samenwerking is nog maar het begin en laat slechts een deel zien van de mogelijkheden en impact die deze technologieën kunnen hebben op het leven van individuen. Door de sterke punten van de technologieën te combineren en hun zwakke punten aan te pakken, kunnen we de gebruikerservaring van elk individu afstemmen op hun behoeften.

Wil je levens transformeren door technologieën te combineren?
Of ben je op zoek naar een ervaren partner voor app-ontwikkeling?
Neem contact op met onze experts.

Gerelateerde customer success stories