Beskriv, texta och tolka allt ljud och rörlig bild

Jag misstänker att riktlinje 1.2 kan upplevas som det tuffaste, och mest resurskrävande, kravet att uppfylla i WCAG. Hur många fördelar vi än kan lista med multimedia så kvarstår dock problemet att det utesluter människor som inte kan tolka information i det formatet.

Ljud är, i grunden, bra

Möjligheten till ljud förs ofta fram som en fördel, just för att det har potentialen att göra innehåll tillgängligt för människor med nedsatt synförmåga. Och så är det. Problemen uppstår oftast när vi har ljud i kombination med video, och de rörliga bilderna krävs för att förmedla innehållet. Men bara för att synskadade har fått en välförtjänst stark position i designtänkande så får vi inte glömma bort att många är permanent eller situationellt drabbade av begränsad hörsel och/eller kognitiv förmåga.

Nivå A

För att uppfylla kriterierna för tillgänglighet när det gäller ljud och video så måste man, för att uppfylla det lägst ställda kravet (nivå A):

  • 1.2.1 Ha ett textalternativ för allt förinspelat ljud och video som återger likvärdig information som ljud-spåret.
  • 1.2.2 Ha undertexter (captions) för all förinspelad video.
  • 1.2.3 Ha antingen ett textalternativ eller ett extra ljudspår som förklarar det visuella innehållet i förinspelad video.

Det här innebär förstås att den stora massan av ljud och film vi tar del av på nätet inte uppfyller det lägst ställda kravet. Även om YouTube erbjuder en integrerad tjänst för bildtext så är det tyvärr bara en handfull som använder den funktionaliteten.

Det behövs en del kampanjande och insiktsskapande om att väldigt många har nytta av bildtext och textalternativ; det handlar inte bara om hörselnedsättningar utan även om människor som har svårt att förstå språket och har stor nytta av textkomplement för bättre förståelse. Det ger också betydande fördelar om sökmotorer och andra verktyg kan tolka innehållet.

Glöm inte heller bort de situationella behoven: många sitter idag i kontorslandskap eller befinner sig på bussen och har glömt hörlurarna hemma; eller lyssnar på musik och väljer bort ljud i en förklaringsvideo. Textning av video gör att alla i olika situationer kan ta till sig innehållet trots avsaknad av ljud, och du når betydligt fler.

Det kan faktiskt vara billigare än många tror; även för ett hobbyprojekt som exempelvis den podcast jag medproducerar så prioriterar vi transkribering av avsnitten. Generellt är det billigare med engelskt innehåll, (eftersom utbudet av människor som transkriberar är betydligt större) men i och med att fler företag kan hittas via nätet - och jobba på distans - finns ett växande utbud av leverantörer även i Sverige.

Exempel: När jag bäddar in video från YouTube på min webbplats, som jag inte själv kan påverka innehållet i, så försöker jag förklara andemeningen i filmens budskap i min text. Det är en god ansträngning när man inte själv har producerat videon, men enligt konstens alla regler är faktiskt inte ens det nivå A av tillgänglighet – eftersom jag inte förklarar det visuella innehållet (hur människorna ser ut rör sig i filmen) och det inte finns bildtext i själva videon.

Nivå AA

Vi kämpar vidare med nivå A men låt oss också kika på vad som krävs för att nästa nivå (AA) ska uppfyllas. Det här är speciellt intressant eftersom de flesta företag och organisationer säger sig uppfylla nivå AA av WCAG 2.0. Men i 99 fall av 100 gör de alltså inte det.

  • 1.2.4 Bildtext (captions) ska finnas tillgänglig för alla live-sändningar av media med ljud. Det betyder alltså att du måste ha någon som simultanskriver i samband med sändningen, eller ett färdigt manus som lyfts in.
  • 1.2.5 Ljudbeskrivningar ska finnas tillgängliga för allt video-innehåll.

Ljudbeskrivningar är inte text, det är ett extra ljudspår som berättar vad som händer i bild för de som inte kan ta till sig bilden. Man lägger alltså i ljud till information om beteenden, karaktärer, scenförändringar och eventuell skärmtext som är viktig men inte beskrivs eller uttalas i det primära ljudspåret.

En vanlig fördom är att synskadade inte går på bio. Men när filmer har ljudbeskrivningar så är det inte alls ovanligt att även människor som är registrerade som blinda med stor behållning gärna tar sig till biografen.

💡
Tips: En serie på Netflix som har ljudbeskrivningar är den om den blinda superhjälten Daredevil. Läs mer om kampanjen som krävde detta extra ljudspår.

Nivå AAA

Låt oss för all del inte stanna där. Det finns en nivå till i denna riktlinje. För att uppfylla nivå AAA krävs:

  • 1.2.6 Att all förinspelad video har teckenspråkstolkning.
  • 1.2.7 Avancerade ljudbeskrivningar. När videon inte har tillräckligt många/långa pauser för att lägga in ljudbeskrivningar så pausas videon automatiskt för att ljudbeskrivningarna ska få tillfälle att förmedla känslan i videon.
  • 1.2.8 Ett fullgott textalternativ för all video med visuellt innehåll: ett sådant läses nästan som en bok om det finns visuell information, med till exempel beskrivningar av sammanhang, beteende och människors ansiktsuttryck.
  • 1.2.9 Ljud som är live ackompanjeras med motsvarande textalternativ. Det innebär live-transkribering eller, om det är tal som följer ett manus, en länk till manuset.

Medvetet beslut eller förödande okunskap

För företag och organisationer som jobbar med video och ljud ska det ligga i budget hur man skapar och säkerställer en tillgänglig produktion. Trenden som jag ser just nu, där man har en okunskap och i viss mån total brist på empati för behovet hos vanliga människor, är oroväckande.

Jag kan acceptera att man väljer bort tillgänglighet i vissa fall om det är ett beslut som man har värderat och begrundat på riktigt när det gäller teknik, resurser och användare. Att välja att skapa otillgängligt innehåll som inte når alla ska framför allt vara ett medvetet beslut som någon kan stå till svars och argumentera för. Att gömma huvudet i sanden, som så ofta när det gäller video, borde inte vara den framkomliga väg som det är idag.

💡
Tips: Åsa Holmberg bloggar om hur man gör webbvideo tillgänglig för fler.