Az interface felületessége

Jólfésült hősünk egy átlátszó fal előtt áll, amin mozgókép szegmensek jelennek meg. Ujjai misztikusan világítanak, amelyek felemelésével, majd mozgatásával varázslatos dolgokat tud előidézni. Kezét előretolva visszatekeri, maga felé húzva pedig előretekeri a filmet. Jobbra-balra mozgatva arrébb rakja a szegmenst, majd egy másikat húz a helyére. Sokakat lenyűgözött a Minority Reportban látható fal, amin Tom Cruise nézi vissza a látnokok által regisztrált látomásokat vizuális formában, hogy eldöntse a mindenható kérdést: ki a jó és ki a rossz. Ám nem nehéz látni, hogy ez az interface miért tartozik az utóbbi csoportba – egyszerűen azért, mert erőltetett és kényelmetlen. Azt is könnyű látni, miért van a filmben – mert fotogén és látványos.
 


Próbáljon meg valaki egy 8 órás műszakot állva eltölteni, közben nyújtsa ki a kezét maga elé, és integessen vele okosan. Gyorsan rá fog jönni, hogy ez mennyire fárasztó. Ez a pozitúra legkevésbé sem természetes, hacsak nem almát szed épp az ember jólnevelt almafákról. Habár almaszedés közben legalább mozog, helyzetet és tartást vált, ami lényegesen könnyebb, mint egy helyben állni.

Már a korai immerzív virtuális valóság rendszerek építői is szembesültek azzal a problémával, hogy miután megépült a drága 3D rendszer, speciális szemüveggel, ami valóban térben mutat egy virtuális teret, majd beleállították a felhasználót, hogy lám, járjon körbe, fogjon meg dolgokat, tegye őket arrébb – ahogy az "természetes" -, az első kérés az volt: nem kaphatna egy széket és egy asztalt, nem ülhetne le inkább, mert így állni és handa-bandálni fárasztó.

Lássuk be, ha valamit egy csuklómozdulattal meg tudok tenni, akkor miért tenném azt teljes karmozdulattal. Ha valamit egy gombnyomással el tudok intézni, akkor miért emelgetnék és rakosgatnék bármit is ide-oda. Az emberek szeretnek hatékonyan dolgozni – és ha ezt kisebb energiakifejtéssel is megtehetik, szívesebben választják azt. Elvégre a targonca felhasználói felülete sem abból áll, hogy nehéz ládákat megragadva "természetesen" pakol az ember – hanem pont az a lényege, hogy kis erőfeszítéssel egy gépet dolgoztat maga helyett.

A Minority Report vizionáriusai annyira nem értettek az informatikához, hogy ugyanebben a jelenetben két, egymástól három lépésre álló fal között egy fizikai adathordozóval, egy átlátszó plexi kártyával viszik át az információt. Láthatólag érintetlenül hagyta őket a mindannyiunkat az 1970-es évek óta egyre inkább körbeszövő hálózat, és eleve az a koncepció, hogy az információ áramlik, az adathordozótól külön életet él. A fizikai valóba vetett hitüket ékes módon támasztja alá a jelenet végén az "egyedi és ismételhetetlen" módon esztergált fagolyó – mutatván ezzel, hogy akkor is hiányoztak az iskolából, amikor a modern kriptográfia történetét tanították.

Mindez jól mutatja azt a jelenséget, amit sok, önmagát user interface designernek (UI designer, felhasználói felület tervező) tartó ember követ – való világ használati tárgyai mentén próbálja modellezni egy informatikai rendszer használatát, próbálja lefordítani a kibertérbeli műveletet fizikai interakcióra. Mert akkor "természetesebb" lesz, könnyebb lesz megérteni, könnyebb lesz használni.

Ami inkább történik, hogy ezek az emberek egyszerűen nem értik azt, amivel dolgozniuk kell, ezért kényszeredetten keresnek allegóriákat a megszokott életükből, hátha rá lehet húzni a problémára. Iparművészeti vagy hasonló háttérből táplálkozva a hasonlat a fizikai életből jön, általában használati tárgyakra összpontosítva. Az allegóriák az esetek legnagyobb részében sántítanak és pont félrevezetnek. Néha olyan, egykor természetes mozdulatokat, gesztusokat tartalmaznak, amelyeket ma már csak tankönyvekből ismerünk, beleértve a designert is. Mindezek mellett a lehető legritkábban hatékonyak – cserébe lebutítják és felületessé teszik az alkalmazásokat.

Azok, akik még hallottak "hagyományos" telefonkészülékeket csörögni, gyakran választanak arra a hangra emlékeztető csengőhangot egyébként digitális mobiltelefonjukra, ami bármilyen hangon képes csörögni. Úgy gondolják, úgy érzik, ez az intuitív. Persze a pár évtizede hallott telefon hangja is egy korábbi szokás imitációja volt. Amíg nem tudjuk elszakítani az új technológiát az általunk ráerőltetett korlátoktól, addig nem is fogjuk tudni kiaknázni a benne rejlő lehetőségeket.

Próbáljuk meg életünk egy átlagos napját úgy leélni, hogy kizárólag egy egyujjas kesztyűvel a kezünkön mutogathatunk, valamint nem szólalunk meg. A boltban még rá tudnánk mutatni talán a marhafelsálra (igaz, a hentes udvariatlannak fog minket tartani), de már nem fogjuk tudni megkérdezni, hogy mennyire friss. Egy beszélgetést már nem tudunk lefolytatni – de nem tudunk megírni egy levelet sem. A csupán egérkattintós vagy érintőképernyős felületek kb. erre az interakciós szintre csökkentik a virtuális világgal való kapcsolatunkat, és láthatjuk, hogy ez elég szűkös.

A fenti interakciószegénység elegendő, ha az a feltételezésünk, hogy egy dologgal csak egy valamit lehet kezdeni, csak egyféleképpen kell hozzá viszonyulni – pl. rákattintani vagy rábökni az ujjaimmal, vagy rálőni egy 3D lövöldözős játékban. Ám szerencsére a világ ennél sokkal kifinomultabb, és a legtöbb dolognak sokfajta felhasználása van – és ezt csak gazdag kifejezésre lehetőséget adó eszközökkel lehet megfogni.

Az egyik leggazdagabb kifejező erő, amivel ember bír, az a beszélt és írott nyelv. A nyelv pont úgy fejlődik, hogy meg lehessen vele nevezni azon koncepciókat, amelyek elég fontosak ahhoz, hogy megnevezzük őket. Így ki tudjuk fejezni vele azt, amit érdemes kifejezni. Habár nem tökéletes kommunikációs forma, leginkább mert sokszor nem teljesen fedik a fogalmak egymást más-más személynél, ezzel együtt ez a legkifinomultabb kommunikációs formánk.

Míg az embernél a nyelv egy adoptált eszköz, addig az informatikai rendszerek belső felépítése eleve nyelvi – egész pontosan formális nyelvi alapú. Minden informatikai eszköz az ún. általános Turing-gép elvén működik, amelynek a lényege, hogy viszonylag hosszú szavakon végez műveleteket, gyakorlatilag a szavakat írja át más és más szavakra. Így írja le a rendszer mindenkori állapotát. Pl. ha bejön egy hívás a mobiltelefonra, akkor azt a szót, ami a telefon állapotát jelezni, átírja  nyugalmi állapotról csengő állapotra. Amikor valamilyen számítást végez, a számítás eredménye mindig egy szó átírását jelenti, ami azt az eredményt tárolja.

Ebből egyértelműen látszik, hogy ha (szó szerint) értjük a gép nyelvét, akkor azzal a teljesség igényével tudunk kommunikálni. Bármit meg tudunk neki mondani, amire az képes, és bármit meg tudunk tudni arról, hogy milyen állapotban van. Ebben az esetben nincs szükség köztes felületre, hisz a gép belső állapotát olvassuk, egy az egyben. Ami érdekes még ebben, hogy ez az állapot, jellegénél fogva, lineáris – egy hosszú szöveg, mint egy könyv vagy ez az írás.

A valóságban ritkán van arra szükség, hogy egy gép belső nyelvén kommunikáljunk vele, ahogy embertársainkkal sem az alapján lépünk kapcsolatba, hogy épp a vérnyomásuk milyen magas (még ha sokszor jó is lenne ezt tudni). Ennek leginkább az az oka, hogy a belső leírás túl bonyolult, túl sok olyan részletet tartalmaz, amelyek között elvesznénk. Ezért kerül a belső szerkezet elé egy felület, ami céltudatosan eltakarja azt, és egy más nyelvet definiál – valamint fordítja ezt a nyelvet a gép saját nyelvére. Ahogy az embernél is – felidegesítjük egy-két keresetlen szóval, ami miatt felmegy gyorsan a vérnyomása.

Bármilyen furfangos, látszólag nem lineáris, pl. 2D vagy 3D grafikus felületet is definiálunk, mire a gép foglalkozni tud vele, az mind lineáris formában kerül leírásra. Így bármilyen olyan ígéret, hogy valamilyen merőben új módon tudunk majd egy géppel vagy az általa tárolt és kezelt anyagokkal foglalkozni, egy beteljesíthetetlen vágyálom. Minden felhasználói felület minden eseményét egy pár szóból álló, lineáris gépi mondat írja le a gép felé. A felhasználói felület nem csinál mást, mint fordít az ember tevékenysége és a gépi mondatok között.

Ez ember-gép-ember kommunikáció esetén is így van. Amikor a kibertér egy kommunikációs csatornát képez egy másik ember felé, akkor minden, ami ezen átmegy, lineárisan egymást követő gépi szavak, mondatok sorozataként történik. A hang a telefonon keresztül, a kollaboratív többérintős képernyők érintései, a távoli jelenlét élményét keltő bútor tárgyak érzésszintű változásai vagy a legbonyolultabbnak tűnő kapcsolati háló struktúrák – mind egymást követő gépi szavak valójában.

Egy idegen kultúra megértésének első lépcsője, hogy lefordítjuk a saját nyelvünkre annak szövegeit. A valódi megértés ott kezdődik, hogy készség szinten elsajátítjuk annak nyelvét, amikor a beszéd és az írás az adott nyelven történő gondolkodást is jelenti – ahelyett, hogy mindig átfordítanánk a saját nyelvünkre, megfogalmazzuk a választ, majd visszafordítjuk a másik nyelvre. A kibertérben való otthonos mozgásnak is ez a feltétele – hogy értsük a tér jellegzetességét és saját nyelvén tudjunk vele párbeszédet folytatni.

A felhasználói felületek pontosan ezt takarják el előlünk, ebben akadályoznak meg minket – ettől felületesek. Azoknak kényelmesek, akik nem készek a kibertér megismerésére, hanem saját, antropomorf világfelfogásukat tudják csak elfogadni.

© 2020 Tranzit Hungary Közhasznú Egyeslüet

A tranzit program fő támogatója az Erste Alapítvány