VScan druhej generácie: Vrstva vizuálnej percepcie pre nevidiacich

22.12.2024

Nie je žiadne tajomstvo, že rád cestujem. Využívam pritom kombináciu aktívnej echolokácie, dlhej palice a GPS navigácie, s ktorými sa dá dosť dobre pohybovať priestorom a nájsť si v ňom zaujímavé ciele, ktoré si vopred vyberiem. Je to celkom super, no z turistického hľadiska mi stále niečo chýbalo.

Echolokácia síce odhalí budovi a objekty v mojom okolí, no len v obrisoch. Tie sú dostatočné pre fyzickú navigáciu, no nezachytávajú atmosféru priestoru, ktorá leží v detailoch. Som povedzme na námestí. Vidím okolo seba budovi. Sú ale staré alebo nové? Strohé či dekorované? Monotónne alebo farebné? Ako zapadajú do kontextu námestia a vizuálnej scenérie? Ako pôsobí ich osvetlenie počas noci?\ Socha, hoc by išlo aj o umelecké dielo, vyzerá na echolokačnom radare proste ako objekt. Mňa však zaujíma čo znázorňuje, z čoho je vyrobená, ako je vypracovaná, v akom je stave, čo sa píše na jej informačnej tabuli.\ Vedieť sa pohybovať v priestore je jedna vec, a vedieť ho vnímať a oceniť jeho emóciu je vec druhá. Prirodzene, vizuál nie je jediným prostriedkom v tomto ohľade, stále robia veľa zvuky miesta, jeho vône, ruch, no tá vizuálna stránka je dosť signifikantná a jej vnímanie mi ako turistovi celkom chýbalo.

Preto mi napadlo využiť veľké jazykové modely, a vytvoriť aplikáciu, ktorá by predstavovala vrstvu vizuálnej percepcie pre nevidiacich. Ktorá by vedela dať objektom zachyteným echolokáciou emóciu, obraz a vedela ma tak hlbšie napojiť na priestor. Napadlo mi, že ak by to fungovalo, mohla by sa moja objavovacia stratégia obrátiť. Dosiaľ som zaujímavé miesta vyhľadával na Googli, a vo fyzickom priestore ich už len dohľadával. No ak by som vedel vizuálne navnímať emóciu priestoru, stačilo by jednoducho sa prostredím prejsť, a zaujímavé miesta by sa ukázali sami od seba.

Aby som túto myšlienku preskúmal, vyvinul som VScan 0.2. Ak vás zaujíma, ako funguje, viac sa dočítate na stránke projektu.

Cestám zdar!

Category: technologie priestorovka