Hvordan genkender vi det samme objekt fra forskellige vinkler?

Udgivet: 29. juni 2023

Forfattere

Brittney Truong, David Murray, Anila Kankipati, Breyanna Collins, Jay Hegdé

Visuel konstans er den afgørende mentale evne, hvormed vi genkender et objekt som det samme, selv om det ser anderledes ud. Hvis vi ikke havde visuel konstans, ville vi ikke kunne genkende objekterne omkring os, hvis vi så dem fra en anden vinkel, i en anden belysning eller på afstand. På grund af visuel konstans ved vi, at et dyr er en elefant, uanset om vi ser den forfra eller fra siden. Tror du, at en computer kan gøre det samme? Mange typer smarte computere, såsom smartphones og selvkørende biler, bruger også en version af visuel konstans til at fungere i den virkelige verden. Mange cybersikkerhedsværktøjer, som CAPTCHA, udnytter det faktum, at mennesker er meget bedre end robotter til opgaver, der kræver visuel konstans. Visuel konstans er en tillært færdighed, og en bedre forståelse af den hjælper os med at skabe smartere maskiner, herunder mobiltelefoner.

Hvad er visuel konstans?

Se på figur 1A. Hvilke to billeder er af det samme æble, set fra to forskellige vinkler, og hvilket er et andet æble? Din hjerne kan identificere, hvilket der er hvilket, selvom æblets form, belysning og position er lidt forskellig fra det ene billede til det næste [1]. Det skyldes en evne i hjernen, som kaldes visual constancy, vi bruger visuel konstans til at genkende objekter fra forskellige synsvinkler og vinkler (figur 1B, C). Visuel konstans gælder også for ændringer i et objekts størrelse, belysning og afstand.

Figur 1: Eksempler på visuel konstans. (A) Hvilket æble er anderledes? Hvis du gættede på det midterste æble, har du ret! (B) Folk kan se, at det er den samme person på disse tre billeder, selvom de er taget fra forskellige synsvinkler. (C) Når et objekt er langt væk fra øjet (øverst), laver det et lille billede i øjet. Når det samme objekt er tættere på (nederst), skaber det et større billede i øjet [billedkreditter: (A) Amazing Design: https://www.thingiverse.com/thing:347623 (B) Charles Van gestel: https://www.myminifactory.com/object/3d-print-albert-einstein-bust-142808 (C) Brittney Truong].

Typer af konstans

Visuel konstans kan inddeles i forskellige typer afhængigt af de visuelle signaler og de involverede forskelle, såsom størrelse, lysstyrke og form (se her). Størrelseskonstans indebærer, at man genkender to objekter som de samme, selv når de er forskellige størrelser, baseret på perspektiv. For eksempel ser en hund, der går ned ad gaden mod dig (figur 2A), ud som om den vokser i størrelse. Men takket være størrelseskonstansen ved din hjerne, at hunden bare kommer tættere på. Lysstyrkekonstans, også kendt som belysningskonstans, er, når belysningen ændrer sig, men du ved, at objektet ikke har ændret sig. Når man for eksempel fortæller spøgelseshistorier, kan historiefortælleren lyse med en lommelygte på sit ansigt nedefra (figur 2B), men man kan stadig genkende ham. Formkonstans er, når du forstår, at objektet er det samme, selv om det ser ud til at ændre form – for eksempel når det ses fra en anden synsvinkel (figur 2C).

Figur 2: Typer af perceptuel konstans. (A) Størrelseskonstans: hunden til venstre er den samme som, men mindre end, hunden til højre. (B) Lysstyrkekonstans (eller belysningskonstans): Rotationen af lyset kaster en voksende skygge på den samme statue af Beethoven. (C) Formkonstans: Når Frihedsgudinden drejes i forskellige vinkler, ser dens form ud til at ændre sig drastisk, men vi kan stadig genkende den [billedkreditter: (A) Minneapolis Institute of Art: https://www.myminifactory.com/object/3d-print-dog-84520 (B) Oliver Laric: https://www.myminifactory.com/object/3d-print-beethoven-at-the-usher-gallery-lincoln-uk-2971 (C) Scan The World: https://www.myminifactory.com/object/3d-print-statue-of-liberty-in-manhatten-new-york-2077].

Visuel konstans har mange navne afhængigt af det videnskabelige område, og hvem der studerer det. Inden for datalogi kalder forskere det objektinvarians. Andre forskere kalder det objektkonstans eller perceptuel konstans [2]. Perceptuel konstans gælder for alle vores sanser (inklusive syn, hørelse og berøring), mens visuel konstans kun gælder for synssansen. Perceptuel konstans hjælper os med at erkende, at objekter fortsætter med at eksistere, selv når de ikke kan ses, høres eller føles [3].

Uden konstans kunne vi ikke fungere

Perceptuel konstans er vigtig i dagligdagen. Det skyldes, at selv når objekterne omkring os forbliver de samme, ændrer den information, vores hjerner modtager om dem, sig hele tiden (se her). Hvis vi ikke havde perceptuel konstans, ville alle aspekter af vores liv blive påvirket: Vi ville ikke kunne genkende vores kære, hvis vi så dem fra en anden vinkel, eller vi ville ikke kunne genkende dem, hvis de var forkølede og lød anderledes. Vi ville stadig kunne se, føle og lytte til genstande eller lyde, men vi ville ikke være i stand til at forstå dem. Den visuelle verden omkring os ville ikke have nogen mening, fordi vi ikke ville kunne genkende en stol eller et æble, hvis disse genstande bevægede sig i rummet, eller hvis belysningen i rummet ændrede sig. Uden perceptuel konstans ville vi derfor slet ikke være i stand til at fungere i den virkelige verden!

Visuel konstans er en tillært færdighed

Hvis du læser dette, har du visuel konstans. Men det er ikke en færdighed, vi er født med – den skal læres. Hvordan ved vi, at vi ikke er født med en fuldt udviklet visuel konstans? Det ved vi blandt andet fra mennesker, der er født blinde og senere i livet får synet tilbage ved en operation. I sin bog An Anthropologist on Mars fortæller den berømte hjernelæge Oliver Sacks historien om mange af disse mennesker (se her). Efter at have fået synet tilbage, havde disse mennesker fungerende øjne, men kunne ikke forstå, hvad de så. De havde lært at læse, genkende genstande og navigere ved hjælp af deres andre sanser. Deres andre sanser, såsom hørelse og berøring, havde perceptuel konstans, men disse mennesker manglede visuel konstans. Da de fik synet tilbage, var de nødt til at lære visuel konstans, fordi deres hjerner ikke havde udviklet denne færdighed. De kunne ikke genkende ting, hvis de bevægede sig eller blev set under forskellige forhold, fordi de var afhængige af berøring i stedet for synet.

Undersøgelser af raske spædbørn har også været med til at bevise, at perceptuel konstans ikke er medfødt, men tillært. Når man leger kik-kik med et nyfødt barn, tror det, at man forsvinder, når man gemmer sig bag hænderne. Den berømte schweiziske psykolog Jean Piaget (1896-1980) viste først, at når babyer er omkring 2 år gamle, har de et fuldt udviklet koncept for objektpermanens eller konceptet om, at objekter bliver ved med at eksistere, selv når de forsvinder ud af syne (se her). Senere forskning har vist, at babyer begynder at udvikle objektpermanens omkring 3-5 måneder efter fødslen.

Vi forstår endnu ikke helt, hvordan hjernen lærer eller implementerer visuel konstans (se her). Vi ved, at hjerneområder i nærheden af tindingerne, kaldet fusiform gyrus hjælper os med at genkende ansigter fra mange forskellige vinkler, men vi ved, at gyrus fusiformus gør dette ved at samarbejde med andre regioner i mange dele af hjernen.

Computerforskere har nogle ideer om, hvordan hjernen kan lære visuel konstans. En af idéerne er, at hjernen observerer, hvordan billedet af et givent objekt i øjet ændrer sig over tid. Forestil dig, at du tager et billede, hver gang du blinker. Din hjerne gemmer disse billeder og sammenligner det, du ser lige nu, med det, du så for et øjeblik siden. Din hjerne kan foretage mange af den slags sammenligninger for at forstå, hvordan objekter ændrer sig i dit synsfelt.

Smarte computere har også brug for stabilitet

Ligesom mennesker har brug for konstans for at fungere i den virkelige verden, smarte computere som smartphones eller selvkørende biler – har også brug for konstans. Før de trænes til at være intelligente, er intelligente computere som mennesker, der har fået synet tilbage: De har et fungerende visuelt system, men kan ikke finde mening i det, de ser. Computerforskere skal lære disse computere, hvordan de genkender objekter i den virkelige verden.

For at træne disse computere til at genkende et objekt, giver computerforskere computerne mange eksempler på billeder eller videoer af objektet. For at hjælpe en selvkørende bil med at genkende et stopskilt, giver forskerne for eksempel bilens computer et stort antal billeder af stopskilte fra mange vinkler eller afstande og under forskellige lysforhold. På den måde lærer bilen, hvordan et stopskilt ser ud under så mange forhold i den virkelige verden som muligt. Det vil sige, at bilen opnår visuel konstans for et stopskilt. Denne proces med maskinlæring gentages for at lære bilen om de mange andre objekter, den sandsynligvis vil støde på, såsom andre vejskilte, trafiklys, fodgængere eller andre køretøjer (figur 3A, B; se her). At lære forskellige objekters konstans hjælper også computeren med at skelne objekter fra hinanden, som f.eks. et stopskilt vs. et trafiklys.

Figur 3: Eksempler på maskinlæring. (A) En selvkørende bil med kameraer og sensorer monteret på taget til at optage billeder fra omgivelserne. (B) En smart bils syn på vejen. De røde felter genkender fodgængere, og de blå felter genkender objekter som biler og lygtepæle. Bilens computer skaber en digital model af verden, som bilen kan bruge til at træffe beslutninger om kørslen. (C) Et eksempel på CAPTCHA. Prompten beder seeren om at vælge de personer, der bærer briller [billedkreditter: (A) Dllu: https://commons.wikimedia.org/wiki/File:Self[dolmath]_driving_Uber_prototype_in_San_Francisco.jpg (B) Eschenzweig: https://commons.wikimedia.org/wiki/File:Autonomous-driving-Barcelona.jpg (C) Pau Giner: https://commons.wikimedia.org/wiki/File:Find-all-captcha-idea.png].

Ligesom vores eksempel med mennesker, der tager snapshots i tankerne, leder computere efter de vigtige træk ved et objekt for at identificere det. Jo flere synsvinkler en computer har, jo bedre kan den identificere objekter. Det samme gælder for mennesker. Hvis vi så en statue, ville vi have lettere ved at genkende den, hvis vi kunne gå rundt om den og observere alle dens træk. Det virker indlysende, men det var først, da computerforskerne begyndte at udvikle intelligente computere, at hjerneforskerne så denne sammenhæng.

Brug af perceptuel konstans til at overliste robotter

Kriminelle kan nogle gange bruge smarte computere til at overvælde en hjemmeside. Computerforskere udnytter den perceptuelle konstans til at overliste et sådant misbrug af smarte computere. Hvis du nogensinde har forsøgt at få adgang til en hjemmeside, men er blevet mødt af en barriere, der beder dig om at bevise, at du ikke er en robot, har du mødt dette forsvar. Sådanne barrierer kaldes CAPTCHA (figur 3C). CAPTCHA står for “completely automated public Turing test to tell computers and humans apart”. CAPTCHA virker, fordi hver gang du beviser, at du er et menneske – enten ved at identificere det billede, den beder dig om at vælge, eller ved at stave slørede, sammenblandede ord med bogstaver og tal – demonstrerer du, at du har en bedre perceptuel konstans end en computer!

Menneskers svar på CAPTCHA-tests bruges igen til at træne intelligente computere til bedre at genkende billeder og tekst. Efterhånden som intelligente computere bliver bedre til at genkende billeder og tekst, må CAPTCHA-testene blive sværere, så kun mennesker kan bestå dem (se her). Så næste gang CAPTCHA giver dig gadeskilte eller veje at identificere, er du måske med til at forbedre selvkørende biler. Hvor sejt er det lige?

Hvad betyder det hele?

Forskere studerer hjernen for at lære mere om, hvordan mennesker fungerer og opfører sig. At forstå, hvordan vi bruger visuel konstans, hjælper os med at forklare, hvordan vores hjerner giver mening til verden omkring os. Uden visuel konstans ville vi være ude af stand til at genkende og interagere med verden, vi ville være nødt til at genlære hvert eneste ansigt og objekt, vi møder. Desuden kan forståelsen af visuel konstans være med til at gøre computere smartere og mere nyttige, fordi de bedre kan bearbejde det, de ser, og hjælpe dem med at træffe beslutninger. Vi kan bruge det, vi ved om hjernen, til at lave mere intuitive computere, der kan arbejde for og sammen med mennesker. Med computere, der kan lære og fungere uden konstant overvågning fra menneskelige operatører, kan computere erstatte menneskelige opgaver som at køre bil, læse billeder og overvåge.

Hjernen og computere har ligheder. Når forskere forsøger at skabe bedre computere, stiller de vigtige spørgsmål om, hvordan vores egne hjerner fungerer. Når vi lærer mere om, hvordan vores hjerner interagerer med verden, lærer vi noget om os selv, og hvordan vi kan udvikle systemer, der er næsten lige så gode som os til visse opgaver!

Ordliste

Visuel konstans: Den mentale evne til at genkende et visuelt objekt som det samme, selv når det ser anderledes ud. Visuel konstans er en form for perceptuel konstans (se nedenfor).

Visuelle signaler: Specifikke træk, som mennesker bruger til visuelt at identificere objekter.

Perceptuel konstans: Den mentale evne til at genkende et objekt ved hjælp af en eller flere sanser som det samme, selvom det kan se anderledes ud.

Objektpermanens: Den indlærte mentale evne, hvormed vi genkender et objekt, forsvinder ikke, når det forsvinder ud af syne.

Gyrus fusiformis: Det hjerneområde, der er specialiseret i opfattelsen af ansigter, ligger nær kæben på begge sider.

Intelligente computere: Teknologi, der kan bruge erfaring til at lære og forbedre ydeevnen.

Maskinlæring: Videnskaben om at skabe og bruge intelligente computere. Kaldes nogle gange kunstig intelligens.

Information om artiklen

BT, DM, AK og BC blev støttet med et uddannelseslegat til JH af Undergraduate Research Apprenticeship Program under U.S. Army Educational Outreach Program (AEOP). Forskning i JH’s laboratorium er blevet støttet af Army Research Office (ARO) grant #W911NF-15-1-0311 til JH.
Forfatterne erklærer, at forskningen blev udført i fravær af kommercielle eller økonomiske relationer, der kunne opfattes som en potentiel interessekonflikt.

[1] Backus, B., Bulthoff, H., Huebner, G., Langer, M. og Wallis, G. 2009. Læring af belysning og orienteringsinvariante repræsentationer af objekter gennem tidsmæssig tilknytning. J. Vis. 9:6. doi: 10.1167/9.7.6

[2] Vuilleumier, R., Henson, R., Driver, J. og Dolan, R. 2002. Flere niveauer af visuel objektkonstans afsløret af begivenhedsrelateret fMRI af gentagelsespriming. Nat. Neurosci. 5:nn839. doi: 10.1038/nn839

[3] Hegdé, J. 2018. Neurale mekanismer for syn på højt niveau. Compr. Physiol. 8:903-53. doi: 10.1002/cphy.c160035

Truong B, Murray D, Kankipati A, Collins B og Hegdé J (2023) How Do We Recognize the Same Object From Different Angles? Forside. Young Minds. 11:747790. doi: 10.3389/frym.2023.747790
Ryan Mruczek
Indsendt: 26. juli 2021; Accepteret: 4. maj 2023; Offentliggjort online: 29. juni 2023.
Copyright © 2023 Truong, Murray, Kankipati, Collins og Hegdé

Læs videre

Når du læser disse ord, er hundredvis af millioner af nerveceller elektrisk og kemisk aktive i din hjerne. Denne aktivitet gør det muligt for dig at genkende ord, fornemme verden, lære, nyde og skabe nye ting og være nysgerrig på verden omkring dig. Faktisk er vores hjerner – Homo sapiens‘ – de mest fascinerende fysiske substanser, der nogensinde er opstået på jorden for ca. 200.000 år siden. Hjernen er så nysgerrig og ambitiøs, at den stræber efter at forstå sig selv og helbrede sine skrøbelige elementer, når den bliver syg. Men på trods af de seneste vigtige fremskridt inden for hjerneforskningen ved vi stadig ikke, hvordan vi skal lægge brikkerne i hjernens puslespil. Det er på grund af dette, at der for nylig er startet flere store hjerneforskningsprojekter rundt om i verden. Vi deltager i et af dem – Human Brain Project (HBP) [1]. Hovedformålet er systematisk at katalogisere alt, hvad vi ved om hjernen, at udvikle geniale eksperimentelle og teoretiske metoder til at undersøge hjernen og at sammensætte alt, hvad vi har lært, til en computermodel af hjernen. Alt dette er muligt, da vores hjerne selv har designet kraftfulde computere, internettet og sofistikerede matematik- og softwareværktøjer, som snart vil være kraftfulde nok til at modellere noget så komplekst som den menneskelige hjerne i computeren. Dette projekt vil give en ny og dybere forståelse af vores hjerne, hjælpe os med at udvikle bedre kure mod dens sygdomme og i sidste ende også lære os, hvordan vi kan bygge smartere, lærende computere. Det vigtige er, at vores hjerne kun har brug for et par måltider om dagen (og måske lidt ekstra slik) for at klare det hele – det er meget mere energieffektivt end selv en simpel computer. Lad os så fortælle dig historien om HBP.

Vidste du, at læger kigger på tusindvis af menneskers hjerner hver dag? På hospitaler over hele landet kigger vi ind i patienternes hjerner for at se, om noget er gået galt, så vi kan forstå, hvordan vi kan hjælpe med at behandle den enkelte patients tilstand. Hjerneafbildningsteknologi spiller en vigtig rolle i at hjælpe læger med at diagnosticere og behandle tilstande som hjerneskader . Bag kulisserne er der særlige kameraer, som giver os mulighed for at se dybt ind i patienternes hjerner hver dag.

Hjernen har fascineret os i umindelige tider. Nogle af de første seriøse diskussioner om den menneskelige hjerne startede i det gamle Egypten, hvor kongen af Alexandria tillod dissektioner af forbrydere i levende live for at studere menneskets anatomi [1]. De, der udførte dissektionerne, åbnede kranieknoglen og så hjernen i levende live. Da de skar gennem hjernen, opdagede de store rum inde i den. Disse rum var forbundet med hinanden som kamre i et hus. De var også fyldt med en unik, krystalklar væske, som vi nu kender som cerebrospinalvæske eller hjernevæske. De var så begejstrede for dette fund! De troede, at menneskelige sjæl befinder sig i disse væskefyldte kamre. De forsøgte at forstå, hvordan væsken bevæger sig på tværs af disse kamre, fordi de troede, at det kunne forklare, hvordan det menneskelige sind fungerer.

Vidste du, at den mad, du spiser, påvirker dit helbred? Vigtigst af alt kan det, du spiser, have en negativ effekt på det mest komplekse organ i din krop: din hjerne! Utroligt nok påvirker den mad, du spiser, neuronerne, som er de vigtigste celler i hjernen. I hjernen forårsager en usund kost, der er rig på fedt og sukker, betændelse i neuroner og hæmmer dannelsen af nye neuroner. Det kan påvirke den måde, hjernen fungerer på, og bidrage til hjernesygdomme som depression. På den anden side er en kost, der indeholder sunde næringsstoffer som f.eks. omega-3-fedtsyrer, gavnlig for hjernens sundhed. En sådan kost forbedrer dannelsen af neuroner og fører til forbedret tænkning, opmærksomhed og hukommelse. Alt i alt gør en sund kost hjernen glad, så vi bør alle være opmærksomme på, hvad vi spiser.

Tak for din tilmelding.

Du modtager om et øjeblik en e-mail med et link, hvor du bekræfter tilmeldingen.

Med venlig hilsen
MiLife