CAPTCHA, lesing av bilder.

OldHP

Medlem
har hørt at google ikke leser bilder bare text, hvorfor gjør da noen sider captcha så vanskelig å lese? Captcha, altså, tekst som man må skrive som samsvarer med teksten du skriver for å bekrefte at man ikke er en spam bot.
 

Host1

Medlem
Dette er jo nettopp fordi at spamboter ikke skal kunne lese teksten i bildene.

Finnes ikke en site som har interesse av at google skal kunne lese teksten i CAPTCHA-bildet, spesielt ikke da det endres for hver gang siden loader.
 

xdex

Medlem
Klart det er mulig å lese text av bilder, og det er faktisk ikke så ille som man skulle tro, i hvert fall ikke om du bare ser på teoridelen og ikke ønsker å gjennomføre det i praksis.

Jeg vet at mer avanserte bot's bruker en algorytme for å finne ut bokstaver og tall. Ved å hente informasjon fra antibot bildet (pixel by pixel) sammen med farge informasjon kan de selv tegne opp det som står på bildet. Når nok informasjon er hentet ut, vil du kunne genere ett bilde og derfor finne bokstavene ganske enkelt.

Se for deg ett bilde med hvit bakgrunn, og svart tekst. Ta dette bildet, og del det opp pixel for pixel og hent ut fargeinformasjon fra den gjeldene pixelen samt plassering. Når man da har plassert alt, kan man enkelt finne ut om bokstaven ligner en A eller E og på den måten knekkes koden. Vet at dette er en gammel metode, og ikke på langt nær hva som er i dag.

Nå brukes noe som heter "Optical Character Recognition" og det finnes mye informasjon om dette på nettet, Optical character recognition - Wikipedia, the free encyclopedia

Litt off-topic, men kan være greit for de som lurer.
 
Topp