CAPTCHA, lesing av bilder.

OldHP · 4 Jan 2012

har hørt at google ikke leser bilder bare text, hvorfor gjør da noen sider captcha så vanskelig å lese? Captcha, altså, tekst som man må skrive som samsvarer med teksten du skriver for å bekrefte at man ikke er en spam bot.

Host1 · 4 Jan 2012

Dette er jo nettopp fordi at spamboter ikke skal kunne lese teksten i bildene.

Finnes ikke en site som har interesse av at google skal kunne lese teksten i CAPTCHA-bildet, spesielt ikke da det endres for hver gang siden loader.

OldHP · 4 Jan 2012

ok så det finnes mulighet for å lese text av bilder.. takk for svar mr host1

xdex · 4 Jan 2012

Klart det er mulig å lese text av bilder, og det er faktisk ikke så ille som man skulle tro, i hvert fall ikke om du bare ser på teoridelen og ikke ønsker å gjennomføre det i praksis.

Jeg vet at mer avanserte bot's bruker en algorytme for å finne ut bokstaver og tall. Ved å hente informasjon fra antibot bildet (pixel by pixel) sammen med farge informasjon kan de selv tegne opp det som står på bildet. Når nok informasjon er hentet ut, vil du kunne genere ett bilde og derfor finne bokstavene ganske enkelt.

Se for deg ett bilde med hvit bakgrunn, og svart tekst. Ta dette bildet, og del det opp pixel for pixel og hent ut fargeinformasjon fra den gjeldene pixelen samt plassering. Når man da har plassert alt, kan man enkelt finne ut om bokstaven ligner en A eller E og på den måten knekkes koden. Vet at dette er en gammel metode, og ikke på langt nær hva som er i dag.

Nå brukes noe som heter "Optical Character Recognition" og det finnes mye informasjon om dette på nettet, Optical character recognition - Wikipedia, the free encyclopedia

Litt off-topic, men kan være greit for de som lurer.

Gisle Hannemyr · 26 Jan 2012

OCR er selvsagt en mulighet - men her er et alternativ til OCR beskrevet.

Tonny Kluften · 27 Jan 2012

Gisle Hannemyr skrev:
OCR er selvsagt en mulighet - men her er et alternativ til OCR beskrevet.

Haha, den var smart.

CAPTCHA, lesing av bilder.

OldHP

Medlem

Host1

Medlem

OldHP

Medlem

xdex

Medlem

Gisle Hannemyr

Blogger

Tonny Kluften

Administrator