reCAPTCHA – Vad gör du egentligen när du bevisar att du inte är en robot?

Det finns mycket teknik vi använder i vår vardag som har så mycket mer avancerade funktioner än vi känner till. Ett sådant exempel är reCAPTCHA, alltså de där små ”testerna” du får göra t.ex. vid ett inlogg eller när du ska lämna en kommentar för att bevisa att ”jag är inte en robot”.

Visste du att det du gör när du klickar på ”alla bilder som visar trafikljus” inte bara bevisar att du är en människa – du hjälper också till att göra artificiell intelligens smartare?

Jag fick ett önskemål från en läsare att skriva ett inlägg om reCAPTCHA så låt oss gå igenom hur denna teknik egentligen funkar och vad den här för syfte förutom att stoppa spam.

Vad är reCAPTCHA och vem har skapat systemet?

CAPTCHA står för ” Completely Automated Public Turing test to tell Computers and Humans Apart” och skapades från början av datavetare på Carnegie Mellon universitetet i USA. Turing-testet togs fram 1950 av Alan Turing och går ut på att om man pratar med en maskin och inte kan avgöra om det är en människa eller maskin så kan maskinen sägas ha mänsklig intelligens.

I det här fallet handlar det inte om att avgöra hur intelligent en AI är utan reCAPTCHA är till för att stoppa spam och automatiserade bottar.

Det finns ju (tyvärr) människor som sitter och skapar program som på egen hand glider runt på nätet och letar efter formulär att fylla i med reklam eller lurendrejeri-meddelanden. Eller som försöker logga in på olika konton eller lämnar kommentarer med länkar till olika spamsidor på bloggar.

Detta drev alltså dataingenjörerna på Carnegie Mellon att ta fram en programvara som på ett enkelt sätt ska kunna skilja människor från robotar på nätet. Tekniken köptes sedan upp av Google som driver reCAPTCHA idag.

Du har hjälpt till att digitalisera böcker och träna AI i bildigenkänning

Det som de som hittade på reCAPTCHA gjorde var inte bara att skapa ett enkelt test för att identifiera mänskliga användare. De skapade också ett smart sätt att använda den data som matades in i tjänsten.

Du minns säkert hur reCAPTCHA såg ut för inte så länge sen. Då var det alltid två väldigt konstiga ord eller tal som du skulle tyda? De var suddiga, svängda, i konstiga typsnitt eller med streck över.

Dessa bilder kom från böcker eller tidningsartiklar! Tekniken var gjord så att du fick ett ”bekräftat” ord och ett nytt. Det var bara det bekräftade ordet som egentligen var testet, där du var tvungen att skriva rätt. Det andra ordet skickades in till databasen och sen kunde andra användare få samma ord och när tillräckligt många skrivit samma ord för just den bilden blev det ordet bekräftat. På så vis blev system självkontrollerande och automatiskt.

Så alla vi internetanvändare som suttit och slitigt vårt hår över de där himla svårlästa orden har faktiskt gjort ett väldigt stort jobb åt Google – vi hade redan 2011 digitaliserat hela Google Books-arkivet. Vi har även hjälpt till att digitalisera New York Times artikel-arkiv tillbaka till 1851. Ett jobb som hade varit enormt, dyrt och tidskrävande om människor skulle suttit och transkriberat de gamla tryckta texterna.

Självkörande bilar behöver känna igen trafikljus och cyklister

Som du säkert märkt på senare tid så får du längre upp de där svårlästa orden utan istället är det en serie bilder där du ska ”klicka på alla bilder som innehåller en cyklist”, ”alla som innehåller ett trafikljus” eller som exemplet ovan ”alla bilder som visar en soppa”.

En stor utmaning för maskininlärning och AI-program är bildigenkänning. Att kunna titta på saker och identifiera vad det är. Genom att ”tagga” tusentals bilder föreställande övergångsställen och bussar kan vi hjälpa AI att bli bättre på detta.

Att det är just trafik som ofta är i fokus är för att detta är extra viktigt för programvara för självkörande bilar, något som Google uppenbarligen prioriterar. Men samma programvara kan också användas för att automatiskt sortera bilder i stora bildarkiv och göra bilderna sökbara (du vet Google de är ju lite intresserade av det där med sök…).

Smartare AI-program ger också bättre spam-program

Ja, vid det här laget har du kanske börjat fundera på att om vi använder reCAPTCHA för att lära program att känna igen bilder – kommer inte spam-programmen också använda det då? Och på så vis kunna övervinna reCAPTCHA?

Jo, exakt så är det och detta är ett problem som såklart även Google har insett. Därför har de hittat på en ny lösning som på ytan verkar väldigt enkelt men som är betydligt mer avancerad än den verkar.

Nu för tiden möts du nämligen allt oftare av en liten enkel checkruta där du bekräftar: ”jag är inte en robot”.

En simpel checkruta med en avancerad baksida

Google insåg nämligen att vi människor blev allt mindre toleranta med de där tidskrävande små testerna. reCAPTCHA började ses som negativt och de insåg att det behövdes något som var betydligt snabbare och enklare för oss användare.

jag är inte en robot

Det som ”jag är inte en robot”-rutan egentligen gör bakom kulisserna är att bland annat att kolla hur vi rör muspekaren innan vi klickar i rutan. Där avslöjar vi vår mänsklighet! Eftersom tjänsten kommer från Google så kan den också kolla vår ”Google-cookie” på datorn där de vet hur vi rört oss på nätet, vad vi sökt på och så vidare.

Så systemet är uppbyggt så att vi först får det här väldigt enkla testet. Som de allra flesta ”klarar”. Om det uppstår någon tveksamhet om vår mänskliga status så får vi ett sådant där bildtest för att bekräfta att vi inte är ett ovanligt smart utformat spam-program.

I förlängningen blir reCAPTCHA mer och mer osynligt och en programvara som agerar helt i bakgrunden på webbsidor, där vi inte behöver göra något aktivt själva alls för att bekräfta vår mänskliga status.

?

Det pågår alltid lite av ett race mellan de som utvecklar programvara som ska vara hjälpsam och de som utvecklar programvara för mörka motiv. Mitt i alltihop finns ju vi användare som vill ha ett spamfritt internet samtidigt som vi vill kunna använda funktioner enkelt och snabbt.

Priset vi betalar är att vi ger Google mer och mer data om oss själva. Som de kan använda för att utveckla sina produkter. Nu vet du iallafall om att det är vad du gör när du bevisar att du är en människa på nätet!

Om du har några tankar, frågor eller reflektioner kring reCAPTCHA tveka inte att lämna en kommentar nedan ?

Prenumerera på Teknifik

Teknifik är nyhetsbrevet och bloggen för dig som vill inspireras till en smartare och enklare digital vardag. Som prenumerant får du nya inlägg som det här direkt till din inkorg cirka en gång i veckan. Tips, guider och fördjupande insikter om teknik, internet och sociala medier.

Denna prenumeration är gratis och du kan avsluta när du vill.

10 reaktioner på ”reCAPTCHA – Vad gör du egentligen när du bevisar att du inte är en robot?”

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

SÖK

Guider, tips och fördjupande insikter om teknik, internet och sociala medier.

Som prenumerant får du nya inlägg direkt till din inkorg cirka en gång i veckan. Gratis och avsluta när du vill. 

ELIN HÄGGBERG

Hej och välkommen till Teknifik!

Jag heter Elin Häggberg och är kommunikatör, teknikjournalist och föreläsare.

Teknifik är för dig som är kreativ, engagerad och nyfiken…

… och trött på att känna att tekniken i ditt liv känns tråkig, krånglig och svår. 

Börja prenumerera

Teknifik är ett nyhetsbrev och en blogg. Som prenumerant får du ett nytt inlägg till din inkorg cirka en gång i veckan. Hela arkivet hittar du här på Teknifik.se.

Tre populära inlägg just nu

Klicka vidare för lästips!
En guide till det nya sociala mediet som alla pratar om! Är det värt att gå med?
Här är steg-för-steg vad du ska göra och hur du undviker att det händer (igen)!
Bli fri från skräp och en överfull inkorg!