reCAPTCHA – Vad gör du egentligen när du bevisar att du inte är en robot?

Det finns mycket teknik vi använder i vår vardag som har så mycket mer avancerade funktioner än vi känner till. Ett sådant exempel är reCAPTCHA, alltså de där små “testerna” du får göra t.ex. vid ett inlogg eller när du ska lämna en kommentar för att bevisa att “jag är inte en robot”.

Visste du att det du gör när du klickar på “alla bilder som visar trafikljus” inte bara bevisar att du är en människa – du hjälper också till att göra artificiell intelligens smartare?

Jag fick ett önskemål från en läsare att skriva ett inlägg om reCAPTCHA så låt oss gå igenom hur denna teknik egentligen funkar och vad den här för syfte förutom att stoppa spam.

Vad är reCAPTCHA och vem har skapat systemet?

CAPTCHA står för ” Completely Automated Public Turing test to tell Computers and Humans Apart” och skapades från början av datavetare på Carnegie Mellon universitetet i USA. Turing-testet togs fram 1950 av Alan Turing och går ut på att om man pratar med en maskin och inte kan avgöra om det är en människa eller maskin så kan maskinen sägas ha mänsklig intelligens.

I det här fallet handlar det inte om att avgöra hur intelligent en AI är utan reCAPTCHA är till för att stoppa spam och automatiserade bottar.

Det finns ju (tyvärr) människor som sitter och skapar program som på egen hand glider runt på nätet och letar efter formulär att fylla i med reklam eller lurendrejeri-meddelanden. Eller som försöker logga in på olika konton eller lämnar kommentarer med länkar till olika spamsidor på bloggar.

Detta drev alltså dataingenjörerna på Carnegie Mellon att ta fram en programvara som på ett enkelt sätt ska kunna skilja människor från robotar på nätet. Tekniken köptes sedan upp av Google som driver reCAPTCHA idag.

Du har hjälpt till att digitalisera böcker och träna AI i bildigenkänning

Det som de som hittade på reCAPTCHA gjorde var inte bara att skapa ett enkelt test för att identifiera mänskliga användare. De skapade också ett smart sätt att använda den data som matades in i tjänsten.

Du minns säkert hur reCAPTCHA såg ut för inte så länge sen. Då var det alltid två väldigt konstiga ord eller tal som du skulle tyda? De var suddiga, svängda, i konstiga typsnitt eller med streck över.

Dessa bilder kom från böcker eller tidningsartiklar! Tekniken var gjord så att du fick ett “bekräftat” ord och ett nytt. Det var bara det bekräftade ordet som egentligen var testet, där du var tvungen att skriva rätt. Det andra ordet skickades in till databasen och sen kunde andra användare få samma ord och när tillräckligt många skrivit samma ord för just den bilden blev det ordet bekräftat. På så vis blev system självkontrollerande och automatiskt.

Så alla vi internetanvändare som suttit och slitigt vårt hår över de där himla svårlästa orden har faktiskt gjort ett väldigt stort jobb åt Google – vi hade redan 2011 digitaliserat hela Google Books-arkivet. Vi har även hjälpt till att digitalisera New York Times artikel-arkiv tillbaka till 1851. Ett jobb som hade varit enormt, dyrt och tidskrävande om människor skulle suttit och transkriberat de gamla tryckta texterna.

Självkörande bilar behöver känna igen trafikljus och cyklister

Som du säkert märkt på senare tid så får du längre upp de där svårlästa orden utan istället är det en serie bilder där du ska “klicka på alla bilder som innehåller en cyklist”, “alla som innehåller ett trafikljus” eller som exemplet ovan “alla bilder som visar en soppa”.

En stor utmaning för maskininlärning och AI-program är bildigenkänning. Att kunna titta på saker och identifiera vad det är. Genom att “tagga” tusentals bilder föreställande övergångsställen och bussar kan vi hjälpa AI att bli bättre på detta.

Att det är just trafik som ofta är i fokus är för att detta är extra viktigt för programvara för självkörande bilar, något som Google uppenbarligen prioriterar. Men samma programvara kan också användas för att automatiskt sortera bilder i stora bildarkiv och göra bilderna sökbara (du vet Google de är ju lite intresserade av det där med sök…).

Smartare AI-program ger också bättre spam-program

Ja, vid det här laget har du kanske börjat fundera på att om vi använder reCAPTCHA för att lära program att känna igen bilder – kommer inte spam-programmen också använda det då? Och på så vis kunna övervinna reCAPTCHA?

Jo, exakt så är det och detta är ett problem som såklart även Google har insett. Därför har de hittat på en ny lösning som på ytan verkar väldigt enkelt men som är betydligt mer avancerad än den verkar.

Nu för tiden möts du nämligen allt oftare av en liten enkel checkruta där du bekräftar: “jag är inte en robot”.

En simpel checkruta med en avancerad baksida

Google insåg nämligen att vi människor blev allt mindre toleranta med de där tidskrävande små testerna. reCAPTCHA började ses som negativt och de insåg att det behövdes något som var betydligt snabbare och enklare för oss användare.

jag är inte en robot

Det som “jag är inte en robot”-rutan egentligen gör bakom kulisserna är att bland annat att kolla hur vi rör muspekaren innan vi klickar i rutan. Där avslöjar vi vår mänsklighet! Eftersom tjänsten kommer från Google så kan den också kolla vår “Google-cookie” på datorn där de vet hur vi rört oss på nätet, vad vi sökt på och så vidare.

Så systemet är uppbyggt så att vi först får det här väldigt enkla testet. Som de allra flesta “klarar”. Om det uppstår någon tveksamhet om vår mänskliga status så får vi ett sådant där bildtest för att bekräfta att vi inte är ett ovanligt smart utformat spam-program.

I förlängningen blir reCAPTCHA mer och mer osynligt och en programvara som agerar helt i bakgrunden på webbsidor, där vi inte behöver göra något aktivt själva alls för att bekräfta vår mänskliga status.

🤖

Det pågår alltid lite av ett race mellan de som utvecklar programvara som ska vara hjälpsam och de som utvecklar programvara för mörka motiv. Mitt i alltihop finns ju vi användare som vill ha ett spamfritt internet samtidigt som vi vill kunna använda funktioner enkelt och snabbt.

Priset vi betalar är att vi ger Google mer och mer data om oss själva. Som de kan använda för att utveckla sina produkter. Nu vet du iallafall om att det är vad du gör när du bevisar att du är en människa på nätet!

Om du har några tankar, frågor eller reflektioner kring reCAPTCHA tveka inte att lämna en kommentar nedan 👇

Om du gillade det här inlägget så får du gärna visa det genom att klicka på hjärtat, så jag vet vad jag ska göra mer av!

16
(Visited 202 times, 1 visits today)

10 kommentarer

  1. Reine Sköldberg 19 augusti, 2019 at 18:28

    Som vanligt, användbar info 🙂 för en IT pensionär 😚

    Reply
  2. Linnea 19 augusti, 2019 at 20:14

    Åh! Älskar sånt här, internetkuriosa <3.

    Jämt när jag trycker på en sån där I'm not a robot-knapp tänker jag på den här fantastiska roboten: https://youtu.be/fsF7enQY8uI

    ^_^

    Reply
  3. Linda 19 augusti, 2019 at 22:38

    Kul läsning! 🙂

    Reply
  4. Wilda 22 augusti, 2019 at 13:39

    SÅ roligt och intressant inlägg! Hade ingen aning!

    Reply
  5. Jasmine 23 augusti, 2019 at 18:47

    Wow! Tack för att du upplyste oss om detta häftiga 🙂

    Reply

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *