Att bedöma relevans

Hur gör då Google för att avgöra vilka annonser som är mest relevanta? Och hur gör de för att finna en bra balans mellan intäkt och nöjda användare, en balans mellan att placera annonser de vet att de får bra betalt för klick på och annonser som ger lägre intäkt men har högre relevans i en prominent position med mycket annonsyta?

Google använder sig av många signaler när man skall bestämma vilka annonser som skall visas, i vilken ordning och hur mycket varje enskild annonsör skall betala för ett eventuellt klick. Och detta bestäms varje gång någon gör en sökning på Google (eller laddar en sida på Google displaynätverk eller visar en video eller sida i en app). Det sker på bråkdelen av en sekund och är unikt i varje enskilt fall.

Om två personer sitter bredvid varandra och samtidigt gör samma sökning på Google så är det mycket sannolikt att deras sökresultat kommer att se aningen olika ut (det gäller både det organiska och de sponsrade länkarna faktiskt, men de styrs av helt olika algoritmer och jag håller mig till annonserna här). Faktorer som spelar roll i vilka annonser som visas är exempelvis:

  • på vilken typ av enhet sökningen görs (desktop, surfplatta eller mobil)
  • var användaren befinner sig geografiskt
  • vilken tidigare sökhistorik den användaren har
  • hur mycket av sin dagsbudget annonsören har kvar

Därtill kommer en mängd andra faktorer som är mer eller mindre kända för oss och vars komplexa samspel förmodligen är svårt att överblicka även för de ingenjörer som skrivit systemets regler.

Naturligtvis kan Google endast visa en annons om annonsörens AdWords-konto tillåter det: om det innehåller sökord (jag håller mig här till sökordsannonsering för enkelhetens skull) som kan trigga en annons vid den sökfrågan, om budet är tillräckligt högt, om budget finns kvar, och så vidare. Detta sätter ramarna för vad systemet kan göra. Men huruvida en annons faktiskt skall visas i ett givet ögonblick, i vilken position och exakt vad kostnaden för ett klick på den kommer att bli, bestäms till syvende och sist av Googles maskiner.

Det första vi kan slå fast är alltså att det inte är anställda hos Google som avgör relevansen och placerar annonserna. Googles personal är endast inblandade på det vis att de har konstruerat systemet, alltså skapat ramverket och reglerna för auktionerna. Men ingen människa har ett finger med i spelet i den enskilda auktionen för att sätta priser, bestämma rangordning och dylikt. Det bestämt av maskinernas algoritmer.

Men förutom att ha skapats av människor, så matas systemet ständigt med feedback från människor, vilket har inverkan på de enskilda auktionerna. Och den feedbacken kommer från dig och mig och alla andra som använder Google genom att vi klickar eller inte klickar på annonser.

CTR väger tungt

Googles främsta metod att bedömma hur relevant en annons är för en specifik användare, i ett givet ögonblick vid en given sökfråga, är nämligen inte att jämföra texten som finns i sökfrågan med texten som finns i annonsen och på sidan som annonsen länkar till. Den likheten har också en viss betydelse, men det är inte den tyngsta faktorn.

Googles huvudsakliga metod att ta bedöma relevansen är istället att se till den historiska klickfrekvensen. De tar helt enkelt användarnas beteenden till hjälp för att avgöra hur hög relevans en annons har. Så om en annons med rubriken “Billiga möbler till hemmet” har visat sig ha en högre CTR än en annons med rubriken “Blå kostymer för herrar” när sökfrågan varit blå herrkostym så skulle Googles maskiner bedöma att den tidigare annonsen har högre relevans än den tidigare trots att likheten i ord är större och vi spontant uppfattar den som mer relevant. Naturligtvis spelar storleken på skillnaden också en roll, kanske kan en mycket liten skillnad i CTR inte kompensera för en stor skillnad betydelsen av ord, men den stora vikten av CTR har bekräftats av Google och bevittnas av annonsörer varje dag.

Men Google använder inte endast semantiska likheter och klickfrekvens som signaler för relevans och de använder inte bara data från AdWords-kontot för den vars annons skall bedömas.

Google maskiner aggregerar ju data från alla annonsörer och användare och kan se mönster på mycket stor skala. Om de har sett att annonser med ordet “möbler” haft en positiv påverkan på CTR när sökfrågan innehållit “kostym” hos andra annonsörer så kommer det sannolikt att vara till IKEA:s fördel i exemplet ovan oavsett om IKEA någonsin visat en annons vid den sökfrågan tidigare eller inte.

Och naturligtvis sträcker sig signalerna bortom de semantiska. Om sökningen sker på en mobiltelefon och annonsörens landningssida är mobilvänlig så är det en faktor som påverkar relevansen positivt. Likaså är den geografiska positionen en faktor och om användaren befinner sig i närheten av ett IKEA-varuhus ökar sannolikheten att IKEA:s annons visas. Den geografiska faktorn är förmodligen ännu viktigare när sökningen sker i en mobiltelefon än en stationär dator. Det kan jag emellertid inte bekräfta och vet för övrigt öga om hur balansen mellan sådana signaler ser ut, därom är Google tämligen tysta. Men jag vet att de står under ständig förändring eftersom klickdata ständigt samlas in och processas av Googles självlärande maskiner.