Vem äger innehållet?
Det är mycket enkelt för vem som helst att när som helst publicera stora mängder innehåll på en eller flera olika sajter. Problemet är att vara ägare till innehållet.
När jag säger problemet så menar jag egentligen flera saker. För det första så är det resursintensivt att skapa innehåll. Speciellt kvalitativt innehåll. Den stora resursåtgången för att skapa innehåll är alltså ett “problem” för en sajtägare. Helst skulle sajtägaren vilja köpa fantastiska texter för inga pengar alls och publicera dem i en strid ström på sin sajt. Och bara luta sig tillbaka betrakta när omvärlden interagerar med innehållet och pengarna så att säga rullar in.
Det andra problemet är att när man är upphovsrättsinnehavare till en viss text så är det inte alltid alldeles självklart att Google tycker samma sak. Det beror på att webben fungerar på det sättet, alldeles oavsett Google’s existens, att bra innehåll publiceras till höger och vänster, delas, citeras, stjäls och återanvänds ända tills det faller i glömska. Det här måste Google förhålla sig till på ett ingenjörsmässigt vis. D v s, de måste skapa en teknologi som kan identifiera den ursprungliga källan till ett visst innehåll. Google är mycket bra på detta, men inte perfekt. De har enorma mängder data som de kan använda för att statistiskt bestämma vilken sajt som är den mest sannolika ägaren till ett visst innehåll.
Canonicalization
Canonicalization är en term som beskriver processen att bestämma vilken data som är standard, eller normal. Här är exempel på några av de parametrar som Google har att kika på när det gäller deras egen canonicalization-process för sökvägar:
- Länkar till den specifika sidan – anger någon eller några av de sajter som publicerat ett visst innehåll en annan sida som källa? Antalet länkar till den specifika källan har sannolikt visst inverkan på sannolikheten att innehållet tillhör den mest inlänkade källan. Beroende på vad det är för sorts länkar förstås.
- Domänauktoritet – Google har sannolikt ett mått på hur sannolikt det är att en viss sajt duplicerar andra sajters innehåll, i förhållande till måttet domänauktoritet (Som finns).
- Tidpunkten – Vem publicerade innehållet först? Den självklara parametern kan tyckas, men eftersom Google inte spindlar alla sajter i varje ögonblick så finns ju en sorts tidsmässig döda vinkeln som är den tid mellan Google-boten’s besök till en viss sida eller sajt.
Det finns alldeles säkert en lång lista med olika ställen där Google tar tempen för att bestämma ägare och dessa 3 är sannolikt en betydande del av teknologin. Säg till om jag missat något viktigt! Vad som också är intressant är hur Google på förhållandevis kort tid introducerat nya tekniker för att hjälpa sajtägare att komma till rätta med den här typen av problem.
Nya metoder för webmasters
För ungefär ett år sedan dök möjligheten att använda sig av canonical-taggen mellan olika domäner. Då kunde man alltså börja med att via canonical-taggen peka på en annan domän som ägare till ett visst innehåll. Man kan anta att detta skulle vara till fördel för både den som publicerar innehållet såsom icke ägare och för den som är den faktiska ägaren. Eftersom det rimligen inte uppstår några tvivel om vem som äger innehållet, så blir varken ägare bestulen eller “lånaren” straffad.
För bara 2 veckor sedan dök det upp en ny meta-tagg. Den är tänkt för nyhetssajter och fungerar i skrivande stund för Google News endast. Sannolikt vill Google ge nyhetssajter en spark i baken och få dem att vara mer noggranna med att ange källa till ett visst innehåll. Utan att ha läst på speciellt mycket om hur den nya meta-taggen mottagits av webmasters så för man förmoda att den blir föremål för kritik eftersom man helt frankt kan använda taggen för att utge sig för att vara ägare till ett visst innehåll. Man får utgå från att taggen kommer att fungera som ett komplement till Google’s mer avancerade tekniker.
Risker med rel=”canonical”
Kanske har Google insett att enkla misstag i användningen av canonical-taggen kan få katastrofala följder. Det är betydligt svårare att ställa till det med den nya meta-taggen är det är med cross domain canonical och canonical-taggen i stort. Därför är den ett välkommet tillskott.
Skillnader i arbetet sökmotoroptimering
Hur ska den som jobbar med sökmotoroptimering förhålla sig till de eventuella svårigheter som uppstår när ens innehåll sprids på nätet? Det finns del småsaker som man kan göra för att minska möjligheterna för innehållstjuvarna. Att länka både externt och internt i sina texter på nätet gör det också lite besvärligare för spammare och att dra nytta av dina texter. I stort så skulle det underlätta om folk som publicerar sig på nätet faktiskt lade sig till med den goda vanan att länka till källmaterialet. Det skulle förbättra situationen för alla förutom de som vill låna innehåll. Här är det för övrigt på plats med en ordentlig känga till de stora dagstidningarna som gör sitt bästa för att torka ut och likrikta kommunikationen på nätet. HTML står för hypertext markup language. Det verkar många ha glömt bort fullständigt.
Innehållsmos
Att låna innehåll är också en stor möjlighet för de som jobbar med sökmotoroptimering. Det är en fullt legitim metod för att skapa innehåll, att låna små bitar av flera andra källor och sätta ihop dem på ett vis där de olika bitarna bildar en ny helhet. För en viss typ av sajter så är det här ett mycket bra sätt att jobba på. Det gäller i synnerhet stora sajter med stora mängder dynamiskt genererade sidor. Här är ett exempel på detta från svenska Eniro.se, med sidan om David Wickström. Sidan lämnar en del i övrigt att önska men min gissning är att det beror på att det inte finns tillräckligt med folk som heter på det viset och samtidigt producerar aktuellt innehåll i en mångfald av kanaler.
Slutligen
Jag föreställer mig att Google i ett större perspektiv är kraftigt beroende av att på ett i detalj korrekt vis kunna bestämma vem som har rätt att publicera viss innehåll. Dels för att täppa till stora hål som spammare annars utnyttjar, och dels för att kunna vara en auktoritet bland sökmotorer och inte börja visa felaktiga ägardata för viktigt innehåll. Google har ju redan siktet inställ på världens alla böcker och skulle nog gärna få kontroll på allt forskningsmaterial också. Om inte för att skaffa sig en bild av vem som skriver vad i världen så går det också bra att kapitalisera på trafiken.










Kommentera inlägget