Vem äger innehållet?

2010-12-01 klockan 05:19
solros

Det är mycket enkelt för vem som helst att när som helst publicera stora mängder innehåll på en eller flera olika sajter. Problemet är att vara ägare till innehållet.

När jag säger problemet så menar jag egentligen flera saker. För det första så är det resursintensivt att skapa innehåll. Speciellt kvalitativt innehåll. Den stora resursåtgången för att skapa innehåll är alltså ett “problem” för en sajtägare. Helst skulle sajtägaren vilja köpa fantastiska texter för inga pengar alls och publicera dem i en strid ström på sin sajt. Och bara luta sig tillbaka betrakta när omvärlden interagerar med innehållet och pengarna så att säga rullar in.

Det andra problemet är att när man är upphovsrättsinnehavare till en viss text så är det inte alltid alldeles självklart att Google tycker samma sak. Det beror på att webben fungerar på det sättet, alldeles oavsett Google’s existens, att bra innehåll publiceras till höger och vänster, delas, citeras, stjäls och återanvänds ända tills det faller i glömska. Det här måste Google förhålla sig till på ett ingenjörsmässigt vis. D v s, de måste skapa en teknologi som kan identifiera den ursprungliga källan till ett visst innehåll. Google är mycket bra på detta, men inte perfekt. De har enorma mängder data som de kan använda för att statistiskt bestämma vilken sajt som är den mest sannolika ägaren till ett visst innehåll.

Canonicalization

Canonicalization är en term som beskriver processen att bestämma vilken data som är standard, eller normal. Här är exempel på några av de parametrar som Google har att kika på när det gäller deras egen canonicalization-process för sökvägar:

  • Länkar till den specifika sidan – anger någon eller några av de sajter som publicerat ett visst innehåll en annan sida som källa? Antalet länkar till den specifika källan har sannolikt visst inverkan på sannolikheten att innehållet tillhör den mest inlänkade källan. Beroende på vad det är för sorts länkar förstås.
  • Domänauktoritet – Google har sannolikt ett mått på hur sannolikt det är att en viss sajt duplicerar andra sajters innehåll, i förhållande till måttet domänauktoritet (Som finns).
  • Tidpunkten – Vem publicerade innehållet först? Den självklara parametern kan tyckas, men eftersom Google inte spindlar alla sajter i varje ögonblick så finns ju en sorts tidsmässig döda vinkeln som är den tid mellan Google-boten’s besök till en viss sida eller sajt.

Det finns alldeles säkert en lång lista med olika ställen där Google tar tempen för att bestämma ägare och dessa 3 är sannolikt en betydande del av teknologin. Säg till om jag missat något viktigt! Vad som också är intressant är hur Google på förhållandevis kort tid introducerat nya tekniker för att hjälpa sajtägare att komma till rätta med den här typen av problem.

Nya metoder för webmasters

Webmaster centralFör ungefär ett år sedan dök möjligheten att använda sig av canonical-taggen mellan olika domäner. Då kunde man alltså börja med att via canonical-taggen peka på en annan domän som ägare till ett visst innehåll. Man kan anta att detta skulle vara till fördel för både den som publicerar innehållet såsom icke ägare och för den som är den faktiska ägaren. Eftersom det rimligen inte uppstår några tvivel om vem som äger innehållet, så blir varken ägare bestulen eller “lånaren” straffad.

För bara 2 veckor sedan dök det upp en ny meta-tagg. Den är tänkt för nyhetssajter och fungerar i skrivande stund för Google News endast. Sannolikt vill Google ge nyhetssajter en spark i baken och få dem att vara mer noggranna med att ange källa till ett visst innehåll. Utan att ha läst på speciellt mycket om hur den nya meta-taggen mottagits av webmasters så för man förmoda att den blir föremål för kritik eftersom man helt frankt kan använda taggen för att utge sig för att vara ägare till ett visst innehåll. Man får utgå från att taggen kommer att fungera som ett komplement till Google’s mer avancerade tekniker.

Risker med rel=”canonical”

Kanske har Google insett att enkla misstag i användningen av canonical-taggen kan få katastrofala följder. Det är betydligt svårare att ställa till det med den nya meta-taggen är det är med cross domain canonical och canonical-taggen i stort. Därför är den ett välkommet tillskott.

Skillnader i arbetet sökmotoroptimering

Hur ska den som jobbar med sökmotoroptimering förhålla sig till de eventuella svårigheter som uppstår när ens innehåll sprids på nätet? Det finns del småsaker som man kan göra för att minska möjligheterna för innehållstjuvarna. Att länka både externt och internt i sina texter på nätet gör det också lite besvärligare för spammare och att dra nytta av dina texter. I stort så skulle det underlätta om folk som publicerar sig på nätet faktiskt lade sig till med den goda vanan att länka till källmaterialet. Det skulle förbättra situationen för alla förutom de som vill låna innehåll. Här är det för övrigt på plats med en ordentlig känga till de stora dagstidningarna som gör sitt bästa för att torka ut och likrikta kommunikationen på nätet. HTML står för hypertext markup language. Det verkar många ha glömt bort fullständigt.

Innehållsmos

Att låna innehåll är också en stor möjlighet för de som jobbar med sökmotoroptimering. Det är en fullt legitim metod för att skapa innehåll, att låna små bitar av flera andra källor och sätta ihop dem på ett vis där de olika bitarna bildar en ny helhet. För en viss typ av sajter så är det här ett mycket bra sätt att jobba på. Det gäller i synnerhet stora sajter med stora mängder dynamiskt genererade sidor. Här är ett exempel på detta från svenska Eniro.se, med sidan om David Wickström. Sidan lämnar en del i övrigt att önska men min gissning är att det beror på att det inte finns tillräckligt med folk som heter på det viset och samtidigt producerar aktuellt innehåll i en mångfald av kanaler.

Slutligen

SökmotorkonsulterJag föreställer mig att Google i ett större perspektiv är kraftigt beroende av att på ett i detalj korrekt vis kunna bestämma vem som har rätt att publicera viss innehåll. Dels för att täppa till stora hål som spammare annars utnyttjar, och dels för att kunna vara en auktoritet bland sökmotorer och inte börja visa felaktiga ägardata för viktigt innehåll. Google har ju redan siktet inställ på världens alla böcker och skulle nog gärna få kontroll på allt forskningsmaterial också. Om inte för att skaffa sig en bild av vem som skriver vad i världen så går det också bra att kapitalisera på trafiken.

Kommentera inlägget

Kommentera eller trackbacka från din sajt.

Publicerad: 2010-12-18 klockan 08:42
lankgraf

I mitt tidigare inlägg om Google’s maskinella språkkunskaper så nämnde jag kort att beteendet vad gäller att länka ut till exempelvis informationskällor och liknande har blivit utarmat. Att webbtext i många stycken inte liknar den ursprungliga idéen om hypertext.
Jag hittade den här texten som definerar hypertext. Jag fastnade för det här stycket som säger något om hur bra hypertext ska vara utformad vad gäller länkar:
Lots of links. If each document has just one link, then …

Publicerad: 2010-10-08 klockan 07:58
forstoringsglas

Google genomför just nu tester i resultatsidorna med ett litet förstoringsglas som dyker upp precis till höger om titeln vid varje enskilt resultat. Klickar man på förstoringsglaset så får man när man hovrar över resultaten en förhandstitt av hur respektive målsida ser ut.

Tanken är väl att man ska kunna undvika att slösa tid på att klicka sig fram och tillbaka till sidor som om man fått en liten förhandstitt på, inte valt att besöka. Sen …

Publicerad: 2010-12-18 klockan 07:59
google-terminator

Den här bloggposten reflekterar över hur Google leder utvecklingen i världen när det gäller att samla, tolka och sortera information. Faktum är att de också är bäst i världen på att kapitalisera på andras information, men det är en annan bloggpost.

I den här bloggposten kikar vi kort på fyra språkverktyg som Google lanserat. De bakomliggande teknologierna för de här publika tjänsterna är sannolikt bara en liten del av Google sammanlagda verktygslåda och tjänsterna nog är …

Publicerad: 2011-02-15 klockan 09:45
paginering

När ett visst innehåll blir för omfattande att visa på en sida brukar man ju dela upp det över flera sidor – det heter ju paginering. Att skapa paginering som är sökmotorvänligt är inte svårt, men ändå finns det, mig veterligen, inget CMS som har alla rätt på provet direkt ur kartongen.

Publicerad: 2010-06-29 klockan 07:36
Bread Crumbs

På webben hittas information via en mångfald av olika kanaler som exempelvis sökmotorer eller olika sociala nätverk. När man via någon av alla kanaler hittat in till en specifik landningssida på en sajt så kan det vara bra att få information om var någonstans i sajtens hierarki man befinner sig. Det är vanligt att man kan utläsa denna information i breadcrumbs eller i en url.
Sajtstrukturen i URL, breadcrumb eller båda
Det finns ju olika åsikter om …

Publicerad: 2010-08-21 klockan 06:43
svavare

Jag skrev tidigare hur man kan variera texten i sina breadcrumbs för att få naturligt få in olika varianter av ett eller flera nyckelord på sin sida. Det här är en liknande historia fast denna gång gäller det title-elementet i bilder. Närmare bestämt så kallade “post thumbnails”. Sedan WordPress version ca 2.9 finns möjligheten att tilldela varje post en speciell bild, som man sedan kan hämta varifrån som helst i sitt tema.
Jag förutsätter att du …

Publicerad: 2010-08-30 klockan 09:57
e-handel

Att jobba med sökmotoroptimering för e-handel är en utmaning på många sätt. Sammanfattningsvis kan man säga att svårigheterna liggier i att skapa en sajt där alla produkterna representeras av en webbsida som är unik och tillräckligt innehållsrik för att en sökmotor ska bedöma att den är värd att behålla i index, och ännu bättre att den också visas högt upp i SERP:arna för relevanta sökord.
Content is king
Olika affärssegment rymmer olika sorters svårigheter. Ta som exempel, …

Publicerad: 2012-02-14 klockan 09:01
sven-erik-ohlson-rich-snippets

Schema.org – det är verkligen dags att rycka upp sig och börja anamma Schema.org och HTML5. Jag sätter gång direkt och börjar testa hur pass enkelt det är att få till Rich Snippets för persondata. En fiktiv person vid namn Sven Erik Ohlson för utgöra försöksperson.

Publicerad: 2012-02-22 klockan 03:30
Google-Places-SEO-Tips

Det här blir en kort bloggpost bara för att demonstrera ett intressant fynd jag gjorde idag. Hur skulle det vara om man maskinellt kunde ställa frågor till Google och inkludera en mer exakt position än bara land? Helfestligt så klart.
Spana i den här sökningen:
http://www.google.se/search?hl=sv&output=search&q=frisör&gl=SE&muul=4_18&luul=södermalm
Hittar inte en enda rad i Google:s index om parametrarna muul & luul, men det vore ju intressant om rankchecking-programvaror eller API:n som SEO Powersuite, Advanced Web Rankings, Raven Tools, Authority Labs, …