Duplicerat innehåll är ofta självständiga innehållsavsnitt inom eller tvärs över domäner som antingen helt och hållet matchar annat innehåll eller som är mycket likartade. Detta är oftast inte bedrägligt. Exempel på oskadligt duplicerat innehåll:
- Diskussionsforum som genererar både vanliga och avskalade webbsidor med inriktning på mobila enheter
- Lagringsobjekt som visas eller länkas via flera olika webbadresser
- Utskriftsversioner av webbsidor
Om din webbplats innehåller flera sidor med i stort sett identiskt innehåll finns det ett antal olika sätt att ange för Google vilken webbadress du föredrar. (Detta kallas för kanonisering.) Mer information om kanonisering.
I vissa fall dupliceras dock innehåll över olika domäner i ett avsiktligt försök att manipulera rankningarna i sökmotorerna eller få mer trafik. Vilseledande metoder som denna kan leda till att en användare ser i stort sett samma innehåll upprepas inom en uppsättning sökresultat, vilket kan ge en negativ upplevelse.
Google arbetar på att indexera och visa sidor med särskiljande information. Detta filter innebär att om din webbplats t.ex. har en vanlig version och en utskriftsversion för varje artikel och ingen av dessa har blockerats i en robots.txt eller med metataggen noindex, så väljer vi vilken av dem vi visar. I de sällsynta fall som Google hittar duplicerat innehåll som eventuellt visas med avsikt att manipulera rankningarna och lura våra användare, utför vi även lämpliga justeringar i indexeringen och rankningen av berörda webbplatser. Detta kan leda till att webbplatsens rankning påverkas negativt, eller att webbplatsen helt och hållet tas bort från Google-indexet så att den inte längre visas i sökresultaten.
Det finns olika saker du kan göra för att aktivt åtgärda dupliceringsproblemen och se till att besökare ser önskat innehåll.
- Överväg att blockera sidor från indexeringen: Hellre än att låta Googles algoritmer avgöra vilken som är den "bästa" versionen av ett dokument kan du tala om för oss vilken version du föredrar. Om du t.ex. inte vill att vi indexerar artiklarnas utskriftsversioner kan du hindra åtkomst till dessa kataloger eller använda vanliga uttryck i filen robots.txt.
- Använd 301-koder: Om du har ändrat strukturen på webbplatsen använder du 301-omdirigeringar ("RedirectPermanent" eller permanent hänvisning) i filen .htaccess och kan på så sätt dirigera om användare, Googlebot och andra sökrobotar. (I Apache gör du detta med en .htaccess-fil. I IIS använder du administratörskonsolen.)
- Var konsekvent: Försök att använda enhetliga interna länkar. Länka till exempel inte till http://www.example.com/page/ och http://www.example.com/page och http://www.example.com/page/index.htm.
- Använd toppdomännamn: Du gör det lättare för oss att visa den bästa versionen av ett dokument genom att använda toppdomäner överallt där det går att hantera landsspecifikt innehåll. Det är t.ex. lättare att se att www.exempel.de har innehåll som är specifikt för Tyskland jämfört med www.exempel.com/de eller de.exempel.com.
- Syndikera: Om du syndikerar ditt innehåll på andra webbplatser kommer Google alltid att visa den version som vi tror är bäst för användaren i en viss sökning. Det kanske inte är den version som du föredrar. Det är dock bra att se till att varje webbplats där du har syndikerat innehåll har en länk som leder tillbaka till den ursprungliga artikeln. Du kan också be dem som använder det syndikerade materialet att blockera versionen på sina webbplatser i filen robots.txt.
- Använd verktygen för webbansvariga för att meddela oss om hur du vill att din webbplats ska indexeras: Du kan meddela Google vilkendomän du föredrar (till exempel www.example.com or http://example.com).
- Minimera upprepning av standardtexter: Istället för att ta med en utdragen upphovsrättstext längst ner på varje sida kan du ta med en mycket kort sammanfattning och länka till en webbsida med mer information.
- Undvik att publicera stubbar: Användare gillar inte "tomma" sidor, så undvik platshållare när det är möjligt. Du kan t.ex. undvika att publicera sidor som ännu inte har ett faktiskt innehåll. Om du skapar sidor med platshållare bör du användarobots.txt så att du kan hindra att de genomsöks.
- Förstå ditt innehållshanteringssystem: Se till att du känner till hur innehåll visas på din webbplats. Bloggar, forum och relaterade system visar ofta samma innehåll i olika format. En bloggpost kan t.ex. visas på bloggens hemsida, på en arkivsida och på en sida med andra poster med samma etikett.
- Minimera mängden liknande innehåll: Om du har många sidor som liknar varandra kan du expandera varje sida eller sammanfoga sidorna till en. Om du t.ex. har en webbplats för resor med separata sidor för två olika städer, men med samma information på båda sidorna, kan du antingen sammanfoga sidorna till en sida om båda städerna eller expandera varje sida så att var och en har ett unikt innehåll om respektive stad.
Duplicerat innehåll på en webbplats leder inte till åtgärder mot den webbplatsen utom när avsikten med dupliceringen verkar vara att vilseleda och manipulera sökmotorresultaten. Om du har problem med duplicerat innehåll på en webbplats och om du inte följer tipsen som visas nedan brukar vi ofta göra bra ifrån oss när vi väljer vilken innehållsversion som ska visas i sökresultaten.
Om vår granskning visar att du har använt duplicering på ett bedrägligt sätt och om din webbplats har tagits bort från vårt sökresultat bör du noga granska din webbplats. Om din webbplats har tagits bort från vårt sökresultat kan du läsa våra riktlinjer för webbansvariga där det finns mer information. När du har gjort ändringarna och vet helt säkert att din webbplats inte längre strider mot våra riktlinjer, kan du skicka in webbplatsen och begära att den omprövas.
Om du upptäcker att en annan webbplats duplicerar ditt innehåll genom hopsamling (dvs. genom att lägga beslag på innehållet och publicera det på nytt), är det föga troligt att detta påverkar rankningen för din egen webbplats på Googles sökresultatsidor på ett negativt sätt. Om du upptäcker ett fall som är särskilt frustrerande får du gärna göra en DMCA-anmälan . Då gör du anspråk på äganderätten till innehållet och begära att den andra webbplatsen tas bort från Googles index.