Duplikacja treści na stronie internetowej

Jednym z kryteriów podlegających ocenie podczas pozycjonowania witryny jest duplikacja treści. Jest to proces o negatywnym charakterze, który cechuje się niepożądanym powieleniem treści.  Może on występować zarówno w obrębie tej samej strony, lub kilku różnych w obrębie danego serwisu. 

Duplikację można również podzielić na zewnętrzną i wewnętrzną. To właśnie ta druga będzie dzisiejszym tematem.

Sam Google podaje, że najczęściej duplikaty treści nie są klasyfikowane jako oszustwa, lecz nieumyślny błąd na stronie. Co jest więc najczęstszym powodem występowania tego zjawiska? W zależności od charakteru prowadzonej przez nas strony duplikację treści można podzielić między innymi na:

  • duplikację wynikającą z kopiowania opisów produktów
  • duplikaty wynikającą z obecności treści wpisu w widoku kategorii lub wewnętrznej wyszukiwarce lub paginacji
  • duplikaty wynikającą z niepoprawnego zaimplementowania certyfikatu SSL.

Oczywiście sytuacji mogących doprowadzić do duplikowania treści jest zdecydowanie więcej.
Jednak te wymienione są najczęściej spotykane. Jak sobie z nimi skutecznie radzić? 

Opis produktu od producenta – jak uniknąć duplikatów?

Bez wątpienia używanie opisów produktów dostarczonych przez producenta spowoduje wystąpienie duplikatów.

Pierwszym rozwiązaniem, jakie pojawia się jest edycja fragmentów tekstu. Rozwiązanie jest to delikatnie mówiąc prowizoryczne i tymczasowe. Mając – załóżmy – 50 produktów od danego producenta prędzej czy później treści te tak się do siebie zbliżą, że będą oznaczane jako duplikat.

Prawidłowym, profesjonalnym rozwiązaniem, które z pewnością rozwiąże nasz problem będzie zastosowanie specjalnie przygotowanych tagów. Dzięki nim będziemy w stanie wskazać obszar, który chcemy wyłączyć z indeksowania.

Mowa tu o tagach wyłączających indeksowanie

<!--googleoff: index-->

i odpowiednio w przypadku wznawiania indeksowania

<!--googleon: index-->

Oczywiście można też dostosować je, do własnych potrzeb i chociażby kontrolować tekst, który ma być użyty do generowania fragmentów tekstu, na podstawie których mają być budowane słowa kluczowe danej strony internetowej.

Paginacja i wyszukiwarka – pomocne dla użytkownika, uciążliwe dla robota indeksującego

Często zdarza się, że wyniki uzyskiwane w wewnętrznej wyszukiwarce podlegają indeksowaniu. Obecność ich zarówno w wynikach, w listach artykułów należących do danej kategorii jak i stronie głównej nie wróży nic dobrego. Takim oto sposobem jeden artykuł, wpis czy też opis mamy powielony aż w trzech miejscach. A współczynnik zduplikowanych treści nieustannie rośnie. 

Jak więc poradzić sobie z tym problemem?

Do rozwiązania go możemy zastosować ponownie odpowiednie tagi lub plik robots.txt, w którym sprecyzujemy strony i zachowanie robotów względem ich.

Jeżeli na stronie występują duplikaty treści to niezbędne będzie wykluczenie tych stron – co na tym zyskamy, co stracimy?
Zyskamy znaczne polepszenie współczynnika oryginalności treści – kwestia oczywista. Co jednak na tym stracimy? Z punktu widzenia użytkownika – nic, z punktu widzenia Google – zniknie cała strona, na której występowała duplikacja treści.

Certyfikat SSL – dwie wersje witryny.

Na początku warto podkreślić – Certyfikat SSL nie jest niczemu winny. Duplikacja treści powstała podczas instalacji certyfikatu wynika tylko i wyłącznie z jego nieprawidłowej instalacji. 

Tak swoją drogą – jeżeli nie wiesz, jaki certyfikat powinieneś nabyć – na pewno pomoże Ci nasz artykuł o certyfikatach SSL i ich doborze.

Jak więc dochodzi do duplikacji i jak z nią sobie radzić? Tutaj warto przytoczyć zasadę funkcjonowanie strony. Funkcjonuje ona na protokołach HTTP i HTTPS – z dopiskiem “S” oczywiście w przypadku korzystania z certyfikatu SSL. Oznacza to, że witryna ta jest dostępna pod dwoma adresami.

Co oznacza to w praktyce? Oznacza to tyle, że mamy duplikat każdej jednej strony. Dosyć niefortunna sytuacja…

Jak sobie z nią poradzić? Rozwiązaniem profesjonalnym, długoterminowym będzie zastosowanie tutaj przekierowania 301 do witryny opartej o protokół https. Przekierowanie tego typu możemy zrealizować zarówno przez narzędzia udostępnione przez nasz hosting, oprogramowanie dodatkowe dla CMSa, z którego korzystamy jak i przez plik .htaccess.