Duplicate Content (DC) - o co właściwie chodzi
Zacznijmy od początku, a więc od problemu Duplicate Content w internecie. DC to nic innego jak nieunikalna, skopiowana, powielona treść. Na zjawisko to baczną uwagę zwraca wyszukiwarka Google, która publicznie "walczy" z duplikowaniem artykułów. W jaki sposób? Poprzez nie indeskowanie stron, na których takie artykuły się pojawiły.
Google nie działa jednak idealnie, przez co w wyszukiwarce można znaleźć tę samą treść na wielu różnych stronach. Jak w takiej sytuacji stworzyć ranking i pokazać wyniki wyszukiwania? Zwykle Google wyświetla najwyżej tę stronę, na której treść pojawiła się jako pierwsza. Względnie wyświetla "najsilniejszą" stronę, która prawdopodobnie jest pierwotnym miejscem umieszczenia artykułu.
Artykuły do przedruku a DC
Jeżeli mamy do czynienia z artykułami do przedruku, problem Duplicate Content może być bardzo istotny. Wykorzystywanie cudzych artykułów na własnych stronach ma bowiem swoje konsekwencje. Żeby było jasne: nie są to konsekwencje prawne (bo przedrukowywanie artykułów jest całkowicie legalne - ich autorzy godzą się na to).
Korzystając z przedruku artykułów należy natomiast zdać sobie sprawę, że "zapożyczona" treść nie wygeneruje raczej dużej ilości wejść z wyszukiwarki na naszą stronę. Powód jest oczywisty: Google potraktuje skopiowane artykuły jako Duplicate Content i umieści je daleko w wynikach wyszukiwania lub... w ogóle ich nie zaindeksuje.
Co więcej, nagminnie korzystając z artykułów do przedruku, ryzykujemy nałożenie filtra lub nawet bana na naszą stronę! Witryna z dużą ilością nieunikalnych artykułów może być bowiem uznana przez wyszukiwarkę jako witryna spamerska! A ze spamem, jak wiadomo, Google walczy od dawna.
Wnioski? Z przedrukowywaniem artykułów lepiej uważać. Skopiowanie kilku ciekawych artykułów do katastrofy nie doprowadzi, ale setki takich artykułów mogą być poważnym źródłem kłopotów.