Media bez wyboru a indeksacja serwisów biorących udział w proteście
Artykuły12 lutego 2021
Media bez wyboru to jednodniowa akcja mediów w Polsce, która zorganizowana została w ramach protestu przeciw zapowiadanemu przez rząd projektowi wprowadzenia podatku od reklam.
W jednodniowej akcji, która miejsce miała 10 lutego 2021 roku w całym kraju, udział wzięło wiele ze znanych nam stacji telewizyjnych, radiowych oraz serwisów i portali internetowych jak onet.pl, wp.pl, interia.pl, canalplus.com i wiele więcej innych stron.
Z uwagi na to, że większość ze stron, które brały udział w proteście, całkowicie wyłączało lub blokowało dla użytkowników dostęp do swoich treści, przykuło to uwagę seowców. Mam tutaj na myśli przede wszystkim rozwiązania technologiczne, które wykorzystane zostały do ograniczenia dostępu do podstron danego serwisu w tym dniu i wypływ tych rozwiązań na ich widoczność.
Jak wyglądał protest?
Zdaje się, iż głównym założeniem akcji było zablokowanie dostępu do wszystkich treści od TV i radio aż po Internet.
Strony www, w większości przypadków zamiast treści pokazywały jednolity komunikat wraz z listem otwartym do władz. Zdarzały się jednak wyjątki, niektóre z serwisów ograniczyły się do blokady tylko strony głównej, inne do wyświetlania przyklejonego newsa, a jeszcze inne wyskakującego popup'a.
W większości przypadków, mieliśmy jednak do czynienia z całkowitą blokadą serwisu i jego treści na rzecz wyświetlania komunikatu. Jak później się okazało, co serwis (a nawet grupa serwisów), to inna metoda wdrożenia blokowania treści. Sytuacja ta świetnie obrazuje, że w SEO każdy specjalista ma nieco odmienne zdanie :).
Serwisy biorące udział w proteście, oprócz samego wyświetlenia komunikatu w jakiś sposób musiały zablokować treści dla użytkowników - w sposób szybki do wdrożenia i zdjęcia. Z uwagi na to, w większości przypadków zdecydowane się również na modyfikację kodu odpowiedzi serwera HTTP lub wdrożenia globalnych przekierowań.
Status odpowiedzi serwera danego URL sprawdzić możecie w wielu popularnych wtyczkach czy narzędziach jak https://www.webconfs.com/http-header-check.php. Poszczególne typy odpowiedzi serwera sprawdzicie natomiast w Wikipedii: https://pl.wikipedia.org/wiki/Kod_odpowiedzi_HTTP
Jak treści blokowały poszczególne serwisy?
Jak już wspominałem, mieliśmy wiele różnych rozwiązań tej sytuacji. Na grupach SEO spekuluje się o wpływie poszczególnych rozwiązań i decyzji na widoczność poszczególnych domen. Aby to ocenić przyjdzie nam jeszcze trochę poczekać. W mojej ocenie z uwagi na jednodniowy okres trwania protestu, algorytm raczej nie zareaguje na to w jakiś drastyczny sposób, a uzna to raczej za "chwilowe nieporozumienie" :).
Poniżej prezentuję najpopularniejsze i najczęstsze rozwiązania i wdrożenia blokad treści wraz z krótkim komentarzem.
Przekierowanie 302 na zmodyfikowaną stronę główną
Metoda zastosowana np. przez interia.pl - wszystkie adresy URL przerzucały użytkowników na stronę główną serwisu z komunikatem. Do strony głównej interia przekierowywały również inne domeny tej grupy.
kod | opis słowny | znaczenie/zwrócony zasób |
---|---|---|
302 | Found | Znaleziono – żądany zasób jest chwilowo dostępny pod innym adresem, a przyszłe odwołania do zasobu powinny być kierowane pod adres pierwotny. [Wikipedia] |
Ze względu na to, że przekierowanie 302 jest przekierowaniem tymczasowym, w mojej ocenie jest to bezpieczne rozwiązanie. Jednodniowe masowe przekierowanie nie powinno mieć tutaj żadnego wpływu na sytuację SEO.
Kod 200 i nakładka treści
Rozwiązanie w postaci zwrócenie kodu 200 oraz nakładki przykrywającej treść danego adresu URL, było jednym z popularniejszych sposobów na blokowaniu treści serwisów.
kod | opis słowny | znaczenie/zwrócony zasób |
---|---|---|
200 | OK | Zawartość żądanego dokumentu (najczęściej zwracany nagłówek odpowiedzi w komunikacji WWW Internetu) [Wikipedia] |
Potencjalnie jest to najmniej inwazyjna metoda, gdyż adresy URL nadal są możliwe do pobierania, a wszystkie treści dostępne w kodzie źródłowym serwisu dla robotów indeksujących. Jedynym problemem jest tutaj duplikat treści wyświetlany w komunikacie oraz możliwość podszycia się pod Google bota w celu dostępu do treści.
Zdarzało się jednak, że niektóre z serwisów zwracały kod 200, ale wycinały treść, a w kodzie widniał tylko kod komunikatu. W tym wypadku jest to nieco mniej optymalne.
Status 500 / 503 i komunikat
Niektóre z domen zdecydowały się na wyświetlenie komunikatu o proteście i zwróceniu kodu 500 lub 503.
kod | opis słowny | znaczenie/zwrócony zasób |
---|---|---|
500 | Internal Server Error | Wewnętrzny błąd serwera – serwer napotkał niespodziewane trudności, które uniemożliwiły zrealizowanie żądania. [Wikipedia] |
503 | Service Unavailable | Usługa niedostępna – serwer nie jest w stanie w danej chwili zrealizować zapytania klienta ze względu na przeciążenie |
W założeniu kod 500 wskazuje na wewnętrzny błąd serwera, który w sumie w sieci spotykamy dość często, np. w wyniku błędnych przekierowań. Nieco bardziej optymalny zdaje się być kod 503, który wskazuje na tymczasowe problemy.
Statusy 404 i komunikat protestu lub komunikat 404
Dla niektórych z domen, zdecydowano się na zwrócenie kodu 404 i wyświetlenie informacji o proteście, bądź po prostu informacji "404 not found".
kod | opis słowny | znaczenie/zwrócony zasób |
---|---|---|
404 | Not Found |
Nie znaleziono – serwer nie odnalazł zasobu według podanego URL ani niczego co by wskazywało na istnienie takiego zasobu w przeszłości. [Wikipedia]
|
Rozwiązanie mało optymalne, ponieważ może prowadzić do usunięcia części podstron z indeksu. Podejrzewam jednak, że ze względu na historię i wielkość domen, jeden dzień z 404 nie spowoduje usunięcia URLi z indeksu, a nawet jeśli to szybciutko tam wrócą.
Jaka jest rekomendowana metoda dla tego typu sytuacji?
W wątku na Facebooku, który dotyczy tzw. "blackout'u" stron, wyczytać można, że przy okazji takich sytuacji w przeszłości rekomendowane było wykorzystywanie status 503. Czyli zwrócenie, informacji o niedostępności serwera w odpowiedzi serwera HTTP oraz zaprezentowanie właściwej treści użytkownikowi.
kod | opis słowny | znaczenie/zwrócony zasób |
---|---|---|
503 | Service Unavailable | Usługa niedostępna – serwer nie jest w stanie w danej chwili zrealizować zapytania klienta ze względu na przeciążenie. [Wikipedia] |
Powyższe rozwiązanie w mojej ocenie wydaje się być słuszne i prawidłowe w przypadku jednodniowej blokady. Myślę, że równie poprawnie sprawdziłoby się przekierowania 302 ze wszystkich podstron serwisu do strony głównej.
Z uwagi na to, iż protest trwał jeden dzień, oba rozwiązania nie powinny wyrządzić jakichkolwiek szkód stronom www (tym bardziej tak dużym serwisom), które z całą pewnością cieszą się odpowiednią mocą w ocenie algorytmów Google.
Gdybym ja sam miał wdrażać tego typu rozwiązanie w serwisie, najpewniej zdecydowałbym się właśnie na sposób z kodem 503 i odpowiednim komunikatem lub kombinowałbym z wyświetleniem nakładki przykrywającej całą treść.