Robots Meta Tag
Znacznik w head, który steruje indeksowaniem strony i zachowaniem robotów wyszukiwarek.
Robots Meta Tag
Definicja
Robots Meta Tag to znacznik HTML implementowany w sekcji <head> dokumentu, umożliwiający sterowanie indeksacją na poziomie pojedynczego adresu URL (page-level). Pozwala na precyzyjne instruowanie robotów wyszukiwarek (crawlers), czy dana strona ma zostać dodana do indeksu oraz w jaki sposób mają być traktowane linki wychodzące.
Kluczowe wartości (Dyrektywy)
- index – Wartość domyślna. Zezwala na dodanie strony do indeksu wyszukiwarki.
- noindex – Blokuje indeksowanie strony. URL nie pojawi się w wynikach wyszukiwania (SERP), mimo że robot może go odwiedzić.
- follow – Zezwala robotom na podążanie za linkami znajdującymi się na stronie i przekazywanie im autorytetu (link equity/PageRank).
- nofollow – Instruuje roboty, aby nie podążały za linkami na stronie i nie przekazywały im wartości SEO.
- noarchive – Zapobiega wyświetlaniu linku do wersji "Kopia" (Cached) w wynikach wyszukiwania.
Różnica: Robots Meta Tag vs. robots.txt
Zrozumienie różnicy między tymi mechanizmami jest krytyczne dla technicznego SEO:
- robots.txt: Steruje dostępem (crawlingiem). Służy głównie do zarządzania budżetem indeksowania (Crawl Budget). Nie gwarantuje usunięcia strony z indeksu (URL może zostać zaindeksowany na podstawie linków zewnętrznych).
- Robots Meta Tag: Steruje indeksacją. Jest twardą dyrektywą nakazującą usunięcie lub niedodawanie treści do indeksu.
Uwaga krytyczna: Aby dyrektywa noindex w Robots Meta Tag została odczytana i zastosowana przez robota Google, strona nie może być zablokowana w pliku robots.txt. Blokada w robots.txt uniemożliwia robotowi pobranie strony, a tym samym odczytanie meta tagu, co może skutkować zaindeksowaniem adresu URL bez zawartości.
Zastosowanie
- Strony techniczne: Panele logowania, strony resetowania hasła, koszyki zakupowe, środowiska testowe (staging).
- Wewnętrzne wyniki wyszukiwania: Zapobieganie indeksowaniu dynamicznie generowanych stron o niskiej wartości (thin content), co mogłoby prowadzić do zjawiska "spider trap".
- Duplikacja treści: Strony z parametrami sortowania/filtrowania, wersje do druku lub inne duplikaty, w przypadkach gdy
rel="canonical"jest niewystarczający. - Landing Pages PPC: Strony dedykowane kampaniom płatnym, które nie powinny być widoczne w ruchu organicznym.
Przykładowy Kod HTML
Implementacja w sekcji <head> dla strony, która nie ma być w indeksie, ale ma przekazywać moc linkom:
<meta name="robots" content="noindex, follow" />
Twoje strony "noindex" nadal są w wynikach wyszukiwania Google?
📞 Zadzwoń: +48 602 131 233