📞 Zadzwoń teraz

Robots Meta Tag

Znacznik w head, który steruje indeksowaniem strony i zachowaniem robotów wyszukiwarek.

Robots Meta Tag

Definicja

Robots Meta Tag to znacznik HTML implementowany w sekcji <head> dokumentu, umożliwiający sterowanie indeksacją na poziomie pojedynczego adresu URL (page-level). Pozwala na precyzyjne instruowanie robotów wyszukiwarek (crawlers), czy dana strona ma zostać dodana do indeksu oraz w jaki sposób mają być traktowane linki wychodzące.

Kluczowe wartości (Dyrektywy)

  • index – Wartość domyślna. Zezwala na dodanie strony do indeksu wyszukiwarki.
  • noindex – Blokuje indeksowanie strony. URL nie pojawi się w wynikach wyszukiwania (SERP), mimo że robot może go odwiedzić.
  • follow – Zezwala robotom na podążanie za linkami znajdującymi się na stronie i przekazywanie im autorytetu (link equity/PageRank).
  • nofollow – Instruuje roboty, aby nie podążały za linkami na stronie i nie przekazywały im wartości SEO.
  • noarchive – Zapobiega wyświetlaniu linku do wersji "Kopia" (Cached) w wynikach wyszukiwania.

Różnica: Robots Meta Tag vs. robots.txt

Zrozumienie różnicy między tymi mechanizmami jest krytyczne dla technicznego SEO:

  • robots.txt: Steruje dostępem (crawlingiem). Służy głównie do zarządzania budżetem indeksowania (Crawl Budget). Nie gwarantuje usunięcia strony z indeksu (URL może zostać zaindeksowany na podstawie linków zewnętrznych).
  • Robots Meta Tag: Steruje indeksacją. Jest twardą dyrektywą nakazującą usunięcie lub niedodawanie treści do indeksu.

Uwaga krytyczna: Aby dyrektywa noindex w Robots Meta Tag została odczytana i zastosowana przez robota Google, strona nie może być zablokowana w pliku robots.txt. Blokada w robots.txt uniemożliwia robotowi pobranie strony, a tym samym odczytanie meta tagu, co może skutkować zaindeksowaniem adresu URL bez zawartości.

Zastosowanie

  • Strony techniczne: Panele logowania, strony resetowania hasła, koszyki zakupowe, środowiska testowe (staging).
  • Wewnętrzne wyniki wyszukiwania: Zapobieganie indeksowaniu dynamicznie generowanych stron o niskiej wartości (thin content), co mogłoby prowadzić do zjawiska "spider trap".
  • Duplikacja treści: Strony z parametrami sortowania/filtrowania, wersje do druku lub inne duplikaty, w przypadkach gdy rel="canonical" jest niewystarczający.
  • Landing Pages PPC: Strony dedykowane kampaniom płatnym, które nie powinny być widoczne w ruchu organicznym.

Przykładowy Kod HTML

Implementacja w sekcji <head> dla strony, która nie ma być w indeksie, ale ma przekazywać moc linkom:

<meta name="robots" content="noindex, follow" />

Twoje strony "noindex" nadal są w wynikach wyszukiwania Google?

📞 Zadzwoń: +48 602 131 233
🚀 Load Time: ... 📄 DOM Elements: ... ⚡ Requests: ...