Přehled tagů META
Tagy META nejsou součástí normy HTML. Díky tomu obvykle nebývají
v učebnicích HTML probírány a mohlo by se zdát, že nejsou tak
důležité. Význam některých z nich opravdu není tak veliký, ale
bez jiných bychom se obešli jen obtížně. Podívejme se nyní na ty
nejdůležitější a nejčastější a řekněme si, jak je používat.
Hned na začátku si zapamatujte, že tagy META patří do hlavičky
HTML dokumentu, tedy tam, kam se umísťuje také prvek TITLE,
definice kaskádujících stylů (prvek STYLE) a některé skripty
(prvek SCRIPT). Dále je dobré vědět, že na pořadí, ve kterém jsou
tagy META uvedeny, jak vůči sobě navzájem, tak vůči dalším prvkům
v hlavičce dokumentu, nezáleží. Vzorová hlavička tedy může
vypadat např. takto:
<head>
<title>TUTORIALY PRO WEBMASTER </title>
<meta http-equiv=“Content-Type“ content=“text/html; charset=
windows-1250″>
<meta name=“keywords“ content=“html, css, tvorba www“>
<meta name=“description“ content=“Ezin pro webmastery“>
<meta name=“copyright“ content=“BENNI“>
<link rel=“stylesheet“ type=“text/css“ href=“./style.css“>
</head>
První tag určuje typ obsahu a jeho kódování a zejména u českých
stránek by rozhodně neměl chybět. Kromě zde uvedeného
charset=windows-1250, což je kódování českých znaků na platformě
MS-Windows, se často používá ještě charset=ISO-8859-2,
reprezentující kódování českých znaků dle normy ISO. Pokud
tvoříte stránky i v angličtině, nebo některém jiném
západoevropském jazyce, použijte charset=windows-1252, nebo
charset=iso-8859-1.
Tag „keywords“ definuje klíčová slova pro fulltextové vyhledávací
služby. Obecně platí, že vyhledávač zde uvedená slova v
souvislosti se stránkou zaindexuje, tj. zahrne do své databáze.
Bude-li pak někdo některé ze slov hledat, měl by se dostat i k
vaší stránce. Ve skutečnosti to sice zdaleka není tak jednoduché,
přesto se ale vyplatí na každé stránce hlavní klíčová slova,
která se na ní vyskytují, do tohoto tagu uvést.
Dalším tagem je „description„. Ten určuje popis stránky, který
zobrazují některé fulltextové vyhledávací služby. Pokud ho
neuvedete, objeví se ve výsledku hledání blíže nedefinovaný úryvek (zpravidla začátek) vaší stránky. Tag „description“ však
zdaleka nepoužívají všechny vyhledávače. Z českých ho používá
např. Atlas.
Význam posledního uvedeného tagu „copyright“ je asi jasný. Říká, kdo je
držitelem autorských práv k dokumentu. Obdobně lze použít i tag:
<meta name=“author“ content=“Marek Prokop“>
určující autora. Praktický význam obou posledních tagů je však
celkem zanedbatelný.
To ovšem zdaleka nejsou všechny tagy META. Existuje jich opravdu
mnoho. Zde si uvedeme ještě několik nejčastějších:
<meta name=“generator“ content=“…“>
Tento tag obvykle automaticky vkládají různé generátory HTML kódu
a vizuální HTML editory. Praktický význam nemá žádný.
<meta name=“rating“ content=“…“>
Určuje RSACi či PICS rating, který se používá pro ochranu dětí
před nevhodným obsahem (např. pornografií).
<meta name=“robots“ content=“…“>
<meta name=“resource-type“ content=“document“>
Další dva tagy určené vyhledávacím službám. První udává, co mají
indexovací roboti vyhledávacích služeb se stránkou provést. Pro
atribut content jsou zde tyto možnosti:
ALL – indexovat danou stránku i další stránky na které odkazuje
INDEX – indexovat danou stránku
NOINDEX – neindexovat danou stránku
NOFOLLOW – neprocházet odkazy vedoucí ze stránky
Druhý tag říká, že se jedná o dokument a dle některých zdrojů
určité vyhledávací služby podmiňují indexování stránky jeho
přítomností.
<meta http-equiv=“content-language“ content=“en-us“>
I tento tag slouží hlavně vyhledávacím strojům a umožňuje jim
určit jazyk stránky. Pro češtinu se používá zápis „cs„
<meta http-equiv=“expires“ content=“mon, 01 Dec 1997 01:00:00
GMT“>
Udává platnost stránky. V atributu content je tedy datum a čas,
kdy platnost stránky vyprší, a od kterého by měl prohlížeč načíst čerstvou stránku ze serveru, místo její kopie v keši. Obdobnou
funkci má tag
<meta http-equiv=“pragma“ content=“no-cache“>
který říká prohlížeči, že stránka by se do keše neměla vůbec
ukládat. Oba tyto tagy jsou tedy vhodné zejména pro dynamické
stránky, které často mění svůj obsah.
Tipy pro stavbu webů respektujících keše
Kromě používání validace a informací o čerstvosti existuje ještě mnoho dalších věcí, které můžete udělat pro svůj web, aby lépe respektoval keše.
- Používejte adresy URL jednotně – toto je zlaté pravidlo kešování. Ať už poskytujete tentýž obsah na více stránkách, jiným uživatelům nebo z různých webů, vždy by mělo jít o stejné URL. To je nejsnazší a nejefektivnější způsob, jak udělat váš web přátelský vůči keším. Například pokud použijete jako odkaz v HTML adresu /index.html, používejte tutéž adresu vždy.
- Používejte společnou knihovnu obrázků a jiných prvků; natahujte stejné objekty z různých stránek.
- Přinuťte keše ukládat obrázky a stránky, které se mění jen zřídka. Nastavte jim hlavičku Expires na hodně vzdálený čas.
- Přinuťte keše rozpoznat pravidelně aktualizované stránky nastavením přesného času vypršení čerstvosti.
- Jestliže se zdroj (zejména stahovatelný soubor) změní, změňte jeho jméno. Tímto způsobem ho předtím můžete nastavit jako platný do daleké budoucnosti, ale stále garantovat, ze je poskytována správná verze. Stránka, která na ten objekt odkazuje, je to jediné, co by mělo mít krátký čas pro vypršení.
- Neměňte soubory zbytečně. Jestliže to uděláte, všechno bude mít matoucí mladé datum poslední změny (Last-Modified). Například když aktualizujete váš web, nekopírujte celý obsah vlastního webu, pouze nahrajte na server soubory, které se opravdu změnily.
- Používejte cookies jenom tam, kde jsou nezbytné – cookies se špatně kešují a ve většině situací nejsou nutné. Jestliže musíte použít cookie, omezte její použití na dynamické stránky.
- Minimalizujte použití SSL – protože šifrované stránky nejsou ukládány sdílenými kešemi, používejte je jen když musíte. Také na SSL stránkách velmi šetřete obrázky.
<meta http-equiv=“refresh“ content=“3; url=určení url“>
Poslední tag z našeho přehledu říká, že po 3 sekundách se má
stránka znovu načíst ze zadaného URL. Tím lze docílit jednak
opakovaného načítání téže stránky v zadaném časovém intervalu
(používá se u některých dynamických stránek) a jednak
přesměrování na jinou adresu.