Utilització de llenguatges de marques en entorns web
Introducció
A pesar que es pot representar la informació fent servir XML i CSS, el més habitual sol ser representar-la en algun tipus de llenguatge de marques que estigui pensat per a la representació. El llenguatge de marques per excel·lència a l’hora de presentar la informació és l’HTML (hypertext markup language).
L’HTML va sorgir durant el 1989 quan Tim Berners-Lee va proposar un sistema d’hipertext per compartir documents científics per mitjà d’Internet perquè poguessin ser visualitzats des de diferents sistemes.
L’HTML és un llenguatge de marques que permet publicar informació molt diversa pensant en l’estructura dels documents i en com es representaran les dades que contenen. Ha tingut tant d’èxit que pràcticament s’ha convertit en una forma de comunicació universal.
L’HTML és una recomanació del W3C. El gran èxit que ha tingut ha provocat que n’hagin sortit diverses versions al llarg dels anys per intentar adaptar-se a les noves demandes dels usuaris.
HTML5
Des de la publicació de l’HTML 4.01 (1999), l’activitat de millora de l’HTML es van aturar perquè el W3C es va centrar en l’XHTML, ja que la intenció era que l’XHTML substituís completament l’HTML.
Com a resposta a la lentitud en els canvis en l’HTML, una sèrie d’empreses pel seu compte (Mozilla, Apple i Opera) van crear el WHATWG (Web Hypertext Application Technology Working Group), que es va centrar en crear l’HTML5. Des del 2007 el W3C torna a definir les recomanacions d’HTML.
L’objectiu fonamental de l’HTML5 és suportar les darreres tecnologies multimèdia mentre es manté el llenguatge de marques fàcil de llegir per als humans i fàcil d’entendre per als programes i dispositius. En podeu trobar més informació en els enllaços següents:
- www.w3.org/TR/html5
- whatwg.org/html
HTML
L’HTML està pensat per definir l’estructura d’un document de text a partir d’una sèrie d’etiquetes predefinides formades per un nom envoltat dels símbols <
i >
. Cada una de les etiquetes servirà per definir l’estructura d’un document a part d’aportar-li informació semàntica sobre el contingut respecte al document.
En les primeres versions, algunes de les etiquetes i propietats estaven pensades també per marcar quina seria la manera en què es representaria la informació, però actualment s’ha eliminat de l’estàndard.
Actualment la creació d’una pàgina web consistirà a definir l’estructura del document per mitjà d’HTML i definir-ne el format per mitjà dels fulls d’estil CSS.
La separació de la informació de l’estructura de les dades és un dels components clau per donar dinamisme a les pàgines web.
Definició de l’estructura d’un document
Si s’analitza un document de text a grans trets podem veure que té una estructura definida. Primer hi sol haver títols, text repartit en paràgrafs, imatges….
Aquestes parts són fàcils de detectar per una persona però no és igual de senzill que un programa ho puga fer. L’HTML intenta definir l’estructura d’un document de manera que siga senzill per a un programa interpretar què són cada una de les dades que va trobant. Per fer-ho fa servir tota una sèrie d’etiquetes que indicaran quin és el paper que tenen cada una de les dades en el document.
S’han definit etiquetes per marcar cada una de les seccions en què podem definir un document.
Esquema bàsic d’un document HTML
Els documents HTML només tenen una arrel, que serà l’element <html>
. Aquesta etiqueta es fa servir per informar a qui llija el document que el contingut del document és un fitxer HTML.
L’arrel només pot tenir dos elements fills:
<head>
: és el lloc en el qual es pot posar informació sobre el document HTML (metadades). El títol, el creador, l’idioma, el full d’estil, etc. Molta d’aquesta informació no es visualitzarà en el navegador. En la capçalera hi ha un element obligatori,<title>
, en el qual s’especificarà el nom del document.<body>
: conté el contingut i l’estructura del document. Són les parts que es “veuen” en visualitzar el document HTML.
Declaració DOCTYPE
Segons els estàndards HTML cada document necessita una declaració del tipus de document, que ha de sortir abans de l’element <html>. Encara que no és estrictament necessari, és molt recomanable.
Amb l’etiqueta DOCTYPE
es defineix quin és el vocabulari real que es fa servir en el document i quin és el tipus d’estàndard que es fa servir, i es dóna informació al possible validador sobre quina versió ha de fer servir per comprovar la sintaxi del document.
Per a la versió 4.01 es van crear diferents conjunts de regles en funció d’una sèrie d’objectius. L’objectiu era que tothom fes servir la versió strict, però per criteris de compatibilitat es van definir altres versions.
HTML 4.01
Strict: no permet informació presentacional ni els elements declarats “per eliminar”. Tampoc no permet fer servir marcs.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Transitional: permet elements i atributs que ja no es recomanen. Està pensat per compatibilitat respecte a versions anteriors. No es permeten marcs.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
Frameset: és idèntic al transitional però accepta marcs
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
"http://www.w3.org/TR/html4/frameset.dtd">
XHTML també ha definit els seus DTD i a més la seva especificació defineix que s’han d’especificar obligatòriament:
XHTML 1.0 strict
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
XHTML 1.0 transitional
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
XHTML 1.0 frameset
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
En XHTML 1.1 això ja no es va fer d’aquesta manera i només hi ha una sola definició DOCTYPE
per a tots els documents. XHTML 1.1 és igual que la versió 1.0 strict però hi afegeix suport per a mòduls.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"
"http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
HTML 5.0
En HTML 5.0 la declaració de tipus es simplifica sent:
<!DOCTYPE html>
Esquelet bàsic
Per tant, si escollim fer servir XHTML 1.1, l’esquelet bàsic d’un document XHTML serà com aquest:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"
"http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Títol</title>
</head>
<body>
</body>
</html>