HTML, Semántica Web
Jorge López
1 Comentario Como semantizar textos – Parte 1 – (Los formatos RDF)
Cada vez se hace más evidente que aportar textos enriquecidos a nuestras web trae muchas ventajas. Actualmente los robots intentar deducir un dato basándose en el contenido que lo rodea, pero con semántica seremos nosotros quien le digamos a los robots que tipo de información es. Obtendremos así búsquedas más precisas y mejoradas aumentando también la experiencia de usuario, porque las búsquedas en Yahoo y Google mejoran su apariencia con contenidos semantizados.
Actualmente la información semántica puede aparecer en la web de las siguientes formas:
- Ficheros RDF
- Meta etiquetas
- Utilizando vínculos relacionales
- Etiquetas HTML semánticas
- Microformatos
- Microdatos
Dejando de lado algunas etiquetas muy concretas HTML4 y el uso de metadatos en la cabecera de los documentos HTML, el primer paso firme para la adopción de textos enriquecidos fueron los eRDF (estándar para XHTML 1.0) y los RDFa (para XHTML1.1). Estas semánticas las explicaremos con más detalle en este artículo.
Texto enriquecido mediante RDF (Resource Description Framework)
Se trata de es un framework para metadatos recomendado por la W3C en 1999. Bajo una sintaxis XML, está pensado para dar semántica a la información y generar metadatos sobre dicha información. Esto permite que los datos puedan ser integrados y reutilizados.
RDF constituye una tecnología fundamental dentro de la Web Semántica, cuyo funcionamiento se resume en una conversión de recursos de la Web en expresiones compuestas que se estructuran en tres partes:
- Lo que se describe.
- La propiedad del recurso que se desea definir.
- El valor de la propiedad con el que se define la relación.
Ejemplo de RDF
La frase: “La semántica y la web 3.0 – Parte 1, está escrito por Jorge López en el blog círculo de maquetadores”, se representa en RDF de esta manera:
<rdf:RDF> <rdf:Description about="http://www.circulodemaquetadores.com/semantica-RDF-RDFa"> <s:Creator>Jorge López</s:Creator> <dc:title> La semántica y la web 3.0 - Parte 1</dc:title> <dc:publisher>Cículo de maquetadores</dc:publisher> </rdf:Description> </rdf:RDF>
El resto de información y gramáticas formales sobre RDF la podrás encontrar en la correspondiente especificación de la W3C.
RDFa (Resource Description Framework-in-attributes)
Se trata de extensiones específicas de XHTML 1.1, (a la espera de su implementación en HTML 5) propuestas por W3C. Este método enriquece los textos a través de los atributos y anotaciones de las etiquetas XHTML invisibles para el usuario. Se validan mediante la DTD – Document Type Definition- XHTML1.1+RDFa. Aunque todo esto parezca muy complicado, en realidad de lo que se trata de extender el manejo de los atributos “rel”, “content” y “property“.
Para estandarizar su uso utilizaremos diccionarios predefinidos como Dublin Core. Para indicar en RDFa que estamos utilizando un diccionario, lo haremos de la siguiente manera:
<body>
<div class="articulo">
<h2> Como semantizar textos - Parte 1 </h2>
<p>Texto del artículo.</p>
<p>Autor: <span property="dc:author" content="Jorge lópez"> Jorge lópez </span></p>
<p>Fecha: <span property="dc:date" content="2011-12-14">14 de diciembre de 2011</span></p>
</div>
</body>
En el diccionario Dublin Core vienen especificados los términos author y date. Para buscar otros términos solo tendremos que buscarlos en el diccionario.
Como vemos la ventaja de RDFa es que sus reglas son genéricas, lo que facilitará la labor de muchos autores. Las páginas que no contienen RDFa se visualizan igual que las que tienen, ya que de lo que se trata es de aportar riqueza semántica a la información, no de cambiar ni el contenido ni de la disposición de los elementos.
Nuevamente, la mejor manera de completar la información sobre RDFa es hacer referencia al borrador de trabajo sobre RDFa de la W3C. El blog para webmasters de google también recomienda utilizar marcado RDFa para mejorar los resultados y además proporciona algunos ejemplos.
eRDF (Embedded RDF)
El formato eRDF fue creado en 2005 por Ian Davis inspirado por los microformatos. Se trata de una sintaxis para extraer la información del documento ya sea por medio de un Parser o una Hoja de estilos XSLT. eRDF solo está parcialmente apoyado por la W3C.
Para que un documento HTML le sea reconocido la existencia de eRDF se debe declarar la adhesión a un perfil especial. Esto se logra sumando el atributo profile en el head del documento:
<head profile="http://purl.org/NET/erdf/profile">
Toda la información sobre eRDF en el blog de Ian Davis.
Información Bitacoras.com…
Valora en Bitacoras.com: Cada vez se hace más evidente que aportar textos enriquecidos a nuestras web trae muchas ventajas. Actualmente los robots intentar deducir un dato basándose en el contenido que lo rodea, pero con semántica seremos nosotros……