Activa JavaScript para disfrutar de los vídeos de la Mediateca.
XML Conceptos - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Vamos ahora a introducir los conceptos básicos de XML.
00:00:00
Vamos a ellos.
00:00:05
Bueno, esta es una página típica de XML, en la cual la primera línea lo que contiene es
00:00:07
un identificador que nos indica que lo que viene ahora es una página XML en la versión 1.0
00:00:14
Tengo que animarles porque solo hay 1.0 y 1.1
00:00:23
y el lenguaje en que está codificado, en este caso UTF-8, ¿de acuerdo?
00:00:27
Ya veremos que hay tipos de caracteres, tipos de codificación distintas
00:00:32
que dependen de las localizaciones de países, de las máquinas, etc.
00:00:37
Bueno, la información que tenemos aquí ya vemos que está entre etiquetas.
00:00:41
Por ejemplo, entre las etiquetas países hay un país cuyo nombre es España, cuya capital es Madrid,
00:00:44
Y otro país, que es Francia, cuya capital es París.
00:00:53
Bueno, pues esta sería una forma de presentar la información.
00:00:58
Cualquiera entendería lo que significa este texto.
00:01:00
Esta misma información se puede guardar de otra manera, utilizando lo que se llaman atributos.
00:01:04
Entonces, en esta etiqueta país pondríamos como atributo nombre y el valor, en este caso España,
00:01:09
y el atributo capital y su valor, en este caso Madrid.
00:01:15
Y como esta etiqueta empieza y acaba en sí misma, no tiene información dentro, pues la acabaríamos con el símbolo barra mayor.
00:01:19
Sería otra manera de incluirlo.
00:01:28
Ambas opciones son perfectamente válidas y ya veremos en qué casos pueden ser más adecuadas unas u otras.
00:01:30
Bueno, si vemos un poco qué vocabulario vamos a emplear, pues una cuestión es que es un documento XML, que es un documento plano,
00:01:37
Es decir, un documento que no tiene formato, que se puede visualizar con cualquier programa, editor de texto del propio sistema operativo.
00:01:45
Y el procesador es XML, va a ser aquella aplicación o aquel programa que pueda leer un XML y procesarlo, entenderlo, para que se entienda claramente.
00:01:55
Los caracteres que tenemos en XML van a ser distintos según el juego o el set de caracteres que tengamos.
00:02:06
¿De acuerdo? Estos son los más habituales en nuestro entorno, en España, UTF-8, ISO-8859-1 y variantes.
00:02:13
Las marcas son simplemente esos elementos que van indicando cómo es el contenido y otra parte es el contenido.
00:02:22
Los elementos son cualquier componente lógico del documento.
00:02:31
Y las etiquetas es eso que aparece dentro de los caracteres menor y mayor, tanto para abrir como para cerrar, StartTag o EndTag, y cuando una etiqueta no tiene ninguna información dentro, solamente puede tener atributos pero no tiene más información, se habla de etiquetas vacías o AntiTag, que ya finalizan de esta manera tan curiosa.
00:02:35
Bueno, los atributos, ya hemos visto en el ejemplo anterior, están incluidos en la etiqueta de arranque, no en la etiqueta de inicio, en el start tag, y tienen este formato, con la información entre comillas.
00:02:58
Puede tener comentarios cualquier documento XML, y se indican simplemente con estos caracteres raros de aquí, un menor, una admiración, guión, guión, y finalizan con guión, guión, mayor.
00:03:15
Y la primera línea tiene que ser la declaración de lo que indica que lo que viene a partir de ahora es un XML, y típicamente es de este formato.
00:03:26
Ya vemos que también podría ser con esta codificación.
00:03:36
Así, un documento XML podría ser perfectamente este que tenemos aquí, esto que tenemos aquí.
00:03:43
Podría ser un texto XML.
00:03:49
Vemos primero que aparece la información de lo que va a venir
00:03:53
Y el juego de caracteres que es UTF-8
00:03:58
Después un comentario en el cual nos indica cómo está formado este documento
00:04:00
Una etiqueta que se abre que se llama prueba
00:04:05
Y una etiqueta que la cierra
00:04:08
Y dentro una etiqueta texto con cinco letras finalizadas en texto
00:04:09
Bueno, si este documento está guardado en UTF-8
00:04:14
Pues se mostraría en un navegador del mismo modo
00:04:19
¿De acuerdo? Sin embargo, si nosotros, por ejemplo, hubiéramos guardado esto como TF8 y declaramos que su codificación es ISO 8859-1, en ese caso, fíjense cómo aparece la información. Es horrible. Esto aparece en muchas páginas. Ocurre con los acentos, etc. ¿De acuerdo? Y eso siempre tiene que ver porque no están adecuados el formato de codificación a cómo se ha grabado. ¿De acuerdo?
00:04:22
si estuviera bien grabado en un fichero que estuviera guardado como ISO 8859-1
00:04:50
por supuesto podríamos poner esta codificación y se vería perfectamente
00:04:56
aquí vemos el caso a computar
00:05:00
con lo cual lo primero muy importante es que sepamos cómo estamos guardando cualquier información
00:05:03
¿y cómo vemos eso?
00:05:09
bueno, pues vamos a abrir un procesador de documentos
00:05:11
Vamos a abrir cualquier fichero, un fichero cualquiera que tengamos por aquí, vamos a abrir algún fichero que podamos tener por aquí, y vemos que aquí abajo, en este caso, en este procesador, en Visual Studio Code, pues tenemos que aquí está grabado como UTF-8.
00:05:18
¿De acuerdo? Entonces aquí podríamos indicarle o decirle que lo grabe de otra manera, podríamos indicar que lo grabe con otra codificación. ¿De acuerdo? A partir de que sabemos que está grabado en UTF-8, pues ya sabemos que la forma de codificarlo sería justamente esa de ahí.
00:05:37
entonces, bueno, pues es una cuestión de tener cuidado
00:05:55
aquí viene contado muy bien lo que significa esto de BOM
00:05:58
que es que haya una marca de orden de bytes y en qué afecta
00:06:02
bueno, pues sabiendo esto, ya es cuestión de tener cuidado
00:06:07
otro elemento que aparece dentro del vocabulario relativo a XML son los DTDs
00:06:11
los DTDs son los documentos que definen el tipo del propio XML
00:06:16
y este tipo de DTD nos va a decir cuáles son las etiquetas que tienen que aparecer
00:06:21
y en qué orden, qué puede estar dentro de qué y cuántas veces puede aparecer, etc.
00:06:33
Ya lo veremos más adelante.
00:06:39
El Doctype es otro elemento que nos dice cuál es la declaración del documento
00:06:41
y por ejemplo aquí estamos viendo este Doctype que equivale a un HTML
00:06:46
que tendría que estar
00:06:50
en la versión XHTML
00:06:52
1.0
00:06:54
tengo que alegrarles
00:06:55
la vida porque actualmente
00:06:58
por ejemplo para definir un documento HTML
00:07:00
simplemente escribimos
00:07:02
este trocito de aquí y un mayor
00:07:03
y todo esto de aquí no aparece
00:07:06
pero en las versiones más antiguas de HTML
00:07:08
y de XHTML eran tan largos como estos
00:07:09
también vamos a tener
00:07:12
instrucciones de procesamiento
00:07:14
en las cuales por ejemplo en este caso
00:07:15
estamos indicando que el XML
00:07:18
en el que esté escrito esto va a ser procesado
00:07:20
va a ser transformado a través de esta hoja
00:07:22
de estilo .xsl
00:07:24
vamos a tener caracteres un tanto
00:07:26
extraños
00:07:28
por ejemplo, para escribir
00:07:29
un menor que no sea
00:07:32
propio de una etiqueta, tendremos
00:07:34
que escribir este texto
00:07:36
ampersand
00:07:38
lt punto y coma
00:07:40
less than
00:07:42
para el mayor, greater than
00:07:43
para el ampersand, amp
00:07:46
para una comilla
00:07:47
apóstol y para una doble comilla
00:07:50
cuot
00:07:53
también tenemos un caso muy especial
00:07:53
que se los a las secciones
00:07:57
sedata y las secciones sedata son
00:07:58
un punto extrañas porque empiezan de esta manera
00:08:00
una manera muy rara y difícil de recordar
00:08:02
y finalizan de esta
00:08:05
y lo que quieren indicar es que dentro
00:08:06
uno puede escribir lo que quiera
00:08:08
puede escribir incluso dentro menores
00:08:10
o mayores o lo que uno quiera
00:08:12
es una forma un poco de saltarse
00:08:14
de saltarse toda la normativa
00:08:17
que aparece por allí dentro. Aquí vemos un ejemplo. Los caracteres, y para poner menor
00:08:19
pondríamos esto, y para poner ampersand pondríamos esto, no pueden escribirse. Si quisiéramos
00:08:24
escribirlos de verdad, pondríamos aquí cdata, y ahora ya escribimos esto a placer, sin tener
00:08:29
que estar pensando en lo que aparece dentro. No se recomienda su uso, pero a veces es muy
00:08:35
cómodo. Y después tenemos una cosa que son entidades, y entidades lo que se refieren
00:08:41
es a algo que ya está definido
00:08:47
entonces yo por ejemplo aquí he definido la entidad
00:08:50
yo, y esta entidad corresponde al nombre
00:08:53
Bartolomé Sintermarco
00:08:56
bueno, pues ahora cuando yo pinte autor
00:08:58
y llame a esta entidad, pues entonces
00:09:01
el resultado será el nombre correspondiente
00:09:04
esto es un poco el vocabulario que vamos a ir manejando
00:09:07
vamos a ver ahora
00:09:11
En breve, que es un documento bien formado.
00:09:14
- Idioma/s:
- Autor/es:
- Amadeo Mora
- Subido por:
- Amadeo M.
- Licencia:
- Dominio público
- Visualizaciones:
- 101
- Fecha:
- 26 de diciembre de 2020 - 18:57
- Visibilidad:
- Público
- Centro:
- IES CLARA DEL REY
- Duración:
- 09′ 19″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1364x768 píxeles
- Tamaño:
- 58.03 MBytes