Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

XML Conceptos - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 26 de diciembre de 2020 por Amadeo M.

101 visualizaciones

Descargar la transcripción

Vamos ahora a introducir los conceptos básicos de XML. 00:00:00
Vamos a ellos. 00:00:05
Bueno, esta es una página típica de XML, en la cual la primera línea lo que contiene es 00:00:07
un identificador que nos indica que lo que viene ahora es una página XML en la versión 1.0 00:00:14
Tengo que animarles porque solo hay 1.0 y 1.1 00:00:23
y el lenguaje en que está codificado, en este caso UTF-8, ¿de acuerdo? 00:00:27
Ya veremos que hay tipos de caracteres, tipos de codificación distintas 00:00:32
que dependen de las localizaciones de países, de las máquinas, etc. 00:00:37
Bueno, la información que tenemos aquí ya vemos que está entre etiquetas. 00:00:41
Por ejemplo, entre las etiquetas países hay un país cuyo nombre es España, cuya capital es Madrid, 00:00:44
Y otro país, que es Francia, cuya capital es París. 00:00:53
Bueno, pues esta sería una forma de presentar la información. 00:00:58
Cualquiera entendería lo que significa este texto. 00:01:00
Esta misma información se puede guardar de otra manera, utilizando lo que se llaman atributos. 00:01:04
Entonces, en esta etiqueta país pondríamos como atributo nombre y el valor, en este caso España, 00:01:09
y el atributo capital y su valor, en este caso Madrid. 00:01:15
Y como esta etiqueta empieza y acaba en sí misma, no tiene información dentro, pues la acabaríamos con el símbolo barra mayor. 00:01:19
Sería otra manera de incluirlo. 00:01:28
Ambas opciones son perfectamente válidas y ya veremos en qué casos pueden ser más adecuadas unas u otras. 00:01:30
Bueno, si vemos un poco qué vocabulario vamos a emplear, pues una cuestión es que es un documento XML, que es un documento plano, 00:01:37
Es decir, un documento que no tiene formato, que se puede visualizar con cualquier programa, editor de texto del propio sistema operativo. 00:01:45
Y el procesador es XML, va a ser aquella aplicación o aquel programa que pueda leer un XML y procesarlo, entenderlo, para que se entienda claramente. 00:01:55
Los caracteres que tenemos en XML van a ser distintos según el juego o el set de caracteres que tengamos. 00:02:06
¿De acuerdo? Estos son los más habituales en nuestro entorno, en España, UTF-8, ISO-8859-1 y variantes. 00:02:13
Las marcas son simplemente esos elementos que van indicando cómo es el contenido y otra parte es el contenido. 00:02:22
Los elementos son cualquier componente lógico del documento. 00:02:31
Y las etiquetas es eso que aparece dentro de los caracteres menor y mayor, tanto para abrir como para cerrar, StartTag o EndTag, y cuando una etiqueta no tiene ninguna información dentro, solamente puede tener atributos pero no tiene más información, se habla de etiquetas vacías o AntiTag, que ya finalizan de esta manera tan curiosa. 00:02:35
Bueno, los atributos, ya hemos visto en el ejemplo anterior, están incluidos en la etiqueta de arranque, no en la etiqueta de inicio, en el start tag, y tienen este formato, con la información entre comillas. 00:02:58
Puede tener comentarios cualquier documento XML, y se indican simplemente con estos caracteres raros de aquí, un menor, una admiración, guión, guión, y finalizan con guión, guión, mayor. 00:03:15
Y la primera línea tiene que ser la declaración de lo que indica que lo que viene a partir de ahora es un XML, y típicamente es de este formato. 00:03:26
Ya vemos que también podría ser con esta codificación. 00:03:36
Así, un documento XML podría ser perfectamente este que tenemos aquí, esto que tenemos aquí. 00:03:43
Podría ser un texto XML. 00:03:49
Vemos primero que aparece la información de lo que va a venir 00:03:53
Y el juego de caracteres que es UTF-8 00:03:58
Después un comentario en el cual nos indica cómo está formado este documento 00:04:00
Una etiqueta que se abre que se llama prueba 00:04:05
Y una etiqueta que la cierra 00:04:08
Y dentro una etiqueta texto con cinco letras finalizadas en texto 00:04:09
Bueno, si este documento está guardado en UTF-8 00:04:14
Pues se mostraría en un navegador del mismo modo 00:04:19
¿De acuerdo? Sin embargo, si nosotros, por ejemplo, hubiéramos guardado esto como TF8 y declaramos que su codificación es ISO 8859-1, en ese caso, fíjense cómo aparece la información. Es horrible. Esto aparece en muchas páginas. Ocurre con los acentos, etc. ¿De acuerdo? Y eso siempre tiene que ver porque no están adecuados el formato de codificación a cómo se ha grabado. ¿De acuerdo? 00:04:22
si estuviera bien grabado en un fichero que estuviera guardado como ISO 8859-1 00:04:50
por supuesto podríamos poner esta codificación y se vería perfectamente 00:04:56
aquí vemos el caso a computar 00:05:00
con lo cual lo primero muy importante es que sepamos cómo estamos guardando cualquier información 00:05:03
¿y cómo vemos eso? 00:05:09
bueno, pues vamos a abrir un procesador de documentos 00:05:11
Vamos a abrir cualquier fichero, un fichero cualquiera que tengamos por aquí, vamos a abrir algún fichero que podamos tener por aquí, y vemos que aquí abajo, en este caso, en este procesador, en Visual Studio Code, pues tenemos que aquí está grabado como UTF-8. 00:05:18
¿De acuerdo? Entonces aquí podríamos indicarle o decirle que lo grabe de otra manera, podríamos indicar que lo grabe con otra codificación. ¿De acuerdo? A partir de que sabemos que está grabado en UTF-8, pues ya sabemos que la forma de codificarlo sería justamente esa de ahí. 00:05:37
entonces, bueno, pues es una cuestión de tener cuidado 00:05:55
aquí viene contado muy bien lo que significa esto de BOM 00:05:58
que es que haya una marca de orden de bytes y en qué afecta 00:06:02
bueno, pues sabiendo esto, ya es cuestión de tener cuidado 00:06:07
otro elemento que aparece dentro del vocabulario relativo a XML son los DTDs 00:06:11
los DTDs son los documentos que definen el tipo del propio XML 00:06:16
y este tipo de DTD nos va a decir cuáles son las etiquetas que tienen que aparecer 00:06:21
y en qué orden, qué puede estar dentro de qué y cuántas veces puede aparecer, etc. 00:06:33
Ya lo veremos más adelante. 00:06:39
El Doctype es otro elemento que nos dice cuál es la declaración del documento 00:06:41
y por ejemplo aquí estamos viendo este Doctype que equivale a un HTML 00:06:46
que tendría que estar 00:06:50
en la versión XHTML 00:06:52
1.0 00:06:54
tengo que alegrarles 00:06:55
la vida porque actualmente 00:06:58
por ejemplo para definir un documento HTML 00:07:00
simplemente escribimos 00:07:02
este trocito de aquí y un mayor 00:07:03
y todo esto de aquí no aparece 00:07:06
pero en las versiones más antiguas de HTML 00:07:08
y de XHTML eran tan largos como estos 00:07:09
también vamos a tener 00:07:12
instrucciones de procesamiento 00:07:14
en las cuales por ejemplo en este caso 00:07:15
estamos indicando que el XML 00:07:18
en el que esté escrito esto va a ser procesado 00:07:20
va a ser transformado a través de esta hoja 00:07:22
de estilo .xsl 00:07:24
vamos a tener caracteres un tanto 00:07:26
extraños 00:07:28
por ejemplo, para escribir 00:07:29
un menor que no sea 00:07:32
propio de una etiqueta, tendremos 00:07:34
que escribir este texto 00:07:36
ampersand 00:07:38
lt punto y coma 00:07:40
less than 00:07:42
para el mayor, greater than 00:07:43
para el ampersand, amp 00:07:46
para una comilla 00:07:47
apóstol y para una doble comilla 00:07:50
cuot 00:07:53
también tenemos un caso muy especial 00:07:53
que se los a las secciones 00:07:57
sedata y las secciones sedata son 00:07:58
un punto extrañas porque empiezan de esta manera 00:08:00
una manera muy rara y difícil de recordar 00:08:02
y finalizan de esta 00:08:05
y lo que quieren indicar es que dentro 00:08:06
uno puede escribir lo que quiera 00:08:08
puede escribir incluso dentro menores 00:08:10
o mayores o lo que uno quiera 00:08:12
es una forma un poco de saltarse 00:08:14
de saltarse toda la normativa 00:08:17
que aparece por allí dentro. Aquí vemos un ejemplo. Los caracteres, y para poner menor 00:08:19
pondríamos esto, y para poner ampersand pondríamos esto, no pueden escribirse. Si quisiéramos 00:08:24
escribirlos de verdad, pondríamos aquí cdata, y ahora ya escribimos esto a placer, sin tener 00:08:29
que estar pensando en lo que aparece dentro. No se recomienda su uso, pero a veces es muy 00:08:35
cómodo. Y después tenemos una cosa que son entidades, y entidades lo que se refieren 00:08:41
es a algo que ya está definido 00:08:47
entonces yo por ejemplo aquí he definido la entidad 00:08:50
yo, y esta entidad corresponde al nombre 00:08:53
Bartolomé Sintermarco 00:08:56
bueno, pues ahora cuando yo pinte autor 00:08:58
y llame a esta entidad, pues entonces 00:09:01
el resultado será el nombre correspondiente 00:09:04
esto es un poco el vocabulario que vamos a ir manejando 00:09:07
vamos a ver ahora 00:09:11
En breve, que es un documento bien formado. 00:09:14
Idioma/s:
es
Autor/es:
Amadeo Mora
Subido por:
Amadeo M.
Licencia:
Dominio público
Visualizaciones:
101
Fecha:
26 de diciembre de 2020 - 18:57
Visibilidad:
Público
Centro:
IES CLARA DEL REY
Duración:
09′ 19″
Relación de aspecto:
1.78:1
Resolución:
1364x768 píxeles
Tamaño:
58.03 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid