Activa JavaScript para disfrutar de los vídeos de la Mediateca.

LMGSI-Almacenamiento de la informacion. Parte1 - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 1 de abril de 2025 por Francisco J. G.

52 visualizaciones

LMGSI-Almacenamiento de la informacion. Parte1

Más información Transcripción

Descargar la transcripción

Bueno, la videoconferencia trata del almacenamiento de la información y corresponde al tema 6 del módulo. 00:00:05

He intentado, como en todas las videoconferencias, cojo toda la información que hay en el aula virtual y la completo, 00:00:19

incluso la pongo un poquito más clara, con más ejemplos, etc. 00:00:26

Que sepáis que lo que entra en el examen será toda la parte que aparece en el aula virtual. 00:00:30

Yo soy muy fiel a la aula virtual en cuanto a los contenidos que voy a reflejar aquí, en esta videoconferencia, igual que me ha pasado en todas las que os he colgado. 00:00:40

Entonces, ¿cómo empieza el aula virtual? Bueno, empieza repasando XML. 00:00:50

XML ya habíamos visto lo que era. Hemos visto que estaba muy aceptado y que se aceptaba con dos finalidades. Una, porque guardaba información estructurada, como la guardaba, la guardaba de manera jerárquica y podía comunicar datos entre sistemas. 00:00:54

Entonces, vimos también que se podía separar la información del formato de presentación. ¿Cómo se trabajaba con XML? Si lo recordáis, pues teníamos un ficherito en el que los datos estaban como nodos, teníamos nados, atributos, había un orden y había una jerarquía. 00:01:11

Realmente XML no deja de ser nada más que un árbol con una jerarquía donde hay nodos con subnodos y luego cada uno de ellos puede tener atributos. 00:01:34

Para acceder a los datos se debía, lógicamente, si tú quieres acceder a los datos, esto no es como en una base de datos relacional en la que tú necesitas un dato, a través de un índice pasas a buscar ese dato, sino que aquí necesitas parsear todo el fichero. 00:01:44

Tienes que pasar y comparar cada uno de los datos hasta que tienes el dato que tú necesites. 00:01:58

XMLE lógicamente no tiene índices y necesitas ese parseo para poder leer e interpretar todo XMLE y hasta llegar al dato, si el dato que requieres es el de Madrid, tienes que parsear todo hasta que obtienes ese dato. 00:02:04

Como XML puede actuar como base de datos. Podemos ver XML como una base de datos, pero claro, no será una base de datos, será no relacional. 00:02:22

También podemos ver una colección de archivos XML como una tabla con registros y cada archivo XML sería un documento independiente. 00:02:32

En cuanto a esquema y estructura, ya lo hemos visto, pueden seguir un mismo esquema a través del XSD, pero no es obligatorio. 00:02:41

y nos va a otorgar mucha flexibilidad, accesibilidad individual y modularidad. 00:02:50

Ventajas del almacenamiento XML. 00:02:58

Como he dicho, gran flexibilidad. 00:03:02

No te impone una estructura fija, sino que puedes ponerla tú como quieras. 00:03:05

Tú la creas y tú la puedes poner. 00:03:09

Eso sí, luego esa estructura sí va a ser jerárquica. 00:03:11

Se puede compartir información y en eso pues como su formato pues es muy estándar pues se puede acoger pues muchos sistemas y entonces pueden o tecnologías que pueden utilizar o compartir esa información. 00:03:14

Quizás esa sea la gran ventaja de XML. Es compatible con estándares de interoperabilidad en la industria con SOAP, con XSLT, etc. Y útil en aplicaciones que requieren estructura y libertad. 00:03:28

¿Eso qué quiere decir? Que puedes definir las reglas claras, pues lo puedes hacer de una manera clara con el ETD, con el XSD y libertad, que no estás obligado a seguir una determinada, no estás obligado a seguir una única forma, sino que tú puedes adaptar el contenido como tú lo creas. 00:03:45

En ámbito de aplicación tenemos dos, que sería uno, sistema centrado en los datos y sistema centrado en documentos. Bueno, esto es en función de los datos que vas a querer recoger. En cuanto a ser centrado en los datos, pues sería una estructura bien definida, datos actualizables y, por ejemplo, en facturas, en artículos. En cambio, en un sistema centrado en documentos tendríamos un tamaño y estructura variable, contenido rico y flexible y serían ejemplos como contratos, informes, etc. 00:04:07

Comparativa con base de datos relacionales. Os he puesto aquí en cajita o remarcado en cuadros rojos las diferencias. 00:04:34

Veis que relacionadas en cuanto a estructura, lógicamente una base de datos relacional es rígida, 00:04:44

mientras que una XML, hemos visto que una de las características que la identificaba era la flexibilidad. 00:04:48

En cuanto al tipo de datos, lógicamente una relacional, lo único, tú tienes tablas y columnas en las que los datos están allí puestos de una manera plana. 00:04:55

En cambio, aquí en XML no hay una estructura plana, es un árbol de nodos. Si tú quieres llegar hacia un determinado destino, tendrás que recorrer distintos nodos y subnodos de dicho árbol, lo que hablábamos del parseo. 00:05:02

Ideal para datos estructurados en el caso de las relacionales, pero en el caso de XML, pues, si es verdad que tú puedes hacer ese XML lo más complejo que tú puedas hacerlo, a diferencia de los datos estructurados en una base de datos relacional. 00:05:16

Entonces, hablamos de una mayoría complejidad. Y intercambio de datos, pues en uno es limitado y hemos visto que en XML, pues intercambio de datos sería favorable, sería estándar. Tenemos en cuanto a que la base de datos relacional, pues si es verdad que es actualizable, quiere decir que puedes utilizar consultas con la date, insert, delete. En cambio, en XML, pues es un poquito más estático. Tendrías que reprocesarlo. 00:05:31

¿Qué más? En cuanto a base de datos relacional, ya hemos dicho que la tabla tenía filas y columnas. 00:05:58

Aquí estamos hablando de una jerarquía en la que hay nodos, hay atributos. 00:06:03

Base de datos relacional se utilizan fundamentalmente con aplicaciones que tengan muchos registros. 00:06:07

En cambio, XML, su peculiaridad o su gran ventaja sería que puedes utilizarlo para manejar documentos complejos. 00:06:16

En cuanto a base de datos relacional, utilizamos SQL, en XML veremos que se utilizará el XPAT y el XQuery, es decir que toda esta videoconferencia converge en una dirección, en la dirección a que al final veamos XQuery y cómo podemos, esa base de datos XML, cómo podemos acceder a los datos a través de XQuery. 00:06:24

Y, por último, tenemos que base de datos relacional sería una base de datos de alta eficiencia, rápida en búsquedas, tiene índices. En cambio, en XML tendría otro tipo de características, portabilidad, perfecto para compartir datos, ya lo hemos dicho una y otra vez. 00:06:46

En cuanto a integración de XML y base de datos, pues tenemos que los sistemas modernos deben exponer los datos en relaciones como XML, es decir, que facilita la transferencia de datos, la importación y exportación entre sistemas y la interoperabilidad entre plataformas. 00:07:01

Ya lo hemos visto en lo que he puesto antes. La verdad es que hay diferentes importantes entre la XML y las bases de datos normales o habituales. Aquí estaría todo lo que carece. Las XML, que serían sin almacenamiento eficiente, sin índices, no van a tener índices, sin control de concurrencia, sin transacciones, sin seguridad integrada, sin integridad referencial, sin triggers. 00:07:18

¿Es XML una alternativa a la base de datos? Pues no hablamos de alternativa, estaremos hablando de algo complementario. No para tareas transaccionales, ya lo hemos visto anteriormente. 00:07:45

XML sería ideal para qué? Vuelvo a repetir lo mismo que he dicho antes, intercambio de datos, representación estructurada, comunicación entre sistemas. En cambio, las bases de datos son mejores para utilizar grandes volúmenes de datos, transacciones e integridad y rendimiento. 00:07:59

Un ejemplo de XML tendría que ser Hubs, que es una herramienta que se conjuga XML con Java, en el que convierte objetos Java en XML y al revés. 00:08:15

Aquí viene el enlace, como viene en la aula virtual, para si queréis más información sobre esto. 00:08:25

Conclusión, que XML complementa la base de datos, no la sustituye y que es clave en la integración e intercambio de datos. 00:08:31

Lo hemos visto anteriormente, su uso común serían estos que aparecen aquí, almacenamiento portable y legible, configuración y comunicación entre plataformas, APIs web. 00:08:37

Y conoce sus ventajas y limitaciones, permite usarlo correctamente en arquitectura de software. Quiere decir, tenemos que saber concretamente cuáles son sus limitaciones, aparte de sus ventajas, para saber dónde utilizarlo, dónde va a ser útil. 00:08:44

XML y bases de datos relacionales, como las bases de datos relacionales son las más habituales, una de las maneras que podemos almacenar datos sería transformar esos datos XML, por ejemplo, en tablas y, por tanto, pasarlo a bases de datos relacionales. 00:08:59

Veremos que ahora no es tan fácil hacerlo, pero se puede hacer. ¿Por qué hacerlo? Porque están asociadas al lenguaje standard SQL, porque todo el mundo usa las bases de datos relacionales, pero tenemos que las estructuras de XML eran flexibles y jerárquicas. 00:09:21

Hay que transformar eso en componentes de una base de datos relacional. Hay uno de los middleware que se utilizan, aunque he puesto aquí varios, pero sería el que acabo de decir antes con el JDBC en Java y el Hubs. 00:09:40

¿Es posible almacenar XML en base de datos relacionales? Pues sí, es posible, pero no siempre es eficiente. Hay que tener muy claro que el paso de XML a base de datos relacionales puede provocar una pérdida de semántica. 00:09:57

En cuanto a semántica, me explico. Quiero decir que el significado que puede tener en el propio archivo XML, en esa jerarquía, en ese árbol jerárquico que tiene, puede perder su semántica cuando la pasamos a tablas y no solo a tablas, sino que tenemos que pasarlo a tablas y a las relaciones que hay entre dichas tablas, como sucede en una base de datos relacional. 00:10:11

Entonces, problemas para almacenar XML en una base de datos relacional. Estructura regular frente a una estructura en XML, lógicamente es una estructura heterogénea. Estamos hablando de datos más complejos. Anidamiento profundo en XML versus datos planos en SQL. Ya lo vimos que los datos en una base de datos relacional son datos planos. 00:10:37

En cambio, en XML estamos hablando de datos anidados unos dentro de otros. Estamos hablando de una jerarquía. XML tiene un orden definido, SQL no, y XML es disperso y SQL es denso. Muchos datos. 00:10:58

Por demás, de mapeo jerárquico, pues tenemos que representar datos jerárquicos en estructuras planas, pues requiere todo esto que aparece aquí. Descomposición del árbol, tienes que coger el árbol y lo tienes que descomponer como puedas en varias tablas, como puedas de la mejor manera posible. 00:11:13

Luego tienes que establecer las relaciones que va a haber entre esas tablas que has creado a partir de esos datos del fichero XML. Y lo que hablaba anteriormente, eso puede provocar una pérdida de semántica e incluso de orden, porque también tenemos que tener claro que un fichero XML tiene un orden, aparte de una jerarquía o una estructura arbórea, tiene un orden en cuanto a los datos, a la complejidad de esos datos. 00:11:32

Esto requiere un modelo muy complejo y esto va a generar, si lo queremos automatizar, un mayor coste computacional transformarlo a una base de datos relacional. 00:11:57

La razón es porque aún así aún se usa SQL para XML, ¿por qué? Porque es lo que más se utiliza. 00:12:08

Entonces es bastante más fácil coger un fichero XML y transformarlo a algo que es lo que más se utiliza. 00:12:16

El tema de base de datos relacionales está muy establecido, son conocidos, fiables y optimizados, alto rendimiento y escalabilidad. Los usuarios y desarrolladores ya están familiarizados con SQL. Si veis, pues hay bastantes razones por las que es una buena táctica pasar un fichero o ficheros XML a una base de datos relacional. 00:12:22

Es decir que también, como hablaremos ahora a continuación, hablaremos de las bases de datos orientadas a objetos y por último hablaremos de las bases de datos XML nativas. 00:12:43

Entonces, ¿por qué no usar esas bases de datos XML nativas? ¿Por qué? Porque son más recientes y menos extendidas. 00:12:55

Soluciones intermedias. Existen herramientas y técnicas que permiten trabajar con XML en bases de datos relacionales. 00:13:02

Y aquí tenemos almacenarlo con un campo CLOP o mapeo relacional XML. Aquí tenemos XQuery, XPath, Hubs, que ya lo he dicho, middlewares que integran esa transformación XML a SQL. 00:13:08

Aquí tenemos un ejemplo de base de datos relacional a XML. Si veis, tenemos una base de datos relacional con una tabla. Tenemos la tabla clientes y veis que tiene tres campos, ID, nombre y email. 00:13:22

Entonces, tenemos que hacer una traducción a XML, pero para hacerla correctamente, primero decir que a nivel semático a veces no es muy trivial. Aquí este caso es muy sencillo, pero si veis lo que ha convertido lo que es el fichero XML, lo ha convertido en una raíz de clientes y dentro me ha metido cada uno de los clientes. 00:13:38

Cada cliente, lógicamente, podría haber puesto esos campos como atributos o lo podría haber puesto como ha puesto aquí, que son subcampos dentro del campo cliente, dentro de la etiqueta cliente. Y lo ha definido así. 00:14:01

Y después podemos crear también o definir, de hecho es necesario definir un DTD o un XSD, aquí hay que generar un XSD para definir, por supuesto que en una tabla relacional como puede ser la tabla clientes, estos datos que aparecen aquí se les asigna un tipo a cada uno de ellos. 00:14:14

Entonces, ¿cómo generamos esos tipos? Pues los generamos a través de un XSD, aquí le está dando el tipo de integer, de string, también está diciendo el número máximo de ocurrencias que pueden tener en este XSD, etc. 00:14:33

No hay decir que, bueno, este es un caso muy sencillo, entonces, bueno, pues es verdad que sale bastante bien, pero cuando tenemos un fichero con unos datos mucho más complejos y cuando metemos no solo una tabla, si empezamos a meter un montón de tablas, pues la cosa se complica. 00:14:47

Entonces existen muchos enfoques posibles y decir que no hay una solución única correcta. Luego tenemos que hay que definir también el problema de las claves primarias, las claves foráneas, que veremos a continuación. 00:15:03

Aquí está haciendo cada uno de los pasos del mismo ejemplo que anteriormente y si veis crear el esquema XML, lo que ha hecho es aquí clientes y ahora si veis hay otra opción, podría haberlo metido como en este otro que tiene los tres campos, lo ha metido como si fueran tres atributos de cliente. 00:15:17

Y le ha metido cada uno de los clientes, tendrá cada uno de los, esto sería pues cada uno de estas etiquetas clientes sería pues como si fuera una fila dentro de la tabla de base de datos relacional. 00:15:34

Entonces veis que le ha metido a cada fila, lo mete como sus tres columnas, lo mete como tres atributos. 00:15:48

Esta sería una buena técnica de hacer pues ese paso de la tabla clientes a la representación en XML. 00:15:57

En cuanto a la XSD, igual que te he dicho antes, cada uno de los campos tendrá un tipo de dato que hay que definir a través de aquí de la attribute, le mete el tipo, el uso, si va a ser opcional o requerido y eso es lo que va a simular el caso de los not null y del label. 00:16:03

El not null, que significaba que una columna no podía estar vacía, pues es como si dijéramos que tiene que ser obligatoria, con lo cual aquí le ponemos el required. En cambio, pues el no label sería, significa que una columna puede estar vacía. 00:16:22

Entonces, ¿qué ponemos? Se equivaldría al campo opcional. Aquí ponemos useOptional. Esto sería en cuanto a lo más sencillo. ¿Qué sucede en cuanto a representar las claves primarias? 00:16:37

Las claves primarias se representarían a través del campo ID, pero recordar que XML tiene el problema de que un ID debe ser único en todo el documento. 00:16:52

Entonces, para establecer varios IDs y que sean únicos en todo el documento, pues, habría que ponerle, pues, anteponerle una palabra al mismo ID, pues, que sería, pues, en función de cada uno de los IDs que vamos proporcionando, pues, por ejemplo, en función, pues, el nombre de la etiqueta y con ello podríamos generar uno de manera distinta. 00:17:03

También tenemos que simular las claves foráneas 00:17:23

¿Cómo simulamos las claves foráneas? 00:17:27

Pues hay dos representaciones posibles 00:17:29

Una a través de elementos anidados 00:17:31

O a través de atributos de tipo IDREF que vimos 00:17:32

En cuanto a como elementos anidados 00:17:37

Si lo veis aquí, aquí tenemos dos tablas 00:17:41

Que serían clientes y pedidos 00:17:43

Si veis hay una clave foránea que indica 00:17:44

Que este cliente ID hace referencia a la tabla clientes 00:17:47

A la clave primaria de clientes 00:17:51

Entonces, una de las maneras sería a través de elementos anidados. Los elementos anidados, si veis aquí, lo que ha hecho es clientes, le añade cada uno de los clientes, que sería con respecto al tabla pedido y la tabla dentro de clientes tendríamos aquí cada uno de los clientes, que sea cada una de las filas con su ID y con su nombre. 00:17:53

Y, además, engloba allí dentro el que la tabla pedidos. Si veis, lo ha internalizado o lo ha anidado dentro del mismo para decir que pedidos depende de manera foránea con respecto a clientes. 00:18:16

La otra opción sería a través del ID y IDREF. ¿Os acordáis de los temas anteriores como lo que se dedicaba al IDREF? 00:18:31

La IDREF tú la creabas y haces referencia a una ID de la propia XML. 00:18:38

Decir que no existe una única forma de traducir una base de datos relacional a XML y si ya lo habéis visto anteriormente, 00:18:47

podemos utilizar cada una de las columnas o campos como atributos, los podemos utilizar tanto como subetiquetas de un nodo, etc. 00:18:54

Pueden existir diferentes formas de estructurar los elementos, enfoques centrados en atributos o en elementos, lo que acabo de decir, 00:19:03

Y esquemas más planos o más jerárquicos. Eso ya a elección. La elección dependerá del uso previsto del XML. Tendremos que ver cuál es el problema o el que nos subyace para ver cuál sería la fórmula más adecuada para nuestro caso en particular. 00:19:08

Conclusión, el mapeo relacional a XML, es decir, transformar una base de datos relacional a XML implica decisiones de diseño. 00:19:25

Se deben considerar unicidad de claves, colisiones de nombres, profundidad de la estructura, forma de representar las relaciones. 00:19:36

Objetivo, pues como todo, siempre generar un XML estructurado, coherente y reutilizable. 00:19:45

Ahora pasamos a las bases de datos orientadas a objetos. 00:19:51

Veréis que una base de datos orientada a objetos, que no deja de ser un almacén de objetos, cada uno de ellos con sus atributos, es mucho más amigable con XML que lo que puede ser con una base de datos relacional. 00:19:53

Hay que decir que una base de datos orientada a objetos implementa un modelo de objetos puro, no son extensiones de modelos. 00:20:09