Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

"Uso de Software Libre y escalabilidad de grandes plataformas" por D.David Martinez

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 3 de mayo de 2010 por EducaMadrid

3366 visualizaciones

Ponencia titulada "Uso de Software Libre y escalabilidad de grandes plataformas" por D.David Martinez (responsable de Sistemas de Tuenti) presentada en las IV Jornadas de Software Libre: Boadinux 2009, realizadas los días 22 y 23 de abril de 2009 en el I.E.S. Arquitecto Ventura Rodríguez de Boadilla del Monte.

Descargar la transcripción

E agora temos a David Martínez, Ender, que é o jefe do sistema da red social Twenty. 00:00:00
Obrigada, David. 00:00:07
Buenos días e moitas gracias por vir a todos vosotros. 00:00:09
Intentaré que, bueno, isto seja máis ou menos animado. 00:00:16
En cualquier momento me gustaría que, si non entendéis algo, 00:00:22
ou se me está empezando a ir la olla e estou empezando a falar 00:00:26
de unha forma un pouco abstracta ou rara, 00:00:32
que me interrumpierais ou, simplemente, si tenéis algún tipo de dúda, 00:00:35
que me interrumpáis en cualquier momento. 00:00:39
De hecho, para premiarlo, 00:00:43
he traído unos caramelos 00:00:47
Así que, nada, el que pregunte, premio. 00:00:52
No, esto son azúcar, nada más. 00:01:01
Bien, en principio, la charla que vamos a dar é sobre software libre 00:01:05
e sobre como llevar ese software libre a grandes plataformas. 00:01:10
Ahora mesmo, Twenty é un jogador moi importante en internet en España. 00:01:15
Hai uns números un pouco máis adelante. 00:01:23
Pero, bueno, con isto, lo que intentamos é daros un pouco unha visión 00:01:26
de lo que nosotros hemos tenido que abordar 00:01:32
e dos problemas a los que nosotros nos hemos enfrentado 00:01:35
cando hemos utilizado software libre para construir unha plataforma 00:01:38
moi grande como é Twenty. 00:01:42
Bueno, lo primero de todo, llevo un montón de tempo trabajando en isto. 00:01:46
Soy el responsable de sistemas de Twenty, 00:01:51
además, soy desarrollador de Debian, me flipa la horchata, en fin. 00:01:54
Son unhas cuantas cosas que son bastante importantes sobre mi carácter 00:01:58
que, al final, son los que han conformado al final lo de la horchata en gran medida. 00:02:03
Mi visión sobre o software libre en general. 00:02:10
Debian, como imagino que sabéis todos, é un sistema operativo 00:02:14
basado todo en software libre. 00:02:19
E, bueno, iso tamén, de hecho, te condiciona a tomar determinadas cosas, 00:02:22
a ver o mundo de unha certa maneira. 00:02:27
Y, bueno, es lo que al final luego ha ido permeando 00:02:30
ou entrando en varias de las decisiones que hemos tomado a continuación 00:02:36
de las que yo he sido, en este caso, el responsable. 00:02:41
La frase, en principio, la vamos a tratar, vamos a hablar un poco de software libre, 00:02:48
vamos a hablar de escalabilidad y de grandes plataformas, en este caso Twenty. 00:02:52
Es más o menos como lo vamos a estructurar. 00:02:57
Al final, el software libre en educación lo que tiene son unos cuantos parámetros 00:03:01
que son importantes sobre todo en el ámbito de la educación 00:03:09
y yo creo que es importante también citarlos aquí. 00:03:13
Es un modelo colaborativo en todos los aspectos. 00:03:16
Tanto ofrece herramientas de colaboración como el desarrollo mismo del software libre. 00:03:19
Es un modelo vivo de colaboración y la muestra de que un montón de personas, 00:03:24
incluso que no se conozcan, son capaces de hacer algo tremendamente grande, 00:03:29
tremendamente exitoso y con unos niveles de calidad que, en muchos casos, 00:03:33
no tienen nada que envidiar al software comercial tradicional. 00:03:42
En sí es muy importante. 00:03:46
Es muy importante porque, al final, el software libre básicamente ha crecido 00:03:48
y se ha desarrollado y es lo que es gracias a un modelo colaborativo basado en internet, 00:03:55
en una red de comunicaciones que ha conseguido comunicar y conectar 00:04:01
a un montón de personas que tienen un ideal común pero que no se conocen de nada 00:04:08
o que simplemente están absolutamente desperdigados de forma geográfica. 00:04:13
También es una herramienta educativa porque permite, por ejemplo, 00:04:18
a los profesores o a cualquier docente trazar o demostrar como se hacen las cosas, 00:04:23
por ejemplo, en el mundo de ahí fuera. 00:04:31
Si estamos pensando en un modelo tradicional en el que tenemos unas clases de ciencias e informática 00:04:34
o lo que sea, en el que estamos intentando demostrar como se hacen las cosas 00:04:41
o como funciona un sistema operativo, en el caso de un sistema operativo propietario, 00:04:46
como puede ser Windows, no tenemos esas herramientas. 00:04:50
En el caso de Linux o de software libre, sabemos como funciona una suite oficina, 00:04:53
como funciona un núcleo de sistema operativo, como funciona un navegador por dentro, 00:04:57
como funciona lo que sea. 00:05:02
Y no solo eso, sino que permite además adaptar muchas de esas cosas, 00:05:03
muchos de esos productos, a la educación en sí misma. 00:05:06
Permite, pues como tienen, por ejemplo, en la comunidad extremeña, 00:05:10
tienen sistemas todos basados en software libre y pueden controlar, por ejemplo, 00:05:17
todos los ordenadores de los niños desde la mesa del profesor. 00:05:23
Pueden apagar y encender equipos. 00:05:27
En fin, todas esas cosas indudablemente se pueden conseguir siempre con software propietario, 00:05:29
pero también se pueden conseguir por software libre. 00:05:33
Y si no están exactamente, se puede hacer un pequeño desarrollo patrocinado por un ayuntamiento, 00:05:35
un colegio, un instituto, una universidad, lo que sea, para fomentarlo. 00:05:40
Ahí son dos vertientes diferentes. 00:05:44
También está basado en licencias libres. 00:05:46
Eso es algo que a veces, o quizá, en ciertos momentos se ha perdido en norte, 00:05:48
pero para la gente que viene del ámbito universitario, 00:05:53
el conocimiento, básicamente, siempre ha sido libre. 00:05:56
Siempre ha estado ahí. 00:06:00
Siempre ha habido tesis, ha habido un código experimental, de investigación. 00:06:01
Todos esos desarrollos, al final, son también muy importantes 00:06:08
y están tremendamente reforzados por el hecho de que existen ciertas licencias 00:06:12
en las cuales la gente se puede apoyar para luego producir ese software libre. 00:06:17
Asimismo, dado el modelo colaborativo del software libre, 00:06:22
también tenemos un modelo de seguridad más eficiente que en muchos otros casos 00:06:26
en los que son dos o tres personas los que se encargan de auditar un código 00:06:35
o de responsabilizarse de que ese código no haga cosas extrañas. 00:06:42
Y no sólo eso, sino que además tenemos la posibilidad de ver 00:06:47
si el código está haciendo alguna cosa extraña. 00:06:51
Si está llamando a casa para enviar datos personales o lo que sea. 00:06:53
Dicho esto, al final lo que tenemos es un montón de características 00:06:58
que ofrece el software libre para crear algo, una plataforma que sea realmente interesante. 00:07:05
Esas características son que tenemos con unas estructuras que normalmente se denominan distribuciones 00:07:13
que son un conglomerado de software puesto de una forma determinada y mantenido 00:07:27
que es lo que realmente a la gente, como yo, nos interesa. 00:07:35
A alguien que tiene en su caso un equipo, a mí lo que me interesa es que si yo instalo algo, 00:07:38
ese algo esté mantenido. 00:07:43
Que si sale un problema de seguridad, si sale un agujero que permite ganar privilegios, 00:07:45
que permite robar información, que todo eso se repare y se distribuya lo más rápidamente posible 00:07:54
y que yo tenga que hacer lo menos posible para disponer de esas actualizaciones. 00:07:59
Eso en sistemas operativos o en distribuciones Linux avanzadas como pueden ser Debian, Ubuntu, Red Hat, Nobel o SUSE. 00:08:04
Bueno, he dicho Nobel y SUSE, realmente son la misma. 00:08:17
Al final lo que provocan es que tengan esas líneas, ellos hacen tabula rasa 00:08:21
y a partir de ese momento separan el desarrollo de una distribución 00:08:29
y solamente emiten paquetes de seguridad para esa distribución, para esa versión de la distribución. 00:08:33
Eso me permite, desde el punto de vista de un mantenedor de una gran infraestructura, 00:08:41
el tener todas mis máquinas unificadas con los últimos parches de seguridad, etc. 00:08:47
Eso es tremendamente importante. 00:08:52
Porque no olvidemos que cuando vosotros tenéis 4 máquinas u 8 es muy fácil mantenerlas, muy fácil. 00:08:55
Si lo que tenéis son 40 u 80 empieza a ser complicado. 00:09:02
Si tenéis 4.000 u 8.000 es un absoluto reto. 00:09:06
Si tenéis 40.000 u 80.000 entonces es algo que se sale de la escala completamente. 00:09:10
Entonces, lógicamente, hay ciertas cosas que sí que nos aportan determinadas distribuciones. 00:09:17
En este caso, las distribuciones clásicas y más consolidadas. 00:09:25
Y que nos ofrecen, por ejemplo, un soporte de seguridad que es muy importante. 00:09:29
Además de eso, el software libre es extremadamente versátil. 00:09:32
Es extremadamente versátil porque... 00:09:40
Me voy a cambiar de sitio porque así pueden ver los demás. 00:09:42
Es extremadamente versátil porque el hecho de ser libre permite su modificación sin ningún tipo de tapujo ni problema. 00:09:45
Eso también permite que nosotros podamos modificar a nuestro antojo ciertas cosas que a lo mejor no nos gustan. 00:09:54
Que queremos capar las características de una aplicación, lo que sea. 00:10:04
Y obtener sistemas que vuelvan a funcionar tranquilamente pero sin determinadas características. 00:10:08
O extender esas características para que hagan lo que nosotros queremos. 00:10:13
Eso también es muy importante. 00:10:16
Al final, como todo requiere que tengamos muy claro por qué usamos software libre, por qué necesitamos software libre y qué es lo que nos va a aportar. 00:10:18
Hay que pensar una serie de cosas. 00:10:35
Aquí he puesto lo que yo puedo decidir que me parece interesante. 00:10:38
Es hasta dónde quiero llegar, qué quiero poner en cada capa, qué es una capa para mí, cómo tengo que optimizarla, 00:10:44
si tengo que modificar o no ciertos tipos de software o de características. 00:10:53
Si voy a tener un problema de interoperabilidad y cómo resuelve, si el software libre me va a resolver ese problema. 00:10:59
Pongamos el caso de una plataforma en la que yo tenga que hablar con sistemas Windows, por ejemplo. 00:11:05
O tengo que hablar con sistemas propietarios de streaming de vídeo. 00:11:14
Entonces me dan un vídeo de una determinada forma o con una determinada codificación. 00:11:19
Hay un montón de cosas que tenemos que conocer de nuestro entorno. 00:11:25
También, el software libre no nos engañemos. 00:11:29
El software libre es gratis. 00:11:32
Eso no significa, aparte de ser libre, es gratis. 00:11:34
Eso no significa que esto sea jauja y el coste de implantación sea cero. 00:11:38
El coste de implantación es algo que normalmente no se tiene en cuenta en empresas muy pequeñitas, 00:11:46
pero que al final es algo que hay que tener en cuenta. 00:11:51
Hay que tenerlo en cuenta porque supone una cantidad lógicamente muy apreciable del presupuesto que vas a destinar a la plataforma, 00:11:53
básicamente porque no estás pagando nada por la licencia. 00:12:07
Entonces los costes se te van en el hierro, es decir, en los servidores, 00:12:10
y también se te van a ir en las horas que vas a dedicar para dejar el sistema a tu gusto, 00:12:15
para verificar que todo está bien, que está limpio, las actualizaciones de seguridad, etc. 00:12:21
¿Vale? 00:12:27
Chequear flujo de aire. 00:12:28
Ah, ese no soy yo. 00:12:29
Eso sí. 00:12:32
Flujo de aire. 00:12:34
Me ha asustado. 00:12:36
Entonces, bueno. 00:12:39
Claro, me estaría moviendo el pelo. 00:12:42
Entonces, al final lo que necesitamos es un acierto lo más cercano posible a lo que nosotros buscamos. 00:12:45
¿De acuerdo? 00:12:56
Además de esto, indudablemente si entramos ya dentro de la escalabilidad, 00:12:58
podemos ver que Linux puede y es capaz de escalar desde cosas exageradamente grandes hasta cosas que son tremendamente pequeñas. 00:13:03
¿Vale? 00:13:14
Grande. 00:13:16
Tenemos el Roadrunner. 00:13:17
¿Vale? 00:13:19
Es una auténtica barbaridad. 00:13:20
Tiene 12.000 procesadores PowerC, los que lleva la Playstation 3, 00:13:22
que aunque no lo sepáis es un procesador increíblemente potente. 00:13:27
Y 6.900 ópterons de AMD. 00:13:31
¿Vale? 00:13:33
92 kilómetros de fibra óptica, 3 megavatios. 00:13:34
Eso significa que son un montón de calefacciones eléctricas. 00:13:38
1.100 metros cuadrados, 226 toneladas, en fin, es un auténtico monstruo. 00:13:42
Y esto lleva Linux. 00:13:47
De ahí podemos pasar a algo tremendamente pequeño. 00:13:49
Es así. 00:13:54
Así y así. 00:13:56
Es así de chiquitito. 00:13:57
¿Vale? 00:13:59
Se llama Picotux, por ejemplo, y esto tiene 55 megavatios, 8 megas, 00:14:00
lleva una versión específica compilada de Linux, ¿vale? 00:14:05
Muy recortada para que quepa. 00:14:09
Y, vamos, es capaz de reservar páginas. 00:14:11
Y recibir tenets y tal. 00:14:14
Linux es capaz de funcionar en esa pieza o de funcionar en un cacharro con 18.000 nodos. 00:14:16
¿Vale? 00:14:22
Entonces, en principio, nadie tendría muchas dudas de que eso es así. 00:14:23
¿Vale? 00:14:29
Al final, si nos ponemos a echar cuentas, el éxito de Linux es indudable. 00:14:32
¿Vale? 00:14:37
Dado que, por ejemplo, hay una lista de los 500 superordenadores más... 00:14:38
Lógicamente, los 500 superordenadores ordenados por potencia. 00:14:44
Bueno, pues al menos el 85% de ellos, la última vez que lo miré, 00:14:48
llevaban Linux. 00:14:52
Directamente. 00:14:54
¿Vale? 00:14:55
Casi todos los gobiernos están empezando a utilizar, si no usan ya, 00:14:57
Linux en muchísimos sistemas de despliegue, tanto internos o llegando al usuario final en ayuntamientos, administraciones, lo que sea. 00:15:01
Y dale, con flujo de aire. 00:15:14
¿Vale? 00:15:21
También Linux está integrado dentro de sistemas multimedia, de teléfonos móviles. 00:15:22
Al final, tenemos Linux en un montón de sitios. 00:15:32
Realmente, lo único que, digamos, pretendo demostrar es que Linux es capaz de funcionar en un montón de arquitecturas, en sistemas muy chiquititos o en sistemas tremendamente grandes. 00:15:37
¿Vale? 00:15:49
Salta a la otra. 00:15:50
Precisamente por ello, me parece interesante el citar un ejemplo de gran plataforma, como puede ser 20. 00:15:53
Esto empieza a ser molesto. 00:16:07
Toma. 00:16:15
Vale. 00:16:19
20, como imagino que alguno de vosotros sabrá, 00:16:23
es la red social más grande en España. 00:16:34
¿Qué significa eso? 00:16:42
Pues eso significa tener datos como estos. 00:16:43
Estamos sirviendo del orden de 14.000 millones de páginas al mes. 00:16:47
¿Y eso cuánto es? 00:16:53
Pues eso es aproximadamente, pues alrededor de 5 por 3, 15, unos 500 millones de páginas al día. 00:16:54
¿Vale? 00:17:06
Que eso significa que en pico podemos servir a lo mejor, pues podéis echar las cuentas, pero en pico, que es cuando más servimos, a lo mejor servimos 40 millones de páginas por hora. 00:17:07
¿Vale? 00:17:18
Para tener algo así, y eso lleva Linux. 00:17:20
¿Vale? 00:17:23
Todo el chiringuito que hay detrás lleva Linux. 00:17:24
Prometido. 00:17:26
Al final eso, eso requiere un montón de tiempo. 00:17:27
Requiere un montón de tiempo, un montón de tiempo no solo trabajando en las máquinas, sino devanándose los sesos sobre como narices conseguir que todas esas máquinas se pongan de acuerdo. 00:17:32
Que todas esas máquinas no se estampen unas con otras, ni te colapsen un enlace de red, te colapsen varios discos duros, no se colapsen ellas mismas de la carga. 00:17:42
Que la carga se distribuya entre todas. 00:17:52
Que si se te cae una no te pase nada, si se te caigan dos no te pase nada, si se te caigan tres no te pase nada. 00:17:55
En fin. 00:18:02
Números. 00:18:05
¿Vale? 00:18:06
Números, un montón de fotos, subidas, hora de usuario. 00:18:07
De hecho, según Nielsen estamos delante de Google. 00:18:12
Si cogéis a Google, todo el conglomerado de Google con Gmail, google.com, google.es, los feeds que tiene, los alimentadores, en fin. 00:18:15
Todas las páginas asociadas a Google tienen menos. 00:18:24
La última vez, yo creo que Nielsen les daba como 18 o 20.000 páginas y según Nielsen, yo sé mis medidas. 00:18:28
Nielsen daba más, daba más medidas. 00:18:37
Vamos, de hecho estas son las públicas. 00:18:40
Si son más o menos ya no puedo decirlas. 00:18:42
Estas son las últimas públicas. 00:18:44
Al final, bueno, en Twenty la verdad es que eso que explicaba antes de devanarse los sesos, como veis en esta foto, es absolutamente cierto. 00:18:48
Creemos que tenemos que estar la mayor parte del día delante de nuestros escritorios trabajando y pensando como resolver todos los problemas que tenemos. 00:18:57
También es verdad que tenemos ciertos ratos de esparcimiento y al final nos relajamos poniendo servidores. 00:19:08
En fin, correcto. 00:19:21
El software que nosotros usamos en Twenty es todo software libre. 00:19:26
Todo software libre. 00:19:33
Twenty es una plataforma al uso. 00:19:34
Es una plataforma que está creada en PHP, basada en Linux, utiliza por detrás MySQL, utiliza varios aceleradores y un montón de trucos sucios o menos sucios para sacar cuanto antes esa cantidad de páginas que todos vosotros, que sois culpables todos vosotros. 00:19:37
Le pedís todos los días, entonces, al final todas las partes que componen Twenty están bajo software libre, todas. 00:19:56
Entre ellas, hay Linux, lógicamente en la parte más abajo, todo el código de Twenty está escrito en PHP, la mayoría de él está todo escrito en PHP, es lo que se ejecuta. 00:20:11
Las bases de datos son MySQL, se utilizamos un software que se utiliza en sistemas muy grandes, o bueno, no tan grandes, pero cuando empiezas a querer ahorrarte consultas a base de datos, que se llama Memcached, y usamos LightTpd como servidor web. 00:20:23
Realmente, ninguno de todos estos trucos son ningún secreto per se. 00:20:48
Al final, la mayoría de la gente apuesta por unas soluciones de este estilo. 00:20:57
La mayoría de la gente utiliza estas soluciones. 00:21:02
¿Por qué? 00:21:06
Lógicamente, porque es una solución que se suele llamar LAMP, en nuestro caso no es exactamente LAMP, sería LLMP. 00:21:09
LAMP es Linux, Apache, MySQL y PHP. 00:21:15
En nuestro caso no usamos Apache, usamos LightTpd, que es un servidor más pequeño y que se adecuaba a lo que nosotros buscábamos. 00:21:18
Y bueno, tan sencillo como cambiar ciertas piezas, si realmente te dan la funcionalidad que deseas. 00:21:25
¿Cuánto es el tiempo? 00:21:34
¿Tenéis hora? 00:21:38
Es que no me quiero yo aquí enrollar malamente, ni nada. 00:21:39
¿Y 25? 00:21:43
Ah, vale, menos 25. 00:21:44
La decía yo, que lento pasa el tiempo cuando uno se lo pasa bien. 00:21:47
Bueno pues, usamos más otras piezas de software en 20. 00:21:53
Usamos Perl, usamos GraphicsMagick, usamos Bash y usamos Resync. 00:21:59
En fin, ahí por citar unas cuantas. 00:22:04
Al final lo que usamos es un montón de scripts, guiones automáticos para que realicen un montón de tareas por nosotros. 00:22:06
Utilizamos un montón de automatismos y de cosas hechas a lo largo de muchos meses para que la administración de todas esas máquinas sea lo más liviana posible. 00:22:15
Eso provoca que aparecen, bueno pues como citaba antes un poco ¿no? 00:22:34
Hay varios retos. 00:22:41
La mantenibilidad, el precio por plataforma, la capacidad de modificación y el rendimiento que podemos usar de ella. 00:22:44
La mantenibilidad, bueno pues la mantenibilidad es algo que tiene que ser obvio. 00:22:52
Y tiene que ser obvio por la sencilla razón de que el día tiene 24 horas, todo el mundo tiene una familia, todo el mundo tiene que descansar 00:23:00
y no tiene sentido estar todos los días decidiendo que tienes que borrar, yo que sé, varios registros de actividad de cada una de las máquinas porque se llenan o lo que sea. 00:23:09
Tiene mucho más sentido que tú directamente pongas una alarma que o bien te avise o bien que borre cuando se pase de no sé qué, que borre los registros adecuados, etc. 00:23:21
Al final necesitas, tienes un gravísimo problema de mantenibilidad. 00:23:33
Eso es un problema que os encontraréis en grandes plataformas seguro, seguro. 00:23:37
El problema de la mantenibilidad además significa que cuanto más divergéis de los paquetes principales o del software principal, más difícil o más tiempo tenéis normalmente que dedicarle y más difícil es volver al original. 00:23:42
Es decir, si a vosotros os interesa parchear, yo que sé, pongamos por caso la ITPD porque necesitáis una u otra característica, no hay ningún problema, lo podéis hacer. 00:24:01
El software libre os permite y no sólo os permite, os promueve el que vosotros lo cambiéis, perfecto. 00:24:14
Pero también el software libre tiene una ventaja y un inconveniente, es que el software libre sigue avanzando. 00:24:23
Lo que sucede es que si de pronto hay un fallo de seguridad para una versión de la ITPD que es la que tú tienes parcheada, tendrás que migrar ese arreglo de seguridad a tu sistema, volver a compilar unos paquetes, etc. 00:24:29
O directamente coger los cambios que tienes, entregárselos a los desarrolladores principales del software que sea y entonces olvidarte porque directamente podrás seguir aprovechando el resto de versiones. 00:24:44
Eso es algo tremendamente importante y que muchas veces supone que te pienses dos veces antes de modificar un software o decidir si me merece la pena o directamente cojo el parche y lo envío a los desarrolladores principales o lo que sea. 00:24:57
También hay otro componente muy importante que es el software que tenemos, en el que hablaré un poco más adelante. 00:25:13
El precio por plataforma. El precio por plataforma viene un poco a la sazón de lo que estaba comentando antes. 00:25:21
Al final el precio por plataforma es cuánta pasta me dejo por cada servidor pero no sólo en el hierro. 00:25:29
El hierro me viene sin instalar, tengo que instalarlo... ¿Qué pasó? 00:25:35
Es que ya lo veo parpadear y me pongo muy nervioso. 00:25:41
Al final el precio... Mira, ¿ves? 00:25:46
Bueno, el precio por plataforma al final lo que nos provoca es que tengamos que pensar cuánto tiempo, cuánto tiempo y eso es súper importante porque en el software libre no tenéis que pensar en el método tradicional de me cuesta tanta pasta el servidor y me cuesta tanta pasta el Windows más el SQL Server. 00:25:56
No, el modelo es completamente diferente. El modelo es, pongo este servidor y ahora tengo que instalarlo, tengo que encenderlo, tengo que adecuarlo y meterlo dentro de la granja, tengo que actualizarlo cuando el resto de máquinas se actualicen, etc. 00:26:15
Más luego tengo que desarrollar todas las cosas que a lo mejor el software tradicional no me da, o sea, me daba y que el software libre a lo mejor en este caso no me da. 00:26:41
Al final se trata de hacer números. Si vais a estar cuatro meses desarrollando una cosa y a lo mejor en dos semanas podéis comprarla de un sitio pues a lo mejor tiene sentido hacer una pequeña compra o patrocinar un desarrollo a una persona para que lo haga porque ese tío ya se sabe, yo que sé. 00:26:51
Imaginaos que tenéis, vamos a volver al mismo caso, tenéis la ITPD y queréis un cambio pero para hacer ese cambio tendréis que conocer el código de la ITPD, conocer si la vais a cagar o no con ese cambio, vais a romper algo, etc. 00:27:12
Lo que a lo mejor podéis hacer directamente es contratar a alguien de la ITPD y decirle quiero que me desarrolles esta característica, punto. 00:27:32
Ese tipo de cosas son las que también hay que sopesar si al final me sale a cuenta o no, si realmente me sale a cuenta el echar y echar horas de la gente que está trabajando en el equipo o directamente contratar un consultor externo que me resuelva la papeleta de la configuración de las bases de datos y punto. 00:27:41
Ese tipo de cosas son muy importantes, muy importantes. La capacidad de modificación hemos hablado hasta la saciedad y seguiréis oyendo hablar de ella, es una de las principales razones por las que yo por ejemplo instalo software libre y es el tener siempre la capacidad de alterar una pieza del software si no me gusta como esta. 00:28:03
Y el rendimiento pues bueno pues mal no va, mal no va. Pero si que es cierto que el rendimiento indudablemente es un reto porque si esto le condiciona la capacidad de modificación, el precio por plataforma y puede que la mantenibilidad entonces al final esto es un resumen de todas estas cosas. 00:28:25
Significa que probablemente para conseguir mejor rendimiento tenga que hacer mi sistema menos mantenible porque estoy aumentando el precio por plataforma dado que estoy modificando mi software o estoy investigando y haciendo modificaciones o configurando especialmente mi software. 00:28:51
Eso provoca que el precio por plataforma es más alto pero claro si empiezo a sacar mucho más rendimiento de mis máquinas de pronto tengo que pagar, o sea no necesito 10 para servir lo que antes, o sea lo que ahora puedo servir con 5 y hay veces que esos números existen. 00:29:10
Yo os lo digo por experiencia porque recuerdo un cambio que hicimos en un sistema en los light, te acuerdas el numero de hijos en php? Estabamos en un nivel de ancho de banda, estabamos sacando un numero determinado de paginas, pongamos que estabamos sacando yo que se 100 paginas por segundo. 00:29:29
Y entonces al final yo creo que desarrollas una especie de instinto raro en el que dices aquí hay algo que no va bien, esto yo creo que debería poder dar más, unos cambios de configuración, plon, 200 inmediatamente. 00:29:56
El sistema no estaba suficientemente bien configurado y le faltaba un poco de, estaba esperando a que le dieras un poco más de alas, bueno pues durante esa semana pasamos de 100 a 400 paginas para que os hagáis una idea más o menos, de 100 a 300 o de 100 a 400, solo con tocar un fichero de configuración, fue así de sencillo. 00:30:10
Al final lo que requiere y lo que yo siempre defiendo es que yo solo pongo cosas en la plataforma que conozco, solo. Eso de, llega un punto además en el que google tampoco te ayuda demasiado porque hay un montón de gente que tiene cositas pequeñas, luego bastante gente que tiene cosas medianas y cosas grandes hay muy pocos que las tienen. 00:30:29
Y entonces cuando te pones a leer después de meses pegándote con cosas te das cuenta de que este, anda que este, anda que este, bueno lo que me está diciendo, bueno y este. 00:30:52
Siempre al final tienes que quitar muchísima paja porque todos esos problemas tú ya te has enfrentado a ellos, los has quitado y al final llega un punto en el que no tenemos forma de seguir adelante sino ser capaces de escalar. 00:31:02
¿Qué pasa cuando tenemos que escalar? Pues cuando tenemos que escalar o tenemos un sistema que es mantenible o nos volvemos majaras y os lo digo completamente en serio. 00:31:18
Cuando yo llegué a 20 por ejemplo, así como anécdota, todas las máquinas se instalaban desde cero, se metía un CD, se instalaban, se respondían a las preguntas, si, si, si, si no, instalame este, este, este tal y el pack de juegos me lo quitas. 00:31:28
Y al final se perdía un montón de tiempo, no demasiado pero un montón de tiempo. Bueno pues lo que nosotros tenemos es chequear flujo de aire, es algo muy importante en 20. 00:31:43
Lo que tenemos es una versión estable de Debian por ejemplo, eso fue una de las primeras cosas que yo como responsable de sistemas puse en 20 porque lo que había era un sistema, una distribución de estas que no tiene versión estable, es una distribución que se llamaba Arch y entonces es una distribución que está actualizándose continuamente. 00:31:57
A mí no me sirve nada porque si instalas el día 1 un sistema no te sirve, no es completamente diferente al que instalas el día 10 y al que instalas el día 20, con lo que tienes que empezar a utilizar sistemas de imágenes en el que tu dejas una imagen como te gusta, plum, le haces una foto digamos, plan y luego empiezas a plancharlas, plas, plas, plas, plas, plas. 00:32:18
Que tienes 5 servidores iguales, perfecto, de pronto haces una modificación porque quieres añadir este paquete y hay que actualizarlo, bueno pues actualizas tu imagen, actualizas tus 5 servidores y a partir del sexto todos estarán bien copiados, plas, plas, plas, plas. 00:32:39
Desde mi punto de vista si os vais a meter en una gran plataforma necesitáis un sistema de imágenes, de sistema operativo, no hay forma de hacerlo si no, es absolutamente imposible. 00:32:53
Las actualizaciones de seguridad son muy importantes, por eso utilizamos por ejemplo Devian, podríamos haber usado Red Hat, tienen al menos 2 años de soporte de seguridad, el software está todo ensamblado e integrado entre sí y hay una versión como decía antes estable de la plataforma, hubo un señor que dijo hasta aquí y todos los desarrolladores de Devian dijimos vale, a sus órdenes, aquí paramos y se acabó, se congelan los paquetes, no se añade más, empezamos a estabilizar la distribución 00:33:01
y adelante y entonces eso es lo que acabamos teniendo en este caso, bueno pues es hecho. 00:33:31
Al final ahondando un poco donde iba antes, bueno pues el precio es como decía es una cosa es el precio directo por plataforma, por hierro y cosas que metes dentro y no es lo mismo que sea absolutamente gratis, tenéis que pagar a unos ingenieros, unos administradores como los queréis llamar para que realicen todo ese trabajo. 00:33:36
Al final no es una cosa tan rara, ni es un modelo que funcione tan mal, al fin y al cabo hay granjas gigantescas, tenéis la NASA, tenéis Google, tenéis Amazon, Facebook, Yahoo, todos los grandes sitios tienen, casi todos tienen granjas basadas en Linux y además cumpliendo este tipo de cosas, tienen sus propias distribuciones, al final todos nos movemos y si no lo aprendes o sea si no lo lees en un sitio u otro al final te acabas convenciendo de verdad, te acabas convenciendo todo el mundo. 00:34:04
Necesitas desplegar máquinas lo más rápidamente posible porque si de pronto a Google le llegan 400 máquinas o 2000 máquinas nuevas, no puede tener a un señor o a 10 señores allí, a 10 paisanos con el CD y poniéndolo, es ridículo, necesita que si hay 4000 máquinas en 10 minutos las 4000 máquinas están instaladas. 00:34:35
Es perfectamente posible, perfectamente posible, yo soy capaz de instalar máquinas en 2 minutos, cada máquina, entonces puedes, ras, saturas toda la red con conexiones y a la porra, se acabó, puedes hacerlo sin ningún problema, pero necesitas seguir ciertos patrones o ciertas guías, una de ellas es el flujo de aire de las narices. 00:35:01
¡Ay! 00:35:20
¡Lo mato, eh! ¡Lo mato! 00:35:25
¡Y es un chupachús! 00:35:28
Vale, al final, modificable, modificable es... 00:35:35
Modificable, bueno, pues, como decía antes, el código es libre, el código es abierto, me permite hacer cualquier tipo de modificación, recordad que las modificaciones son algo, es un lastre que luego vamos a ir llevando y hay veces que es muy doloroso el acabar manteniendo esas modificaciones a nuestro software. 00:35:39
Hay muchísimas cosas, muchísimas cosas que, como decía ahí en internet, hay muchas cosas que pueden ser interesantes, hay veces que ya estás a vuelta de todo y realmente lo que sigues es la versión absolutamente inestable del software porque te interesa y lo que muchas veces haces es o bien modificas tú a mano o coges ciertas cositas que saldrán en las siguientes estables o tal porque te resuelven perfectamente la papeleta que tienes ahora mismo. 00:36:07
Entonces, en general, por ejemplo, en Twenty las modificaciones que tenemos en general son cositas pequeñas, tenemos modificaciones pequeñas a software, pues, el servidor web cuando yo le pido una página y no está el PHP disponible para no sé qué necesitamos, bueno, pues entonces se añaden varias líneas de código, se recompila todo el software, plus, lo instalas y se acabó, ¿vale? 00:36:31
Rendimiento, pues, al final el rendimiento, ahora, por ejemplo, uno se apoya mucho en la virtualización, por ejemplo, la virtualización es una de esas soluciones que son muy bonitas, la gente ahora está extremadamente excitada sobre la virtualización y la virtualización sirve para lo que sirve. 00:36:52
Igual que Apache sirve para lo que sirve o Perl sirve para lo que sirve, son muy flexibles pero no resuelven todos los problemas, ¿vale? Entonces, en el caso de la virtualización, por ejemplo, nosotros no virtualizamos, ¿para qué? 00:37:19
Yo no voy a usar una máquina para cuatro cosas a la vez y entonces voy a tener un montón de sistemas, no, yo uso máquinas muy potentes o bueno, bastante potentes, no son auténticos cañones pero son máquinas bastante potentes y las uso para todo lo que me dé la máquina, no uso un trocito para una, otro trocito para otra, al final uso todo en todos. 00:37:33
Ya está, ni virtualizo ni leches porque es como si a Google le dijeras, bueno, tienes cuatro servidores muy grandotes pero es que con cuatro servidores muy grandotes no le sirve, ¿no? Google tiene cientos de miles de máquinas y cada máquina intenta aprovechar lo más posible la arquitectura de cada una de las máquinas. 00:38:02
¿Qué más cosas necesitáis en una arquitectura de gran rendimiento? Estadísticas, eso es, pero vamos, básico, básico, hacer estadísticas de todo, de todo, de red, de CPU, de memoria, de disco, de conexiones, de operaciones por segundo, de todo lo que podáis, de todo lo que podáis. 00:38:22
Porque al final cuando pase algo miraremos y nunca hemos mirado las estadísticas de memoria en la base de datos pim pam pum o nunca hemos mirado el enlace que une esta u otra máquina pero al final ese tipo de estadísticas son las que os van a resolver la papeleta, de verdad, de verdad. 00:38:49
Cuando digo estadísticas, ahí se me olvidó reflejarlo, también son alarmas, lógicamente, las estadísticas es una forma de mantener cosas funcionando y ver cómo andan, pero si hay algo, por ejemplo, dado que lo estáis midiendo podéis inmediatamente mandar una alarma a ello, ¿vale?, mandar una alarma al administrador y decir atiende porque te acabas de pasar de conexiones en la base de datos y ya no se puede conectar nadie. 00:39:06
Bueno, pues en ese momento es cuando el administrador actúa, pero antes no, antes no, pero necesitamos saber o necesitáis saber como administradores de esa plataforma que hay algo que está yendo mal, a la vez, ¿cómo sabemos que hay algo que está yendo bien o que está yendo mal? 00:39:36
Bueno, pues una parte de las estadísticas son lo que yo llamo métricas, por ejemplo, las estadísticas de CPU os pueden decir parte de las cosas, las estadísticas de red os pueden decir parte, pero a lo mejor lo que os interesa es ¿por qué no divido cuánto consumo de CPU tengo entre cuántas páginas saco? 00:39:51
Por ejemplo, yo, imaginaos que tengo una gráfica de páginas por segundo y tengo otra gráfica de CPU, inmediatamente si yo divido la CPU entre las páginas por segundo que estoy sacando, sé cuánta CPU estoy gastando por cada página, entonces, si ese número de pronto empieza a incrementarse, significa que hay algo que los programadores están haciendo terriblemente mal porque están pasando, están gastando muchísima más CPU de lo normal. 00:40:13
O cuánto tiempo tarda en procesarse una página y entonces, de pronto, si veis que ese tiempo tarda en procesarse un montón, o sea, empieza a crecer, pues entonces hay algo que está mal, o tengo un problema de base de datos o tengo un problema de... y entonces es cuando acudimos. 00:40:43
Por tanto, una parte muy importante de las estadísticas son también las métricas, es decir, ¿cómo narices relacionamos? Pues yo que sé, ¿este gráfico ancho de banda está bien? Sí, pero ¿lo has comparado con el de la semana pasada? 00:40:57
Y entonces, a lo mejor, es interesante que pintéis el gráfico de la semana pasada sobre impreso, que se puede hacer perfectamente con software libre, con NRTool, por ejemplo, y tener una idea de si estamos creciendo o estamos decreciendo, o a lo mejor es, vaya, una cosa, por ejemplo, que observamos, así, ahora que no nos oye nadie, es que, por ejemplo, los sábados la gente se conecta mayoritariamente por la noche, se conecta, pues, a la... después de... a la hora de comer o por ahí, 00:41:09
y luego por la noche, cuando tiene un rato y se pone delante del ordenador, es cuando más se conecta la gente. Curiosamente, los viernes y los sábados, a mí hay un trozo de esas gráficas que me falta. 00:41:39
Si yo veo una gráfica que es así, con un par de chepas, ¿no?, en... pues, a la hora de comer y a la noche, y los viernes yo veo que eso baja. Y yo, de pronto, veo las gráficas y digo, ostras, esto... esto... ¿qué le pasa? ¿qué le pasa a la gente? Hay algo. 00:41:53
Bueno, para empezar, nos afectan los partidos. Hay partido del Real Madrid-Barcelona y, de pronto, Twenty hace así, plas, plas, y sigue. Cuando empieza, soy capaz de decir el minuto en el que empieza y el minuto en el que acaba. Es más, en el descanso hace pip, luego baja otra vez, lo cual es absolutamente increíble. 00:42:09
Es absolutamente increíble, ¿no? La gente está viendo fotos y mira un rato a la pantalla. Pasa otra foto y sigue mirando a la pantalla, y claro, en cuanto llega el descanso, pa, pa, pa, pa, pa, pa, pa, pa, pa, pa, pa. Sí, sí, estoy aquí viendo el partido, sí, sí, ¿qué tal?, pa, pa. Ya ha empezado, plas. 00:42:31
Es inmediato, es automático, la verdad es que es muy interesante. Los viernes y los sábados, por ejemplo, no se produce esa chepa, esa subida, ¿por qué? Por las tendencias sociales de la gente, también tienes que conocer tu producto. 00:42:49
Al final lo que estás hablando es de gente que, los viernes y los sábados, en general es gente joven, que sale. Y entonces lo acusas muchísimo. Por ejemplo, los picos, cuando la gente empieza a ver páginas, empieza a verlas mucho más tarde, un domingo que un martes. 00:43:01
Porque el martes está en el trabajo, en el colegio, en el instituto, en la universidad, y está a lo mejor desde las 8 o las 9 de la mañana, y se pasa un rato por donde sea, o donde tenga un ordenador, y mira su perfil de 20. 00:43:18
Sin embargo, un domingo es mucho más tarde. Bueno, pues esas cosas forman parte, digamos, más del universo de métricas, en el que, esto que ha pasado hoy es normal, no lo sé, vamos a ver la del viernes pasado. 00:43:28
Ah, sí, sí, mira, pasaba lo mismo. Bueno, ya puedo relajar un poquito el paquete, porque no es tan raro. ¿Vale? Eso es uno de los ejemplos, ¿vale? Uno de los ejemplos que tenemos. Esto, a vosotros no os diré nada, yo lo veo y digo, está bien, está bien. 00:43:40
Así, ya está, ya está, bien. ¿Esta máquina está funcionando? Ah, que sí, está funcionando perfectamente. Por ejemplo, aquí estoy simplemente, esto es una gráfica de MySQL, que yo me he inventado, y que es el número de conexiones que tiene, esto es un día, y esto son el número de conexiones, las medias, el número máximo de conexiones que tuvo, las conectadas, y las que se están ejecutando ahora mismo, algún tipo de consulta, ya está. 00:44:02
Si esto de pronto me sube, como podéis ver, es muy leve, pero a las 4 de la mañana no está ni el tate, aquí, y sin embargo, hay unas ligeras curvas que pueden apreciarse, ¿vale? Y que al final son, bueno, pues, lo que me definen un poco, si yo aquí empiezo a ver un montón de gráfico, pues me asusto, son las 4 de la mañana. ¿Quién narices está haciendo algo en las bases de datos? 00:44:30
Al fin, al final, hay muchas opciones, tenéis, no tenéis que perder el norte sobre todas las cosas que hay, ni os emocionéis. Para la mayoría de las soluciones hay una respuesta o un par de respuestas que os sirvan, lo que pasa es que hay veces, sobre todo en el software libre, que hay tanta variedad, es difícil desbrozar y al final quedarse con la opción. 00:44:55
De hecho, es posible que haya un par de soluciones, una a lo mejor os va a dar un poco más de trabajo, u otra menos, o las dos os van a dar igual de trabajo, pero una diferente que otra, ¿vale? Joder, joder. Tenéis que ser bastante analíticos con qué problema tenéis y cómo podéis solucionarlo. 00:45:17
Y si las cosas que yo estoy haciendo van a valerme para otra cosa, o si voy a poder utilizarla, ¿no? Pasa, a ver si se puede ver. Vale, pasa. Vale, al final sobre la versatilidad hay una cita muy buena, que a mí me gusta mucho, de Robert Heinlein, en el que dice que, bueno, que un ser humano debería ser capaz de cambiar un pañal, planear una invasión, descuartizar un cerdo, dirigir un barco, diseñar un edificio, escribir un libro. 00:45:33
Escribir un soneto, cuadrar cuentas, construir un muro, encajar un hueso, reconfortar al moribundo, recibir órdenes, dar órdenes, cooperar, actuar solo, resolver ecuaciones, analizar un novo problema, preparar abono, programar un ordenador, preparar unha cena deliciosa, pelear eficientemente, morir dignamente, y todo esto siendo un hombre. 00:46:03
¿Por qué la especialización es para los insectos? Vale, es una cita que yo creo que es muy válida para el administrador de sistemas, pero es completamente lo contrario de lo que deben hacer los sistemas desde mi punto de vista. 00:46:22
Un sistema debe hacer aquello para lo que está diseñado, y por eso las máquinas, por ejemplo, que están en 20 o en redes muy grandes, al final utilizan el mismo símil que utiliza la naturaleza. 00:46:36
Hay sistemas muy especializados para servir páginas, sistemas muy especializados para servir consultas de base de datos, sistemas muy especializados para almacenar datos, sistemas muy especializados para encaminar tráfico, etc. 00:46:46
Entonces, al final, lo que os daréis cuenta es que normalmente, si hay una cosa que os está intentando servir para dos servicios, a veces tiene máis sentido partirlo en dos y especializar cada unha das partes por separado. 00:47:02
Por tanto, los insectos nos demuestran que esa especialización es válida, porque para los hombres está muy bien ese párrafo, o para los administradores de sistemas, pero para los insectos, porque tenemos que ser electricistas, transportistas, programadores, administradores de sistemas, psicólogos, en fin. 00:47:16
Por tanto, Apache no vale para todo, MySQL no vale para todo, PHP no vale absolutamente para todo. 00:47:44
Un ejemplo muy rápido de análisis. 00:47:50
Si os vais a servir HTTP, ¿qué es lo que voy a servir? 00:47:54
¿Voy a servir unas páginas o voy a servir ficheros? 00:48:00
Si es contenido estático, ¿me tengo que preocupar por qué? 00:48:06
Me tengo que preocupar por la entrada-salida, es decir, por el acceso que voy a tener al sistema donde están esos datos. 00:48:09
Si lo que tengo es contenido estático, me va a interesar probablemente, como ese contenido no varía, por definición es estático, cachearlo y entonces no llegar hasta el fondo y entonces sacarlo, todo el contenido que llamamos caliente, es decir, todo el contenido que se está sirviendo todo el rato. 00:48:15
Es decir, si uno de vosotros sube una foto a Twenty y esa foto no cambia, una vez que está subida, esa foto no cambia y resulta que, lógicamente, todos sus amigos reciben una notificación de que esa foto aparece. 00:48:34
Lo que a mí me interesa no es servir cada foto cada vez desde el fondo de mis servidores, sino intentar cachearla adelante porque yo sé que en cuanto se la empiecen a descargar unos cuantos usuarios, se la van a estar descargando un montón. 00:48:48
Luego, a mí me interesa dejar ese contenido lejos de mis servidores. ¿También por qué me voy a tener que preocupar? Probablemente por el ancho de banda porque el contenido estático normalmente es mucho más grande que el contenido dinámico. 00:49:01
En el contenido dinámico, las variables son completamente diferentes. Me tengo que preocupar, por ejemplo, por la CPU que voy a gastar, si voy a ser capaz de sacar páginas o no. 00:49:11
Por eso utilizo sistemas como FastGI en el que todos mis PHPs, mis Perls, mis Rubis, lo que sea, están levantados todo el rato y en vez de nacer, ejecutar y morir, lo único que hacen es estar esperando y lo único que hacen es reciben conexiones y reciben conexiones, sacan datos, pero no tienes toda esa sobrecarga de nacer, prepararse y morir. Ese tipo de cosas. 00:49:19
¿Y ya está? ¿Pasa? Así que bueno, no hay mucho más. Como introducción ha sido un poco larga, pero básicamente es lo que tenemos. Espero que haya sido de vuestro agrado. 00:49:43
Espero que, a pesar del flujo de aire que hemos tenido durante toda la charla, haya sido razonablemente clara y nada más. Ahora espero que os ganéis los chupachusos y me preguntéis. 00:50:03
¿Por qué Python en otro lenguaje de programación? 00:50:19
Así entre tú y yo realmente el Python no es tan importante. El Python se usa en algunas piezas o en algunas partes, pero de hecho no es tan importante. Por ejemplo, para mí es más importante el Perl o el Bash. 00:50:47
Es mucho más importante. ¿Y por qué? Normalmente es una cuestión de gusto o de elección. Yo no sé Python. No me avergüenza el decirlo. Bueno, yo no sé Python. 00:51:09
Y por ejemplo, si vas para administración de sistemas, en principio es interesante que sepas Python porque normalmente utilizar en vez de Python Perl o PHP o tal no va a ser tan difícil, pero al final no hay ninguna decisión oscura detrás de eso. 00:51:23
Piruleta, chupachus, con chicle ou sin chicle. Venimos aquí a to confort. 00:51:43
El otro día estuve echando cuentas y a mí me salen por lo menos quince. Dos frontales, dos servidores de base de datos, no sea que uno se me caiga. Dos frontales, dos bases de datos, un servidor de subida de fotos, cinco. 00:52:05
Dos servidores de imágenes, siete. ¿Qué más contamos el otro día? Ah, el correo, ocho. Un repartidor de carga, nueve. No, eran dos frontales de subida de fotos, diez. Dos servidores de estáticos, doce. Hay otra cosa que se me olvida. Ah, dos mencaches y el blog. Como mínimo me salen quince. 00:52:19
Google son miles y miles. De hecho, ellos ocultan el número exacto, pero son centros de datos absolutamente monstruosos. Te pierdes en ellos y son muchas, muchas máquinas. 00:52:49
Nosotros no tenemos tantas máquinas, supongo que gracias a Dios, pero bueno, sí, o sea, tenemos menos de un millón y más de quince. Eso lo sé seguro. O sea, tengo que decir que alguien por lo menos me permite decir que es confidencial. No puedo decirlo, es confidencial. Me morían ganas de decirlo. 00:53:07
Más preguntas. 00:53:32
¿Qué tenéis para protección de datos? ¿Replicación, duplicación? ¿Rights? ¿Utilizáis para protección de datos? 00:53:34
Entiendo que no estás hablando de protección de datos de la LOPD. 00:53:48
¿Los datos que almacenáis, fotografías, perfiles? ¿Cómo se protegen frente a pérdida de datos? 00:53:56
Depende. La respuesta que te puedo dar es depende. Depende de lo que tengas que proteger. Por ejemplo, en el caso de las bases de datos, las bases de datos de Twenty son monstruosamente grandes, son muy grandes. 00:54:10
Ten en cuenta que tenemos que guardar cada uno de los mensajes, comentarios, comentarios en foto, fotos, etiquetas, usuarios, ¿qué me dejo? Gustos, redes, en fin, todo. 00:54:27
Y eso son muchos datos. Eso está repartido en varias bases de datos, dos al menos, que de hecho he estado poniendo dos en todo el rato porque realmente están todas replicadas. 00:54:42
Están todas replicadas, entre otras cosas porque es prácticamente imposible que sirvas ese volumen de datos sin utilizar un modelo de maestro y esclavo. 00:54:59
Tienes un maestro que recibe todas las inserciones y las modificaciones, que propaga a sus veces o a los esclavos, y son los esclavos a los que realmente se les zurra haciéndoles las consultas. 00:55:09
Entonces, en principio, hacer esa copia de seguridad o hacer esas copias de seguridad es tremendamente difícil. De vez en cuando las hacemos, pero son una vez al mes o una vez cada dos meses. 00:55:21
Es decir, que si pasa algo terrible y cae un meteorito donde tengamos el centro de datos, pues bueno, por lo menos podrías vivir con lo que tienes hace dos meses. 00:55:36
Pero realmente, en un sistema distribuído, si está bien montado, te aprovechas de tener varias copias de esos datos en varias máquinas, en al menos dos máquinas. 00:55:46
Vale, es que puedo desgraciar a alguien. Este es para él. 00:56:05
¿Cuándo y cómo planeasteis hacer la página web de Twenty? 00:56:17
Bueno, ahí tendría que estar probablemente Joaquín o Félix, algunos de los fundadores. Twenty está basada en otra red social, que se llama Wish Hub, y decidieron que no había nada parecido. 00:56:23
Crearon Wish Hub, vieron que funcionaba y que realmente existía ese potencial de conexión entre un montón de personas y que había esa necesidad, y entonces construyeron sobre eso, reescribieron todo el código, llamaron a un par de personas más y empezaron a construir eso. 00:56:41
Realmente aquí en España no existía nada parecido. En Estados Unidos, por ejemplo, que siempre nos lleva ventaja en muchas de estas cosas, había habido hace un par de años algo como Facebook, por ejemplo, que había realizado cosas similares, y entonces simplemente en España no existía y empezó a crecer y luego ya fue el boca a boca de gente. 00:57:00
Voy a descabezar a alguien. 00:57:26
Al muchacho de la camiseta amarilla está a punto de doblarle la cabeza. 00:57:39
Había otra pregunta por allí. 00:57:43
Ya que han mencionado el pasado lo de la LOPD, lo de la Ley de Protección de Datos, que supongo que aparte de lo que has comentado del hierro, de la gente trabajando, pues os supone un coste adicional, y yo quería preguntar si eso os da mucho la lata o cómo lo lleváis, lo del tema legal. 00:57:46
Sí. 00:58:06
¿Dónde está Ícaro cuando le necesito? 00:58:13
A ver, la protección de datos es una cosa muy delicada en Tuenti, y sin querer ahondar mucho en el tema, porque tampoco soy el más idóneo para responder, ten en cuenta que al final con lo que estás tratando es con menores. 00:58:16
Por un lado, un menor, lo que llamamos menor, es decir, menor de 18 años, según la legislación española tiene derecho a ceder sus datos a partir de los 14. 00:58:34
Entonces, desde ese punto, digamos que ahí se apoya Tuenti y se apoyan muchos otros. 00:58:46
Si tú leas nuestras condiciones generales, a partir de 14 años tú tienes derecho a ceder tus datos a terceros, no tienes ningún problema. 00:58:53
A su vez, el tutor legal de esa persona tiene derecho a revocar el acceso a Tuenti porque al fin y al cabo es su tutor legal. 00:59:01
Con lo que tienes que tener mucho cuidado con los procedimientos, cosa que nos ha costado porque muchas veces es delicado y tienes que ser muy estricto con el procedimiento. 00:59:09
Por ejemplo, cuando alguien te notifica que no quiere un perfil, no puedes coger esa petición, procesarla y luego borrarlo o tirar el papel. 00:59:20
Te tienes que quedar con todo por si luego alguien pide cuentas sobre eso, un juez o lo que sea, hay un montón de falsificaciones realmente porque no nos engañemos. 00:59:31
Esa es una conversación que hemos mantenido con un montón de gente y al final todo el mundo estamos igual. 00:59:44
No hay ninguna forma clara ni sencilla de certificar que tú eres tú. 00:59:51
Entonces, ahora este señor se abre una cuenta con el nombre de un profesor y realmente no hay nada que se lo impida. 00:59:55
No hay nada que se lo impida hasta que de pronto el profesor se entera y nosotros automáticamente revocamos la identidad. 01:00:05
Ahí hay un montón de problemas que son inherentes a la plataforma en sí pero hasta ahora no hay absolutamente ninguna forma de lidiar con esos problemas 01:00:13
que no sean las buenas maneras, los procedimientos y ser lo más ágiles posibles. 01:00:24
Nosotros, como mucho en 24 horas, borramos un perfil. 01:00:31
Nosotros programamos los perfiles para borrar y por las noches normalmente se borran todos. 01:00:35
Entonces, como mucho nosotros bloqueamos el acceso a ese perfil a partir de recibir la notificación y certificar que esa persona es quien dice ser, 01:00:40
el profesor nos ha escrito o a través de un despacho de abogados, lo que sea. 01:00:47
Y entonces, bueno, eso. Tienes menores de 14 años que se inscriben en Tuenti. 01:00:50
Es complicado, pero por la sencilla razón de que no tienes forma de hacer una relación biunívoca entre una identidad y una cuenta de Tuenti. 01:00:56
Vamos, de nada. 01:01:06
Gracias. 01:01:07
Fui lanzador de chupachusos en mi juventud. 01:01:17
¿Hola, pensabais que Tuenti iba a tener tanto éxito habiendo como ya estaba por ahí Facebook? 01:01:22
Vamos a restringir la pregunta si pensabais que Tuenti iba a tener tanto éxito. 01:01:31
Mis respuestas no. 01:01:35
Yo llevo un año y medio trabajando en Tuenti. 01:01:37
Tuenti tiene dos y pico. 01:01:41
Yo venía del mundo.es. 01:01:46
En el mundo.es servíamos alrededor de 300 millones de páginas al mes. 01:01:50
De acuerdo que no son las mismas. 01:01:57
Una cosa es una página del mundo.es en la que tú estás leyendo un montón de tiempo, delitándote con el artículo o lo que sea. 01:01:59
En Tuenti normalmente el ritmo de páginas es mucho más rápido. 01:02:07
Cuando yo llegué a Tuenti servíamos 300 millones o 200 millones al día. 01:02:11
Era 20 veces lo que yo servía en el mundo. 01:02:16
Y además todo dinámico. 01:02:19
No es un artículo que escriba un periodista, lo vuelca al servidor y entonces ya se sirve de forma casi estática. 01:02:21
En nuestro caso era todo dinámico. 01:02:29
Si tú subías una foto, a los tres segundos tu compañero Alberto que se conectaba a su perfil veía que se había conectado a otra persona. 01:02:31
Y que había subido una foto. 01:02:40
Eso es un reto extraordinario. 01:02:42
Y desde entonces no hemos hecho más que crecer. 01:02:45
La respuesta corta es no. 01:02:48
Yo desde luego no sabía dónde me metía. 01:02:50
¡Aplausos! 01:03:02
¿Más preguntas? 01:03:22
Bueno, a ver, te hago yo la última. 01:03:23
Supongo que tenéis, bueno, con la barbaridad de imágenes que tenéis que tener, la barbaridad de perfiles que tenéis, la barbaridad de todo. 01:03:26
O sea, me imagino el volumen de máquinas que tiene que ser a lo bestia. 01:03:34
Por lo que has explicado la replicación y demás tienen que ser barbaridades de servidores. 01:03:38
Pero bueno, no te voy a preguntar por el número. 01:03:43
Lo que sí te quería preguntar es si usáis software libre para sistema de almacenamiento en red. 01:03:45
Seguro que utilizáis uno porque en esos sistemas tenéis que utilizar algo o muy similar o propietario o tal. 01:03:48
Pero, ¿utilizáis alguna solución de software libre para almacenar todo eso? 01:03:54
No pienses tanto que se te nota luego al final. 01:04:07
No, es que estoy pensando qué es lo que puedo decir y qué no. 01:04:11
En principio, no uso ningún almacenamiento centralizado. 01:04:14
Mi almacenamiento es distribuido. 01:04:20
Eso significa que el almacenamiento está distribuido en un montón de máquinas. 01:04:23
Eso significa que si yo quiero una foto me la puedo bajar de varios servidores. 01:04:32
Eso significa que si yo quiero una foto me la puedo bajar de varios servidores. 01:04:38
Y ya. 01:04:46
No, quiero decir, no es tampoco ningún secreto. 01:04:48
Puedes, al final, realmente tienes un compromiso entre tener una máquina que sea central pero que tenga muchísimo ancho de banda hacia afuera para poder sacar todo eso y un montón de lo que serían frontales para sacar todo ese tráfico. 01:04:52
O puedes dejar a cada máquina que tenga un trozo y que la sirva por ella misma. 01:05:06
Es más cercano a ese segundo caso que al primero. 01:05:11
Por ejemplo, si hablamos de GoogleFS, el sistema de ficheros de Google, ellos te garantizan que para cada objeto tú tienes al menos dos copias de él en la red. 01:05:14
Al menos hay dos copias. 01:05:22
Y luego tú tienes una tabla donde consolidas todo, un localizador, un agente de localización donde, dame un objeto, entonces te devuelve varias localizaciones para ese objeto. 01:05:24
Va por ahí. 01:05:36
Bueno, pues ya está, que Lola quiere cortarme las piernas a la altura de la cintura. 01:05:43
Entonces, muchas gracias por todo, muchas gracias por vuestras preguntas y ha sido un placer venir aquí. 01:05:50
Muchas gracias. 01:06:05
Valoración:
  • 1
  • 2
  • 3
  • 4
  • 5
Eres el primero. Inicia sesión para valorar el vídeo.
Idioma/s:
es
Autor/es:
D.David Martinez
Subido por:
EducaMadrid
Licencia:
Reconocimiento - No comercial - Sin obra derivada
Visualizaciones:
3366
Fecha:
3 de mayo de 2010 - 14:47
Visibilidad:
Público
Enlace Relacionado:
Consejería de Educación de la Comunidad de Madrid
Duración:
1h′ 06′ 10″
Relación de aspecto:
4:3 Hasta 2009 fue el estándar utilizado en la televisión PAL; muchas pantallas de ordenador y televisores usan este estándar, erróneamente llamado cuadrado, cuando en la realidad es rectangular o wide.
Resolución:
448x336 píxeles
Tamaño:
403.10 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid