Los blogs oficiales de Antartec
Como es usual en Antartec, seguimos explorando nuevas herramientas y soluciones para nuestros clientes. En los últimos meses pasamos una buena cantidad de tiempo construyendo una herramienta basada en Talend, un software ETL que resultó ser una importante ayuda a los procesos automatizados de inteligencia de negocios. En este artículo se describen nuestra percepción inicial de este producto y su aplicación práctica.
Definición de ETL
Para poder hablar de Talend primero tenemos que definir qué es un software ETL.
Extraer, transformar y cargar (Extract, Transform and Load en inglés, frecuentemente abreviado a ETL) es el conjunto de procesos que permite a las organizaciones mover datos desde múltiples orígenes y modificar su formato, para luego enviarlos en otra base de datos, datamart, o data warehouse para análisis posterior, o enviar los datos hacia otro sistema operacional para apoyar un proceso de negocio.
Talend
Talend Open Studio es una herramienta Open Source de integración y gestión de datos, así como integración de aplicaciones empresariales: en palabras simples una herramienta ETL.
Talend está basado en Java, requiere específicamente JDK 6 y por tanto puede ser ejecutado en Windows y Linux sin mayor dificultad, solo basta con descomprimir su ‘instalador’.
Niveles de Talend
Talend basa su diseño en 3 niveles:
Job Designs
Es el nivel empleado con mayor frecuencia en Talend Open Studio. Formado por el conjunto de Jobs, o tareas a realizar. Cada Job inicialmente de una grilla (grid) en blanco, donde se arrastran elementos de una paleta ubicada en la parte derecha del diseñador.
En dicha paleta se encuentran varios elementos configurables, llamados Subjobs, los cuales se encargan de ejecutar tareas predeterminadas pero configurables como conexiones, consultas, código personalizado, etc.
Dichos Subjobs se encuentran separados en la paleta en diversas categorías: BI, Cloud, Custom Code, Data Quality, ETL, Orchestation, System, etcétera.
Algunos Subjobs que pueden resultar interesantes son:
Los mencionados y varios otros elementos más se unen mediante un flujo secuencial, guiado por flechas extraídas de cada uno de ellos (visibles haciendo click derecho) que hacen referencias a eventos de dos clases:
Adicionalmente, un Job puede contener a uno o varios otros Jobs e invocarlos como parte de un nuevo flujo, ejecutando los Subjobs contenidos dentro de cada uno.
Finalmente, cada Job es exportable a un archivo comprimido en formato ZIP, que contiene el ejecutable: un archivo .jar llamado a partir de un archivo .bat (para Windows) o un archivo .sh (Linux).
En resumen, podemos decir que Talend es una herramienta versátil para el proceso de ETL, con un buen entorno de desarrollo visual y múltiples conexiones a bases de datos sin embargo tiene una curva de aprendizaje un poco elevada y un par de bugs pendientes por resolver.
Más información
Definitivamente las herramientas de monitoreo nos facilitan la vida a los administradores de TI. Directamente nos permiten conocer el uso de los recursos en el tiempo, el estado de las aplicaciones o servicios, ver el estado actual de hardware y software entre otros. Indirectamente nos permite proyectar la adquisición de nuevos equipos o partes, prevenir futuros problemas, incluso solucionar problemas actuales.
Las herramientas de monitoreo cumplen objetivos generales como:
Estos objetivos permiten a los administradores de TI realizar tareas como:
En esta ocasión describiremos tres herramientas de monitoreo que cubren diferentes funcionalidades y permiten tener una vista integral de la infraestructura de TI.
Esta herramienta permite tener una recopilación gráfica de como ha evolucionado el uso de los recursos durante el tiempo.
Características
Beneficios
El principal objetivo de esta herramienta es sensar el estado de aplicaciones mediante escaneo de puertos, ejecución de comandos o la ejecución de cualquier prueba que pueda determinar si un servicio está corriendo correctamente (peticiones http o consultas sql por ejemplo).
Características
Beneficios
Este programa sencillo pero muy útil permite tener un inventario centralizado de software y hardware.
Características
Beneficios
En un ambiente de producción, el uso de todas estas herramientas es casi necesario. Son herramientas complementarias que además se pueden integrar entre sí. Por ejemplo, Munin y Nagios se pueden integrar para que el primero reporte al segundo en forma relativamente sencilla. La fortaleza del Munin es poder contar con reportes de uso de recursos en el tiempo, mientras que la de Nagios es la de reportar alertas no sólo respecto a recursos si no a disponibilidad de servicios (por su flexibilidad).
El pasado 17 de marzo de 2011 se realizó el “Seminario de Gobierno Electrónico“, evento organizado por la ONGEI (Oficina Nacional de Gobierno Electrónico e Informática) y que tuvo por objeto informar los beneficios de la implementación de la Política Nacional del Gobierno Electrónico e Informática en el Perú y los proyectos existentes en el marco de esta iniciativa. En este artículo se describirán dos de las presentaciones realizadas en el evento, y en las cuales se hizo mención a temas de software libre y abierto.
El primer espacio del evento fue Gobierno Electrónico en el Perú: Conceptos, actividades y avances, a cargo del jefe del ONGEI, Ing. Jaime Honores Coronado. Se inició con algunos conceptos generales de e-government para luego mostrar la evolución del Gobierno Electrónico en el Estado Peruano.
En mi opinión, el punto más importante de la presentación fue La Plataforma de Interoperabilidad del Estado – PIDE: la infraestructura que permitirá implementar servicios públicos en línea que requieran la participación de varias entidades públicas. Esta plataforma usará a nivel de software productos de software libre y abiero: JBoss SOA, JBoss Web Server, PostgreSQL como sistema administrador de base de datos y el sistema operativo Red Hat.
Zimbra ha sido una de las tecnologías colaborativas más importantes en el mundo del software libre y abierto. Inicialmente concebido como una herramienta de automatización de servicios de correo corporativo, evolucionó en un conjunto de funcionalidades para el trabajo coordinado en una organización o en una corporación empresarial. La versión 7 trae algunas sorpresas, algunas de ellas gratas y otras no tanto.

La primera novedad de esta versión es el cambio de nombre: de Zimbra Collaboration Suite a VMware Zimbra Collaboration Server, con lo cual resalta el nuevo dueño del producto: VMware. Además de la versión Open Source y Network (dividida a su vez en Starter, Standard y Pro), VMware apuesta nuevamente por sus packs listos para usar: Zimbra Appliance (versiones Basic y Standard), una configuración que aprovecha la infraestructura de virtualización de VMware.
Primero, las mejoras para usuarios finales
Éstas son alguna de las novedades generales disponibles en la versión Open Source de Zimbra 7 (y que a mi parecer son destacables):
Entrada original
Este post presenta los 10 artículos más visitados del blog en el año que pasó. Resolví hacer esta revisión de fin de año básicamente porque el blog ya cuenta con una cantidad aceptable de publicaciones desde su apertura en 2008.
Sin mayor preámbulo, este es el recuento:
10. XMPP: Mensajería instantánea para organizaciones: Un artículo informativo sobre las características del protocolo usado en varios servicios y productos como Google Talk y Zimbra. Usar un servidor propio de mensajería basada en XMPP permitiría mantener las comunicaciones de la empresa mientras se bloquean servicios como Live Messenger por política de comunicaciones.
9. Liferay: Portales web para el trabajo colaborativo de empresas: El primero de una serie de artículos sobre Liferay. En el se describe en qué consiste un portal web (que no es lo mismo que una clásica página web) y en qué situaciones una empresa necesita implementar uno. Luego se hace una breve descripción de los componentes de Liferay. En posteriores artículos se describen razones por las cuales usar Liferay y cómo identificar un sitio construido con Liferay.
8. Empresas y organizaciones peruanas que usan software libre: Muchos lamentamos la descontinuación de la revista PC World Perú, no tanto por las novedades en cuanto a productos tecnológicos (que ahora podemos enterarnos con mayor rapidez por Internet), sino por sus reportajes y opiniones sobre tendencias tecnológicas, y por los reportajes de casos de éxito de sistemas informáticos en el país. En base al listado de reportajes de todo un año de implementaciones exitosas de software libre es que se realizó este artículo.
El objetivo de estos blogs es dar a conocer los temas que abordamos como parte de nuestras actividades cotidianas en Antartec, así como constituirse en un medio que permita una mayor difusión de nuestros servicios, productos y soluciones.