Categories
54cuatro

Monitoreo: ¿lo necesito? ¿por qué? ¿cuál elijo?

El servicio de #monitoreo de componentes y servicios es una herramienta vital para todas las compañías que basen su trabajo en el uso de ordenadores. No solo la visibilidad acerca de la disponibilidad de un servidor o de un servicio es importante, lo es también tener métricas que acompañen los planes de la empresa. No solo se debe tener una visión pesimista de estos sistemas.

El #monitoring puede brindar datos muy enriquecedores para una compañía acerca de los horarios de usos de sus sistemas, errores reiterativos, controles de seguridad, políticas de resguardo, etc.

Tipo de soluciones

Existen muchos softwares de monitoreo en el mercado y entre ellos existen familias diferentes que se adecuan mejor a una solución u otra.

Desde soluciones netamente #Microsoft, que poseen el monitoreo sobre #SystemCenter dentro de #Windows 2012 (anteriormente llamado #MOM), como para soluciones de #Networking donde #NAGIOS soporta facilidad de desarrollo de #scripts que conecten a los dispositivos por #SNMP e incluso para aquellos que tengan un sitio web y necesiten controlar la disponibilidad de su website.

Todos los vendors tienen una herramienta acorde a su necesidad, pero el punto clave es saber elegir ya que de eso depende la relevancia de los datos y los costos asociados.

Hace unos años solo existía el sistema de monitoreo on-premise (y eventualmente probes externos que accedían a servicios público a modo test), actualmente con la tendencia del cloud computing existen sistemas híbridos que permiten tener agentes reportando a nivel local y a nivel público (que también auspician de “probes”).

Sistemas actuales

Hoy en día sistemas como #Nagios, #Tivoli, #MOM, #Concord, #Openview, #WhatsUP, etc siguen vigentes y sus implementaciones continuarán, pero se debe tener en cuenta que el mantenimiento de ellos puedo ser un gasto importante de presupuesto cuando contamos con vendors que nos brindan una solución “llave en mano” permitiéndonos simplificar la operación y reducir costos.

Actualmente existen vendors destacados que brindan soluciones competitivas “llave en mano”, las cuales se adaptan a diferentes escalas de negocio , entre ellos podemos mencionar #Groundwork, #OPSView, o #Pulseway.

Todos con un servicio similar, nos proveen de altas capacidades de control tanto desde la PC como desde aplicaciones móviles, contamos con gestión de información histórica a modo de métricas, e incluso un primer nivel de acción sobre servicios y aplicaciones (restarts, reboots, etc).

Siempre hablando de las versiones Premium, cada uno de estos proveedores permiten tener capacidades de control con altos estándares de calidad por un precio muy bajo, ya que el servicio es ofrecido en packs o por dispositivos lo que realmente permite abaratar costos al momento de una implementación de este tipo y teniendo como dijimos un alto nivel de sensores y gran capacidad analítica.

Monitoreo on-premise

Pero el monitoreo on-premise seguirá vigente ya que, para empresas con muchos componentes informáticos y muchas aplicaciones, el monitoreo es un punto clave de la operación. Muchas empresas siguen trabajando con Nagios ya que les permite actualizar el core del sistema manteniendo muchos de sus scripts personalizados.

Muchas otras confían en el monitoreo provisto por vendors importantes como #HP, #IBM, Microsoft. Y algunos otros comienzan a adoptar #Cacti o #Zabbix. Estas últimas herramientas son excelentes softwares de monitoring, con un alto nivel de mantenimiento y soporte.

Además, ambos softwares brindan capacidades excelentes y con una interfaz realmente agradable y simple.

Como mencionamos más arriba, lo importante no es solo tener sensores que nos brinden información certera, sino que el sistema actualmente tiene que estar integrado totalmente para que no sea solo una consola de eventos.

Debe estar dotado de una inteligencia superior, integrándose con nuestro sistema de reclamos, con herramientas de capacity planning y que toda esa información recolectada pueda ser utilizable en el tiempo siendo una fuente confiable para tomar decisiones acerca de crecimiento vegetativo, cambios aplicativos, recambios por obsolescencia, análisis de OPEX y todo tipo de oportunidades de mejora que surjan a partir de los datos que recolecten estas herramientas.

Gonzalo D’Angelo

[email protected]

[popup_anything id=”2076″]

Categories
54cuatro

Planeando una continuidad operativa ante desastres

La adopción de los planes de recuperación ante desastres (#DRP por sus siglas en inglés Disaster Recovery Plan) son una necesidad sin discusiones en el ámbito de las grandes compañías, pero gradualmente muchas empresas de tamaño medio y pequeño planean Planes de Continuidad de Negocio (#BCP) a través de herramientas que le permitan el recupero operativo de sus aplicaciones ante una falla crítica.
Debido a la creciente oferta de servicios #Cloud es que la posibilidad de contar con un sitio de contingencia es algo cada día más sencillo y accesible.

¿Qué necesito para planificar un plan de recuperación?

Fundamentalmente conocer cuáles son los objetivos del plan. Una vez estipulado el alcance es necesario contar con un inventario físico y aplicativo. Toda esta información es importante para el proceso de planning.

De ser posible se debe crear un mapa de arquitectura que contenga la relación de las aplicaciones, dependencias, resguardos, el flujograma de comunicaciones y que tenga un mapeo relacionado entre cada servicio y cada servidor, de manera de conocer que corre cada equipo.

Entrando en el plan se debe conocer previamente dos ítems fundamentales: RTO y RPO.

  • El #RTO (recovery time objective) es ni más ni menos que el tiempo máximo definido para una aplicación para que la misma pueda estar fuera de línea.
  • El #RPO (recovery point objective) tiene que ver con la cantidad de datos que se pueden perder en determinado tiempo.

Es de esperar que los costos aumenten a medida que los tiempos de recuperación solicitados sean más cortos. De manera que -a modo de ejemplo- un sistema de ventas, cobranzas y/o facturación, puede tener un tiempo de RTO y RPO menor que un sistema de mensajería y colaboración; dado que su organización puede tolerar más tiempo sin email o perder los emails de las últimas horas, pero no puede tolerar estar sin facturar o perder la facturación de una hora atrás.

Basados en las definiciones tomadas en cuenta para incorporar en el plan de continuidad operativa, el siguiente paso es dimensionar el sitio de contingencia para lo que sea fundamental la información técnica mencionada anteriormente y que conformará la fase de planning.

Planning

El planning determinará las características del sitio secundario. Y esas características deben contener información importante:

  • ¿Se procesa el 100% o solo partes críticas de la plataforma?
  • ¿El sitio secundario soporta toda la carga o será limitado en potencia? Como paso adicional, se deben considerar factores de red y seguridad.
  • ¿Cómo se harán las réplicas?
  • ¿Cómo se aseguran las copias de información?
  • ¿Cuánto ancho de banda consumirá?
  • ¿Se mantendrán las direcciones IP?

Dependiendo de la respuesta el plan puede tener infinitas combinaciones de ejecución acordes a los requerimientos de su negocio.

Y no está de más mencionar que existen cuestiones políticas.

  • ¿Quién determina el RTO/RPO?
  • ¿Quién determina la pérdida total del sitio primario y da la orden de ejecutar el lanzamiento de la plataforma desde el sitio secundario?
  • ¿Qué cambios aplicativos deben realizarse?
  • ¿Qué cambios en los accesos (ej DNS) deben realizarse?

DRP

Así como el proceso paso a paso de la ejecución del DRP debe ser debidamente documentado también dentro del listado de tareas es importante tener el detalle del rollback, y determinar en qué momento y como se ejecutará el proceso de “devolución” de los servicios al sitio primario.  Todos estos pasos deben ser documentados a detalle, y el plan debe ser probado en su funcionamiento (se recomienda un test anual) para confirmar que ningún paso sea erróneo.

Obviamente cada negocio tiene reglamentaciones como #SOX, #ISO, Bancos, u otros casos que complejizan la operatoria. Técnicamente cada aplicación tiene un funcionamiento que genera el análisis puntual de cada una y en muchos casos tareas previas de adecuación antes del armado del sitio de resguardo. Cada caso es una situación especial que amerita algo mucho más profundo que este pequeño artículo.

Gonzalo D’Angelo

[email protected]

[popup_anything id=”2076″]

Categories
54cuatro

IT Verde

Esta nota la escribi hace mas de 10 años sin embargo tiene gran vigencia en la actualidad.

Hace unos años trabajando en #Telecom Argentina encaramos unos proyectos de #GreenIT, donde buscamos que los proyectos tengan buenas prácticas medio ambientales en pos de colaborar con la reducción de basura tecnológica, la disminución de consumos de recursos y fundamentalmente para lograr que el mercado IT sea renovable y sustentable.

Desde el 2009 a hoy participé en varios proyectos relacionados al concepto de Green IT que iremos ampliando en esta nota.

Mi primera participación en un proyecto de #sustentabilidad tuvo que ver con un proyecto donde reducimos el espacio destinado a depósito, logrando una mayor densidad de equipos en el centro de cómputos y reduciendo el consumo de #commodities de entorno (energía, aire acondicionado, forzadores de aire, etc).

Antecedentes de proyecto

Este proyecto comenzó con un chequeo de salud del inventario de la compañía, tarea que derivó en tener que relevar centros de cómputos y depósitos para agregar y/o cambiar los estados de los registros de cada server dentro del #Asset Manager. Con la consolidación de la información se realizaron distintos planes de trabajo entre los que brevemente podemos mencionar:

  • Desafectamos equipos fuera de producción en el #datacenter.
  • Desarme de equipos de depósito para usar partes como repuestos.
  • Donación de componentes informáticos reusables a través de #RSE (responsabilidad social empresaria) a Escuelas Técnicas.
  • Envío de equipos/partes/chasis y otros componentes inutilizables a planta recicladora donde por medio de procesos de fundición/desarme recuperan distintos materiales para ser reusados.

Todas estas tareas lograron cumplir los objetivos propuestos. Se disminuyó el catálogo de equipamiento en depósitos, se logró optimizar el uso del centro de cómputos y fundamentalmente se disminuyeron los gastos de energía debido a la baja considerable en los consumos. En años siguientes el plan se volvió un ciclo que evolucionó gracias a las herramientas de virtualización existentes logrando reducir el parque de servidores obsoletos, la población de equipos en datacenters y el gasto energético.

Este mismo trabajo fue realizado en empresas de menor tamaño que incluso lograron reducir uso de espacio físico (muy importante para quienes consumen servicios de housing y/o alquiler de espacio), gastos de energía y además lograr una ganancia monetaria extra al vender ciertos componentes que para otras compañías tenían valor.

Otras de mis participaciones en conceptos de eficiencia informática, consistió en proyectos relacionados con la impresión. La impresión es algo básico para todo tipo de empresas que habitualmente conlleva un gasto fijo importante y que es posible disminuir aplicando estrategias apropiadas para cada situación.


Condiciones

Ante la necesidad de un cliente de mejorar sus servicios de impresión, comenzamos un análisis sobre el uso de sus equipos.
Así fue como detectamos algunas de estas condiciones:

  • Mucha cantidad de #impresoras/#fotocopiadoras instaladas (y de diferentes marcas).
  • Abuso de impresión personal de parte de los empleados de la compañía.
  • Importantes gastos en resmas y mantenimiento de impresoras.
  • Insatisfacción por el funcionamiento del servicio de impresión por parte de los usuarios.

Objetivos

Para cumplir los objetivos planificamos etapas para lograr tener un sistema de impresión eficiente y ecológico.

  • La primera fase consistió en el armado de una cola de impresión única desde donde se logró simplificar la instalación de las impresoras en las PC de los empleados y detectar el tipo de uso que se le daba a los componentes.
  • La segunda fase y basados en los análisis de la etapa 1, consistió en el cambio de las impresoras por equipos multifunción e integrados a validación de usuario (acceso biométrico, vía tarjeta de acceso o con usuario y contraseña).
  • La tercera fase fue realizar cambios en la cola de impresión para mejorar el uso de los componentes (impresión por default en B/N, impresión en las 2 caras de la hoja, autosuspensión de las impresoras ociosas, encendido/apagado de equipos de manera automática definido por horarios) y fomentar el correcto uso de los equipos en los empleados con políticas de concientización y de “uso aceptable”.

Los resultados fueron notables. Se simplificó el proceso de instalación de las colas de impresión en las PC de los empleados, se disminuyeron las impresoras instaladas por todos lados y por consiguiente se logró disminuir el espacio utilizado por impresoras y el gasto de energía; logramos una notable disminución en los contratos de soporte y mantenimiento de los equipos; el uso de tóners y resmas disminuyó cerca del 65%; se logró integrar la impresión, la fotocopiadora y el scanner en un único punto y se elevó la disponibilidad de los equipos y en paralelo se disminuyeron los reclamos.

Al día de hoy, sigo asesorando a Grandes Empresas y PYMES a optimizar sus componentes con un proceso cíclico que consiste en lograr información confiable que permite tomar decisiones oportunas al momento de realizar consolidaciones de equipamiento, desafectar componentes,  y optimizar gastos. En la actualidad la nube beneficia muchísimo el proceso, permitiendo simplificaciones operativas y reducciones de costes.

Esta nota, contada brevemente tiene una gran cantidad de puntos que fueron abriéndose hasta convertirse en proyectos con vida propia. Las empresas que confían en #54cuatro logran disminuir el #OPEX y incluso obtener un #ROI de tareas de optimización que muchas veces parecen costosas y complicadas pero que al planificarlas y ejecutarlas suelen tener muchos beneficios a nivel económico, operativo y fundamentalmente con la responsabilidad de la compañía hacia el medio ambiente algo que -repetimos- debe ser una prioridad para todos los que formamos la industria IT.

Gonzalo D’Angelo

[email protected]

[popup_anything id=”2076″]