domingo, 2 de julio de 2017

Algunas consideraciones (preventa) para almacenamiento


El almacenamiento es uno de los componentes claves dentro de la arquitectura de TI, más aún que en la actualidad tecnologías ya maduras como la virtualización de infraestructura, aplicaciones de audio/vídeo, volúmenes de datos no estructurados (Big Data), vídeo vigilancia y otras, son generadores de gran cantidad de nuevos datos de forma constante.



Es por esto que al evaluar  una solución de almaceamiento para TI es muy importante elegir la opción que se ajuste más a los requerimientos actuales y futuros del negocio.

Estas breves notas buscan repasar algunos de los tipos de almacenamiento más frecuentes y algunas guías para su elección y configuración, desde el punto de vista de preventa, y por ende no pretende ser una fuente en profundidad de tecnologías de almacenamiento.

Generalidades


Por su forma de acceso a los datos, podemos dividir los almacenamientos en 3 grandes grupos: acceso por bloques, acceso por sistema de archivo, y almacenamiento de objetos.

A los sistemas de almacenamiento basados en bloques se los conoce como SAN (Storage Area Network, aunque no es preciso llamarlo así) y a los basados en archivos se conoce como NAS (Network Attached Storage).

Acceso por bloques


Los datos se almacenan en unidades, que se conocen como bloques y que en su conjunto forman unidades de mayor capacidad conocidas como Unidades Lógicas (LUN) y/o almacenes de datos (datastores).
El acceso por bloques utilizar, entre otros, uno de los siguientes protocolos: SAS, FC, iSCSI, FCoE e Infiniband.

SAS (Serial Attached SCSI)


SAS y SATA son los protocolos que de los discos usan para comunicarse con los sistemas de almacenamiento. En general para entornos de almacenamiento corporativo se usas SAS 3ra Gen (SAS-3 @ 12Gbps).



Pero el protocolo SAS-3 se usa también para la comunicación entre los sistemas de almacenamiento y los servidores. Estos sistemas se denominan DAS (Direct Attached Storage), y anteriormente implicaban la no compartición, pero hoy existen sistemas SAS que permiten compartir su almacenamiento entre varios servidores, aunque normalmente con un número muy limitado de conexiones.


Fibre Channel (FC)


El protocolo de fibra canal (FC) ha sido por mucho tiempo casi un estándar para la implementación de redes de almacenamiento (SAN) de alto desempeño, principalmente a su excelente velocidad de comunicación, tecnología non-blocking, muy baja latencia y soporta largas distancias (comparado con SCSI). Actualmente tenemos, comercialmente disponible, FC a 16 Gbps, y generalmente hay compatibilidad con 2 generaciones previas al menos (4 Gbps, 8 Gbps), que se comunican con los servidores (hosts) por medio de tarjetas HBA.


Internet SCSI (iSCSI)


iSCSI es un protocolo de comunicaciones para almacenamiento que utiliza el protocolo Ethernet (TCP) para encapsular paquetes SCSI, de modo que "cualquier" red LAN se puede utilizar para implementar una red de almacenamiento utilizando los mismos componentes (tarjetas de red (NIC), switches, cables, etc.). Al usar redes Ethernet, se obtienen algunas ventajas como la capacidad nativa de enrutamiento, distancia casi ilimitada, velocidad de 10/40 Gbps, y menores costos de implementación. Su principal desventaja puede ser la velocidad (no hay priorización), si no se usa una red dedicada para iSCSI.

Es común intentar comparar iSCSI a 10GbE con FC 8Gbps, y la realidad es que aunque la velocidad de iSCSI 10GbE es mayor a FC 8Gbps, el ancho de banda es comparable porque el protocolo FC es más eficiente que el protocolo Ethernet.

Fibre Channel over Ethernet (FCoE)


FCoE es un protocolo que canal de fibra vía redes Ethernet, pero no es IP enrutable. Para superar la falta de priorización de Ethernet, para FCoE al estándar Ethernet debe añadirse capacidades de Data Center Brinding. Al estar sobre redes Ethernet, se pueden implementar sobre redes de 10/40Gbps.

Su uso principal es en entornos convergentes, en donde se dispone de una red  de alta velocidad para uso de LAN y SAN, ahorrando componente activos (como switches) y pasivos (cableado, paneles, etcétera), en especial en configuraciones ToR (Top-of-the-Rack).


InfiniBand


InfiniBand es un protocolo maduro, con latencias muy bajas y alto ancho de banda, que se usa principalmente en soluciones que requieren conectividad de muy alta velocidad, como redes de cómputo de alto desempeño (HPC), y como red de interconexión BackEnd entre nodos en sistemas de almacenamiento, como por ejemplo sistemas Dell EMC Isilon.

Actualmente se tienen velocidades de 40 y 100 Gbps. En general son soluciones más costosas que FC y redes Ethernet, tanto en términos de costos administrativos como operativos, y además existen muy pocos proveedores de hardware para esta tecnología.

Acceso por archivos


Los datos se almacenan como archivos o ficheros en una estructura previamente definidas en un formato con estructura, denominado Sistema de Archivos (File System). Para este acceso se utilizan principalmente los protocolos NFS y SMB (CIFS).


NFS (Network File System)


NFS (Network File System, Sistema de archivos de red) es un protocolo cliente/servidor que permite compartir archivos, originalmente desarrollado por Sun Microsystems para entornos Unix usando protocolo Ethernet, y por tanto su velocidad depende de la infraestructura Ethernet sobre la que esté implementado. Hay 3 versiones actualmente NFSv2, NFSv3, NFSv4 y, aunque originalmente fue diseñado para compartir archivos, actualmente existen implementaciones que permiten su uso en entornos de bloques (como por ejemplo Nutanix DFS).


SMB (Server Message Block)


SMB es un protocolo de red tipo cliente/servidor, para compartir archivos u otro recursos en una red de equipos Windows. Originalmente desarrollador por IBM, tiene sus variantes como el CIFS (Microsoft) y Samba (Linux). Al igual que NFS, se rendimiento depende de la infraestructura de red Ethernet sobre la que está implementada. Las versiones más recientes son SMB 3.0, SMB 3.1.1, y su uso está principalmente enfocado en compartir archivos, aunque desde la versi;on SMB 3.0 Microsoft soporta ejecución de máquinas virtuales de Hyper-V desde repositorios basados en SMB.

Espero sean de utilidad estas breves notas, y pronto extenderé este blog con:
  • Consideraciones de Conectividad
  • Consideraciones de Capacidad
  • Consideraciones de Rendimiento.





No hay comentarios:

Publicar un comentario