Qué es un sistema de ficheros distribuidos y las mejores sistemas DFS

Aquellas empresas, o negocios que cuentan con más de una sede, suelen tener el problema de no poder trabajar en la sucursal con la misma facilidad con la que lo hacen desde la sede principal. Para afrontar este problema, una de las soluciones más eficaces en la utilizar un sistema de ficheros distribuidos. Debido a que puede ser un tema poco conocido por muchos de vosotros, hoy queremos hablar sobre en qué consiste este sistema de ficheros distribuidos, así como las mejores soluciones que nos podemos encontrar en el mercado.

¿Qué es un sistema de ficheros distribuidos?

Tal y como indica su nombre, un sistema de ficheros distribuidos (DFS) es un sistema de archivos que está distribuido en diferentes servidores o ubicaciones. Los programas pueden acceder o almacenar archivos aislados como lo hacen con los locales, permitiendo a los usuario acceder a archivos desde cualquier red o dispositivo.

La funcionalidad de estos sistemas es que los usuarios de sistemas distribuidos físicamente, compartan sus datos y recursos mediante el uso de un sistema de archivos común. Un DFS se ejecuta como parte del sistema operativo. En DFS, se crea un espacio de nombres y este proceso es transparente para los clientes. Aquí nos podemos encontrar dos componentes.

  • Transparencia de ubicación: esta transparencia se logra por medio del componente de espacio de nombres.
  • Redundancia: se consigue mediante un componente de replicación de archivos.

En el caso de producirse algún tipo de fallo, estos componentes mejoran la disponibilidad de los datos al permitir que datos compartidos en diferentes ubicaciones se agrupen de forma lógica en una carpeta conocida como «raíz DFS».

Mejores sistemas DFS

En la actualidad nos podemos encontrar diferentes soluciones a la hora de trabajar con sistemas de archivos distribuidos. Veamos algunas de las mejores opciones que nos podemos encontrar.

Ceph

Se trata de una solución de almacenamiento que hace uso de un sistema de archivos propio conocido como Ceph File System. Mediante Ceph, es posible almacenar datos distribuidos en diferentes componentes de una misma red. Además, los datos también podrían ser guardados en diferentes soportes físicos de almacenamiento. Ceph garantiza una gran flexibilidad en la elección del soporte de almacenamiento, así como un gran escalabilidad.

DRBD

DRBD (Distributed Replicated Block Device) se trata de un software basado en Linux que permite el reemplazo de los sistema de almacenamiento compartido. DRBD permite mantener la coherencia de los datos entre varios sistemas de una misma red, además de asegurar una alta disponibilidad para aplicaciones Linux.

LeoFS

Se trata de una plataforma de almacenamiento de objetos distribuidos que destaca por una alta disponibilidad y coherencia. Es la solución perfecta para almacenar una gran cantidad de datos de diferentes tamaños. LeoFS necesita un clúster de servidores más pequeño en comparación con otras plataformas de almacenamiento.

GlusterFS

GlusterFS es un sistema de archivos distribuidos y escalable a cualquier nivel que se encarga de reunir las unidades de almacenamiento de diferentes servidores en un solo sistema. Al trabajar de forma oculta, una vez instalado nadie vuelve a pensar en ellos, aunque hay que actuar cuando se produce alguna pérdida de datos o si se alcanza el espacio máximo disponible.

HDFS

Se trata de un sistema distribuido basado en Java que actúa como una sola unidad. Para ello, crea una capa de abstracción como si de un sistema de ficheros único se tratase. HDFS permite almacenar los datos en varios nodos manteniendo sus metadatos intactos. Gracias a esto, se consigue aumentar la velocidad de procesamiento, el paralelismos en las operaciones, así como la replicación de los datos. HDFS es una tecnología fundamental para Big Data, o dicho de otra forma, es el Big Data File System o almacenamiento Big Data por excelencia.

Lustre

Lustre es un sistema de archivos distribuido Open Source, normalmente utilizado en clusters a gran escala. El nombre es una mezcla de Linux y clusters. Este proyecto lo que busca es proporcionar un sistema de archivos para clusters de decenas de miles de nodos con petabytes de capacidad de almacenamiento, sin que esto afecte a la velocidad o la seguridad.

MooseFS

MooseFS es un sistema de archivos distribuido tolerante a fallas. Distribuye datos a varios servidores físicos y los usuarios pueden ver estos servidores físicos como un recurso completo.

MogileFS

Es otro sistema de ficheros distribuidos que está diseñado como servidor de documentos en sitios web con mucho tráfico. Está escrito en Perl y utiliza MySQl o PostgreSQL. El problema es que no provee ningún sistema de comprobación de la integridad de la información almacenada en el grid, aunque sí que permite la posibilidad de mantener múltiples copias de un mismo objeto.

OpenAFS

OpenAFS es una implementación de código abierto del Sistema de Ficheros Distribuido de Andew (AFS). AFS fue originalmente desarrollado en la Universidad Carnegie-Mellon, como un producto comercial por Transarc Corporation, el cual fue posteriormente adquirido por IBM. En el LinuxWorld el 15 de agosto de 2000, IBM anunciaba sus planes para el lanzamiento de una versión comercial del producto AFS bajo IBM Public License. Esta se convirtió en OpenAFS. Hoy OpenAFS soporta AIX, Mac OS X, Darwin, Digital UNIX, HP-UX, Irix, Solaris, Linux, Microsoft Windows, FreeBSD y OpenBSD.

TahoeLAFS

TahoeLAFS es un sistema descentralizado y abierto que se encarga de distribuir los documentos de un usuario en diferentes servidores Tahoe. De esta forma, se puede acceder a la información de manera transparente aunque varios de esos servidores estén caídos. Únicamente el propietario de los documentos, o que tengan los permisos adecuados, podrán ver el contenido.

XtreemFS

XtreemFS es un sistema de archivos distribuidos basado en objetos para redes de área amplia. Este sistema se encarga de replicar objetos para evitar fallos, almacenando en caché metadatos y datos para ofrecer un mejor rendimiento.

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

Scroll al inicio
×