De RADOS a Ceph: RBD, RGW y CephFS

Ceph es una plataforma de almacenamiento distribuido diseñada para ofrecer escalabilidad, rendimiento y tolerancia a fallos. Sobre la base RADOS funcionan tres servicios principales que conviene conocer: RBD, CephFS y RGW.
RBD es RADOS Block Device, un almacenamiento en bloque que actúa como discos virtuales, similar a iSCSI o LVM, y se usa habitualmente como discos para máquinas virtuales y contenedores en entornos como Proxmox. CephFS es un sistema de archivos distribuido que se puede montar como una carpeta normal y resulta ideal para backups, almacenaje de ISOs, plantillas de contenedores y compartición de datos. RGW o RADOS Gateway proporciona almacenamiento de objetos compatible con las API de Amazon S3 y OpenStack Swift, útil para aplicaciones que requieren object storage como Nextcloud, MinIO o copias de seguridad S3.
Detrás de todo está RADOS, Reliable Autonomic Distributed Object Store, la capa fundamental de Ceph. RADOS almacena datos en forma de objetos, no como bloques o ficheros directamente. Es reliable porque asegura integridad mediante replicación o erasure coding, autonomic porque realiza self-healing y autogestión sin intervención continua del administrador, y distributed porque reparte datos uniformemente entre muchos OSD y nodos.
Principales componentes de RADOS
OSD Object Storage Daemon, proceso que almacena objetos en disco. Normalmente un OSD por disco, por ejemplo osd.0, osd.1. MON Monitor, guarda el mapa del cluster y el estado de los nodos, se recomiendan al menos 3 para alcanzar quorum. MGR Manager, complemento del monitor que recoge métricas, estadísticas y ayuda al balanceo. CRUSH Map es el algoritmo y mapa que determina en qué OSD se almacena cada objeto. PG Placement Group, un bucket lógico que actúa de intermediario entre objeto y OSD y permite agrupar objetos para distribuirlos de forma eficiente.
Cómo funciona el almacenamiento en RADOS
Cuando se escribe un dato en Ceph se divide en objetos. Cada objeto se asigna a una Placement Group y la PG, mediante la CRUSH Map, decide en qué OSD se almacenarán las réplicas o fragmentos de erasure coding. Si la política de replicación es size = 3, cada objeto tendrá tres copias en tres OSD distintos. Por ejemplo, Object A puede residir en OSD1, OSD3 y OSD5, mientras que Object B en OSD2, OSD4 y OSD6. De este modo no todos los OSD contienen los mismos objetos y la carga se reparte.
Replicación y erasure coding
RADOS admite replicación tradicional, por defecto con tres copias, y también erasure coding para ahorrar espacio y tolerar fallos con menor sobrecoste. Si un OSD falla, las réplicas existentes en otros OSD garantizan la disponibilidad de datos.
Auto reparación y reequilibrado
Al detectarse un OSD caído, MON y MGR marcan las PG afectadas como degraded porque han perdido réplicas. Ceph calcula la nueva distribución con CRUSH y crea réplicas adicionales solo para los objetos que han perdido copias, no para todo el cluster. Por ejemplo, si Object A estaba en OSD1, OSD3 y OSD5 y OSD1 falla, Ceph puede replicar Object A en OSD7 para mantener tres copias: OSD3, OSD5 y OSD7. Cuando el OSD recuperado vuelve a estar operativo, Ceph verifica la validez de sus datos, sincroniza o elimina réplicas extras según convenga, y las PG vuelven a active+clean cuando la recuperación acaba.
Consistencia y rendimiento
RADOS ofrece strong consistency con garantías sobre lectura y escritura de objetos, y la arquitectura basada en PG y CRUSH permite escalar y balancear sin cuellos de botella centralizados.
Cómo puede ayudar Q2BSTUDIO
En Q2BSTUDIO somos una empresa de desarrollo de software centrada en soluciones a medida y en integrar tecnologías modernas como inteligencia artificial y ciberseguridad en infraestructuras escalables. Si necesita desplegar Ceph en entornos on prem o en la nube, migrar almacenamiento a plataformas basadas en objetos o diseñar arquitecturas resilientes para VM y contenedores podemos ayudarle con consultoría y desarrollo a medida. Ofrecemos servicios de integración con plataformas cloud y arquitecturas gestionadas, por ejemplo servicios cloud aws y azure, y desarrollamos aplicaciones a medida que aprovechan almacenamiento distribuido, IA y prácticas avanzadas de seguridad.
Además trabajamos áreas complementarias como inteligencia artificial, agentes IA para empresas, inteligencia de negocio y Power BI, ciberseguridad y automatización de procesos para ofrecer soluciones completas que mejoren rendimiento, disponibilidad y cumplimiento normativo. Palabras clave que dominamos y que resultan críticas para proyectos modernos incluyen aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi.
Si busca optimizar su arquitectura de datos, garantizar alta disponibilidad de almacenamiento o integrar soluciones inteligentes sobre Ceph y la nube, Q2BSTUDIO puede diseñar e implementar la solución adecuada, desde el análisis inicial hasta el soporte continuo.
Comentarios