Hadoop, un sistema de ficheros distribuido para OpenSolaris
Hadoop es un proyecto nacido en el seno de la Fundación Apache cuyo núcleo lo constituye un sistema de ficheros que permite solucionar los problemas antes expuestos. Dicho núcleo consiste en un sistema de ficheros distribuido, lo que le permite repartir los datos a almacenar entre los diferentes nodos que conforman el cluster Hadoop. Además, divide los datos en pequeñas porciones utilizando el modelo MapReduce creado por Google para el llamado GFS (Google File System), de forma que ante el fallo de uno de los nodos, tenemos altas probabilidades de recuperar la información que en él se encontraba.
Si bien hasta ahora Hadoop a penas había sido empleado solamente en grandes empresas de la talla de Yahoo! o Amazon, ahora tenemos a nuestra disposición gracias al proyecto OpenSolaris un Live CD que nos permite probar este sistema de ficheros distribuido en cualquier sistema informático de una forma fácil, rápida y cómoda.
En la página de este proyecto podemos encontrar además del enlace correspondiente para la descarga de la imagen, la descripción técnico de lo que tenemos exactamente entre manos y unas breves instrucciones para empezar. El Live CD de Hadoop se dirige eminentemente a propósitos educativos y experimentales para una posterior implementación real de este sistema. Así, si por ejemplo somos los responsables del centro de datos de una gran empresa, podremos probar un nuevo tipo de sistema de ficheros sin tener que modificar absolutamente nada de lo que ya tenemos implementado, para poder hacernos una idea de lo que nos ofrece y cómo trabajar con él.
