Ultimos Posts 1. 18/11/2009 09:35 - Tip de rendimiento: usar compresión lzo para archivos de entrada en hadoop Kevin Weil de Twitter (a quien mencioné en mi entrada anterior) acaba de publicar en el blog de Cloudera un tutorial sobre como usar archivos con compresión LZO . La compresión LZO resulta más adecuada que los algoritmos gzip y bz2 para el procesamiento masivo de datos con Hadoop. Gzip no puede ser usado en Hadoop porque un bloque (chunk) independiente de un gran archivo no puede d... 2. 16/11/2009 08:33 - Reduce empezando antes que termine map En los gráficos que ilustran las implementaciones MapReduce podemos ver una “barrera” entre la fase Map y la Reduce. Una “barrera” es un mecanismo de sincronización entre procesos que espera a que todos los procesos de un lado de la barrera terminen antes que empiecen los procesos del otro lado. En este caso, eso significa que la fase Map debe terminar antes... 3. 05/11/2009 08:43 - Alternativa al plug-in de hadoop para eclipse En clase algunos tuvieron problemas con el plug-in de Hadoop para Eclipse. Este problema se debe a que el mantenimiento del plug-in ha sido descontinuado. Leí en un e-mail (y respuestas ) enviado a la lista common-user de Hadoop y se puede solucionar el problema re-compilando el plug-in. Pero al parecer una mejor alternativa sería trabajar con el Karmasphere Studio for Hadoop basad... 4. 12/10/2009 09:33 - Errores en memoria dram pueden afectar a data centers Un estudio reciente publicado por una profesora de la Universidad de Toronto y gente de Google ha encontrado que los errores en memoria DRAM (memoria principal) son mucho más comúnes de lo que se pensaba anteriormente. Esto tiene implicaciones importantes en los sistemas actuales, sobre todo para data centers implementados con componentes de bajo costo (los cuales vienen sin mecani... 5. 22/07/2009 15:53 - Hadoopdb Un artículo publicado en Computerworld indica que un equipo de investigadores de Yale (que incluye a Silberchatz , el autor del libro que uso en la materia Sistemas Operativos) han desarrollado un híbrido entre una base de datos relacional y Hadoop, denominada HadoopDB . Según uno de los profesores del equipo de investigación HadoopDB, se diferencia de otros productos comerciales e... | Estadisticas Ver Codigo HTML Posicion del Blog en Nuestro Ranking Hits Semanales Hits Mensuales |