Nuevos proyectos de alto nivel de Apache

Publicado el Miércoles, 5 de mayo de 2010
Apache Software Foundation

Apache Software Foundation

La Apache Software Foundation, es una corporación sin fines de lucro con el objetivo de apoyar a proyectos de software libre (publicado bajo la Licencia Apache, que es compatible en su versión 2.0 con la GPL v3). Cuenta con una cantidad de proyectos muy importantes de software libre. Probablemente el más importante Apache HTTP Server, servidor web responsable de gran parte del crecimiento de la internet, que sirve actualmente más de la mitad de todos los sitios web que existen (incluyendo este).

Los desarrolladores voluntarios, administradores e incubadores de 143 proyectos e iniciativas Open Source anunciaron la creación de seis nuevos Proyectos de alto nivel (Top-Level Projects o TLPs). Esto marca un record de la mayor cantidad de TLPs lanzados en un mismo mes. Hay muchas novedades, entre las cuales se encuentra la promoción de Subversion, que entró en la incubadora en noviembre del año pasado.

Como comentaba en aquel post, la incubación es el primer paso para volverse un Proyecto de Alto Nivel de la Apache Software Foundation. Esto significa que obtendrá los beneficios directos desde la fundación como los procesos merocráticos, administración, extensión, soporte y eventos comunitarios.

Los seis proyectos nuevos incluyen proyectos graduados de la incubadora así como sub-proyectos de TLPs existentes. Repasemos los proyectos para conocerlos. Como todos los proyectos de la Apache Software Foundation, son muy interesantes y nunca sabemos cuándo podemos necesitar algo así:

Nuevos proyectos de alto nivel de Apache

Nuevos proyectos de alto nivel de Apache

  • Graduado de la Incubadora Apache
    • Apache Traffic Server - Servidor proxy de cacheo rico en características, rápido, escalable y extensible. Fue donado por Yahoo! a la incubadora en 2009. Sirve contenido estático como imágenes, JavaScript, CSS y HTML, rutea pedidos para contenido dinámico a un servidor web. Es de alto rendimiento, ha demostrado poder manejar más de 75.000 pedidos por segundo, y se usa en despliegues de gran escala como Yahoo! donde maneja más de 400 terabytes de tráfico por día y sirve más de 30 billones de objetos a través de varias propiedades de Yahoo.
  • Ex sub-proyectos de TLPs existentes
    • Apache Mahout - provee implementaciones escalables de algoritmos de aprendizaje automático sobre Apache Hadoop y otras tecnologías. Comenzó como sub-proyecto de Lucene en 2008. El equipo de casi una docena de desarrolladores se encuentra trabajando activamente para lanzar la versión 0.4.
    • Apache Tika - Toolkit integrable, liviano para detección y análisis de contenido. Accionado por estándares MIME, detección avanzada de características de lenguajes y la habilidad de unificar rápidamente bibliotecas analizadoras, Tika provee una ventanilla única para navegar el paisaje moderno de la información. Comenzó en 2007 en la incubadora y se graduó a sub-proyecto de Lucene en 2008. Es usado en varios productos de Lucene como Solr, Nutch y Mahout y ha sido desplegado en la NASA, Day Software, The Internet Archive, entre otros.
    • Apache Nutch - es un motor de búsqueda web altamente modular basado en Lucene Java con agregados específicos de web como crawler, base de datos link-graph y parsers para HTML y otros formatos de documentos. Su arquitectura permite desarrollar plugins para análisis de tipos multimedia, obtención de datos, consultas, clustering y más. Seguido de un sistema a prueba exitoso de 100 millones de páginas, el proyecto se graduó de la incubadora en 2005 para ser un sub-proyecto de Lucene.
    • Apache Avro - es un sistema de serialización de información ágil que incluye esquemas ricos y dinámicos en todos sus procesos. Comenzó como sub proyecto de Hadoop, y consta de estructuras de datos ricas, formato de datos binario compacto y rápido, un archivo contenedor para guardar data persistente, RCP e integración simple con lenguajes dinámicos.
    • Apache HBase - es un sistema de base de datos distribuído modelado como Bigtable de Google. Se volvió un sub-proyecto de Apache Hadoop en 2007. HBase agrega acceso aleatorio de acceso lectura/escritura al stack de Hadoop, extendiendo las capacidades de procesamiento offline y permitiendo el servicio en tiempo real de datasets muy grandes. La meta del proyecto es alojar grandes tables -- billones de filas por millones de columnas -- ejecutándose en hardware de mercancía. Ha sido desplegado exitosamente en Adobe, Flurry, Meetup, Mozilla, StumbleUpon, Tren Micro y Twitter, entre otros, para realizar analíticas y como datastore para sitios web en vivo.

Además, se crearon nuevos proyectos de alto nivel durante 2010:

Proyectos TLP Apache

Proyectos TLP Apache

  • Apache UIMA (Unstructured Information Management Architecture) - es un framework para analizar información desestructurada, como texto en lenguaje natural. Soporta la escritura, despliegue y reutilización de componentes de análisis en una variedad amplia de ajustes. Creado en IBM y presentado en la incubadora en 2006, UIMA ha sido adoptado de-facto por una parte importante de la comunidad de procesamiento de lenguaje natural. Se graduó de la incubadora en marzo de 2010.
  • Apache Cassandra - Es un avanzado almacen de datos distribuido de segunda generación "NoSQL" que tiene una arquitectura de compartir-nada. El modelo descentralizado provee escalabilidad masiva, y de alta disponibilidad sin un solo punto de falla incluso bajo los peores escenarios. Desarrollado originalmente en Facebook y presentado a la incubadora en 2009, se han agregado más de media docena de committers y es desplegado por docenas de usuarios de alto perfil como Cisco WebEx, Cloudkick, Digg, Facebook, Rackspace, Reddit y Twitter. Se graduó de la incubadora en marzo de 2010.
  • Apache Subversion - a los lectores del blog no debería tener que comentarles sobre qué se trata, ya que incluso hablamos del envío de Subversion a la incubadora de Apache:
    Es un sistema de control de versiones de amplio uso. Se inició en 2000 en CollabNet y fue aceptado en la incubadora en 2009. Muchas de las personas que fundaron Subversion contribuyen activamente a varias iniciativas de la ASF. Todos los proyectos de la fundación usan Subversion para control de versiones de código fuente, y Subversion se basa en muchos proyectos Apache como Apache Portable Runtime (APR) y el servidor HTTP Web Server. Por casi una década ambas comunidades se han beneficiado de canales de comunicación bilateral abiertos, donde los requerimientos del proyecto Subversion han ayudado a llevar nuevas características a varios proyectos Apache y viceversa. Apache Subversion se usa en Bounty Source, CodePlex, Django, ExtJS, FreeBSD, FreePascal, GCC, Google Code, MediaWiki, Mono, PHP, Ruby, SourceForge y Tigris.org así como en muchas corporaciones (agrego que es el sistema de control de versiones que vengo usando de forma académica y profesional desde que conocí los SCV). En febrero de 2010 se graduó de la incubadora.
  • Apache Click - es un moderno framework de aplicaciones web en Java EE que provee un modelo de programación natural al estilo cliente rico. Su diseño intuitivo lo hace fácil de aprender y usar, con la mayoría de los desarrolladores saliendo programando en un día. A diferencia de los frameworks web tradicionales orientados a componentes, Click es stateless por diseño aunque se soportan páginas stateful. Expone pocas abstracciones para aprender y entender; la API de Java Servlet se expone completamente al desarrollador para facilitar el camino de migración de un framework basado en acción a uno de componentes para aliviar a los desarrolladores de mantener marcado redundante. Entró en la incubadora en 2008 y se graduó en febrero de 2010.
  • Apache Shinding - Contenedor para OpenSocial que permite comenzar a hostear aplicaciones OpenSocial rápidamente suminstrando el código para renderizar gadgets, pedidos de proxy y manejar pedidos REST y RPC. Al proveer una infraestructura de lenguaje neutral para aquellos que deseen albergar aplicaciones OpenSocial en sus sitios web, Shinding permite hacerlo en nuevos sitios en menos de una hora. Creado originalmente como un port del contenedor de gadgets de Google iGoogle para albergar widgets compatibles con OpenSocial en cualquier sitio, entró en la incubadora en 2007 y se graduó en 2010.

Algunos ya los conocía, otros solo los había leído, y otros no tenía ni idea. Sin dudas es bastante importante lo que hace la fundación Apache por el progreso del desarrollo de software en varios campos. Imprescindible estar al tanto de todos estos proyectos, un recurso invalorable para programadores.

Todos los proyectos son publicados bajo la Licencia Apache 2.0, licencia de software libre compatible con GPL v3.

5 comentarios en este post

Feed de comentarios
  1. Avatar

    Isra 7 mayo. 2010 - 12:05

    Genial! Sin duda Cassandra es uno de los proyectos que más “buzz” ha generado en los últimos meses, con la moda de NoSQL y el hecho de que provenga de Facebook.

    Interesantes tambíen Traffic Server (muuuy interesante ;-), Mahout y Click, que no los conocía.

    Ánimo con el blog.

  1. Nuevos proyectos de la Fundación Apache (ENG) | 5 mayo. 2010 - 14:50

    […] Vía Barrapunto (softlibre.barrapunto.com/article.pl?sid=10/05/05/1422258s) Detalles en Español (picandocodigo.net/2010/nuevos-proyectos-de-alto-nivel-de-apache/) sin comentarios en: tecnología, software libre karma: 7 etiquetas: apache, proyectos […]

  2. Nuevos proyectos de alto nivel de Apache « Conocimiento Libre (o lo que está detrás del Software Libre) | 17 mayo. 2010 - 01:03

    […] Mayo 2010 por Ricardo Pluss Fuente: picando código via […]

Dejar un comentario

Toasty!