
На прошедшей в Лондоне церемонии награждения MediaGuardian Innovation Awards, премия «Новатор года», ежегодно присуждаемая наиболее инновационным продуктам и технологиям, была вручена проекту Apache Hadoop.
При вручении премии Apache Hadoop был отождествлен со швейцарским армейским ножом 21 века и назван проектом, обладающим потенциалом, способным полностью изменить лицо медиа–технологий по всему миру. Среди финалистов, уступивших пальму первенства, отмечены проекты WikiLeaks и iPad.
Hadoop является свободной платформой для организации распределенной обработки больших объемов данных (петабайты) с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. В состав Hadoop входит также реализация распределенной файловой системы Hadoop Distributed Filesystem (HDFS), автоматически обеспечивающей резервирование данных и оптимизированной для работы MapReduce–приложений.
Для упрощения доступа к данным в Hadoop хранилище разработана БД HBase и SQL–подобный язык Pig, который является своего рода SQL для MapReduce, запросы которого могут быть распараллелены и обработаны несколькими Hadoop–платформами.