Фонд apache пополнил список своих проектов распределённой реляционной субд

Фонд Apache (Apache Software Foundation), под руководством которого разрабатываются такие серьёзные ответы, как Hadoop и Spark, заявил о присоединении распределённой реляционной совокупности управления базами данных Tajo к перечню собственных главных проектов.

Не обращая внимания на относительную малоизвестность, Tajo – отнюдь не новый проект. Его разработка стартовала около трёх лет назад в университете Кореи, а в марте 2013 года Tajo стала частью Apache Incubator. Более того, это решение внедряют на практике. В число его активных пользователей входит корпорация SK Telecom – один из наибольших южнокорейских операторов сотовой связи.

Tajo представляет собой распределённую СУБД, выстроенную на базе Hadoop. Она абсолютно реализует стандарты ISO и ANSI на язык запросов SQL, используемый классическими реляционными СУБД, но за счёт применения Hadoop хранение данных и выполнение запросов легко распределяется по любому количеству серверов.

В соответствии с описанию, размещённому на сайте проекта, Tajo снабжает низкую задержку при обработке запросов и поддерживает процесс ETL (Extract-Tranform-Load) – извлечение, загрузку и подготовку информации из вне.

Кроме исходной группы разработчиков из университета Кореи, в создании Tajo принимают участие эксперты LinkedIn и компании Hortonworks.

Tajo – не единственное ответ для того чтобы рода. За последние несколько лет собственной реализацией SQL, трудящейся поверх Hadoop, обзавелись многие компании, специализирующиеся на “громадных данных”. Подобные СУБД разрабатывают в IBM, Cloudera и Pivotal. Инженеры Facebook создали пара распределённых реляционных СУБД: от Hive, реализующего упрощённое подмножество команд SQL, до Presto, показавшегося в конце прошлого года и поддерживающего SQL уже без всяких скидок.

Это демонстрирует, что бум NoSQL, длившийся в течение нескольких лет, если не подходит к концу, то по крайней мере переходит в другую стадию. В своё время концепция NoSQL показалась как реакция на сложность масштабирования классических реляционных СУБД. Отказ от некоторых возможностей SQL упростил масштабирование, но привёл к другим. Преодоление этих неприятностей и стало причиной созданию таких продуктов, как Hive, Presto либо Tajo, каковые сохраняют солидную часть преимуществ NoSQL, не жертвуя наряду с этим и преимуществами SQL.

Случайное видео:


Интересные записи: