Відкрито вихідний код бази даних Greenplum - просунутого warehouse на базі PostgreSQL
1 2
Greenplum DB
Ілюстрація з сайту Greenplum
Вчора, 28 жовтня, стало відомо про відкриття вихідного коду бази даних Greenplum Database (GPDB), що позиціонується як просунутий повнофункціональний Open Source-сховище даних (warehouse) на основі вільної СУБД PostgreSQL.
Greenplum - СУБД, створена однойменною компанією, яка була в 2010 році куплена EMC Corporation, а в 2013 році перейшла до Pivotal Software. Відкриття коду GreenplumDB (GPDB) було анонсовано Pivotal ще в лютому, і тепер це стало реальністю: проект отримав свій сайт, а вихідні опубліковані на GitHub під вільною ліцензією Apache License v2. Greenplum забезпечує потужну та швидку аналітику по величезних масивів даних і, як стверджують розробники, використовує «найбільш просунутий в світі оптимізатор запитів на основі оцінки їх вартості».
Основою для GPDB служить вільна СУБД PostgreSQL, функціональні можливості якої були розширені за допомогою:
- архітектури для масової паралельної обробки даних (автоматичне розпаралелювання всіх даних і запитів),
- технології MPP для високої продуктивності в масштабах петабайт,
- інноваційного оптимізатора запитів (його аналітичні можливості масштабируются на великі набори даних без шкоди продуктивності і пропускної здатності),
- поліморфного (орієнтованого на стовпці або рядки) сховища і обробки даних,
- просунутого машинного навчання на базі бібліотеки Apache MADLib.
Кластер Greenplum складається з майстер-сервера, в якому зберігаються тільки метадані, і безлічі «сегментних» серверів, де знаходяться всі призначені для користувача дані. Всі сервери використовують одну і ту ж схему БД.
Подробиці про GPDB, документація по проекту та анонси подій, пов'язаних з ним, доступні на greenplum.org .
Постійне посилання до новини: https://www.nixp.ru/news/13630.html . Дмитро Шурупів за матеріалами Greenplum .