Описание Сервиса
Средства (системы) управления базами данных (СУБД) – программы, которые должны предоставлять возможность организации и ведения баз данных, в том числе с использованием технологии распределенного реестра.
Класс программного обеспечения СУБД по Классификатору программ для электронных вычислительных машин и баз данных (приказ Минкомсвязи России от 22.09.2020 № 486) должен соответствовать коду «02.07 Средства управления базами данных» (или «02.09 Системы управления базами данных» по классификатору, утвержденному приказом Минкомсвязи России от 31.12.2015 № 621).
«Сервис СУБД хранения неструктурированных данных (услуга 1.7)»:
- обеспечивает Пользователю возможность создавать новые базы данных с идентичной логической структурой данных (деление по темам);
- позволяет записывать, хранить, находить, редактировать и считывать данные;
- обеспечивает модификацию базы данных;
- позволяет осуществлять ввод основной массы данных посредством считывания (записи) массива данных;
- обеспечивает контроль достоверности вводимых данных в каждом поле таблиц базы данных (обязательное поле, умолчание, шаблон и т.д.);
- обеспечивает нахождение слов, выделение, просмотр и редактирование таблиц базы данных с удобным графическим интерфейсом;
- обеспечивает резервное копирование всех данных кластера базы данных автоматически и с заданной регулярностью.
Основные операции, которые выполняет Сервис:
- операции с наборами: объединение, пересечение, различие;
- выбор подмножества записей согласно определенным критериям;
- проецирование – выбор подмножества атрибутов / колонок таблицы;
- сцепление;
- операции для создания, модификации и удаления схем таблиц;
- операции для управления транзакциями и управления Пользователями;
- резервное копирование базы данных.
Сервис соответствует следующим основным требованиям:
- программное обеспечение, использованное для реализации Сервиса, включено в Реестр отечественного ПО и/или имеет действующий сертификат ФСТЭК России;
- поддерживает протокол подключения JDBC;
- обеспечивает возможность поддержки работы в кластере из нескольких серверов;
- обеспечивает возможность сегментирования данных;
- работает в мультикластерном режиме с разделением ролей на подкластеры: управление узлами (NameNode), хранение данных (DataNode), подкластеры обработки данных (YARN NodeManager);
- поддерживает фреймворки обработки больших данных: Tez, MapReduce;
- поддерживает фреймворк микропакетной обработки больших данных Spark;
- поддерживает службы, обеспечивающие взаимодействие через REST-интерфейс;
- поддерживает декомиссию хостов без остановки и прерывания рабочей нагрузки;
- имеет поддержку автоматического распределения данных между серверами кластера и возможностью балансировки нагрузки на серверах кластера;
- обеспечивает возможность хранения данных как в реляционном виде, так и в виде файлов в распределённой иерархической сетевой файловой системе;
- обеспечивает высокую доступность для следующих Сервисов: HDFS, MapReduce, YARN;
- имеет версионную нереляционную распределённую базу данных, работающую поверх HDFS;
- имеет СУБД для выполнения SQL-подобных запросов и анализа данных, хранящихся на HDFS;
- имеет встроенную систему развертывания и управления.