Описание Сервиса

Средства (системы) управления базами данных (СУБД) – программы, которые должны предоставлять возможность организации и ведения баз данных, в том числе с использованием технологии распределенного реестра.
Класс программного обеспечения СУБД по Классификатору программ для электронных вычислительных машин и баз данных (приказ Минкомсвязи России от 22.09.2020 № 486) должен соответствовать коду «02.07 Средства управления базами данных» (или «02.09 Системы управления базами данных» по классификатору, утвержденному приказом Минкомсвязи России от 31.12.2015 № 621).
«Сервис СУБД хранения неструктурированных данных (услуга 1.7)»:
  • обеспечивает Пользователю возможность создавать новые базы данных с идентичной логической структурой данных (деление по темам);
  • позволяет записывать, хранить, находить, редактировать и считывать данные;
  • обеспечивает модификацию базы данных;
  • позволяет осуществлять ввод основной массы данных посредством считывания (записи) массива данных;
  • обеспечивает контроль достоверности вводимых данных в каждом поле таблиц базы данных (обязательное поле, умолчание, шаблон и т.д.);
  • обеспечивает нахождение слов, выделение, просмотр и редактирование таблиц базы данных с удобным графическим интерфейсом;
  • обеспечивает резервное копирование всех данных кластера базы данных автоматически и с заданной регулярностью.
Основные операции, которые выполняет Сервис:
  • операции с наборами: объединение, пересечение, различие;
  • выбор подмножества записей согласно определенным критериям;
  • проецирование – выбор подмножества атрибутов / колонок таблицы;
  • сцепление;
  • операции для создания, модификации и удаления схем таблиц;
  • операции для управления транзакциями и управления Пользователями;
  • резервное копирование базы данных.
Сервис соответствует следующим основным требованиям:
  • программное обеспечение, использованное для реализации Сервиса, включено в Реестр отечественного ПО и/или имеет действующий сертификат ФСТЭК России;
  • поддерживает протокол подключения JDBC;
  • обеспечивает возможность поддержки работы в кластере из нескольких серверов;
  • обеспечивает возможность сегментирования данных;
  • работает в мультикластерном режиме с разделением ролей на подкластеры: управление узлами (NameNode), хранение данных (DataNode), подкластеры обработки данных (YARN NodeManager);
  • поддерживает фреймворки обработки больших данных: Tez, MapReduce;
  • поддерживает фреймворк микропакетной обработки больших данных Spark;
  • поддерживает службы, обеспечивающие взаимодействие через REST-интерфейс;
  • поддерживает декомиссию хостов без остановки и прерывания рабочей нагрузки;
  • имеет поддержку автоматического распределения данных между серверами кластера и возможностью балансировки нагрузки на серверах кластера;
  • обеспечивает возможность хранения данных как в реляционном виде, так и в виде файлов в распределённой иерархической сетевой файловой системе;
  • обеспечивает высокую доступность для следующих Сервисов: HDFS, MapReduce, YARN;
  • имеет версионную нереляционную распределённую базу данных, работающую поверх HDFS;
  • имеет СУБД для выполнения SQL-подобных запросов и анализа данных, хранящихся на HDFS;
  • имеет встроенную систему развертывания и управления.
Предыдущий раздел
Минимальные требования к виртуальным вычислительным рес...
Следующий раздел
Состав Сервиса
Была ли страница полезной?