О сервисе
Сервис СУБД полнотекстового индекса (услуга 1.4) позволяет легко получать, искать, агрегировать, просматривать и анализировать данные для различных сценариев использования и включает в себя свободно распространяемое программное обеспечение OpenSearch v2.5.0.
OpenSearch — это поисковая и аналитическая система, основанная на базе поисковой библиотеки Apache Lucene, с интегрированным инструментом визуализации OpenSearch Dashboards.
Подобно базам данных и таблицам в реляционных базах данных, OpenSearch использует индексы для организации данных. Каждый индекс представляет собой набор документов в формате JSON.
К данным, добавленным в Сервис, применим полнотекстовый поиск со следующими функциями:
- поиск по полю и индексам;
- сортировка результатов по полю;
- агрегирование результатов.
Дополнительно Сервис предоставляет пользователю следующие возможности:
- создавать новые индексы и шаблоны индексов;
- записывать, хранить, редактировать данные;
- выполнять резервное копирование индексов.
Сервис имеет несколько плагинов и функций, которые помогают индексировать, отслеживать и анализировать данные.
Название плагина | Описание |
---|---|
Anomaly Detection | Позволяет выявить нетипичные данные практически в режиме реального времени с использованием алгоритма Random Cut Forest (RCF) и настроить получение автоматических уведомлений |
Index Management | Позволяет настроить пользовательские политики по автоматизации рутинных задач управления индексами |
Visualize | Позволяет графически отображать анализируемые данные |
Reporting | Позволяет настраивать выгрузку отчетов анализа данных, включая выгрузку по расписанию |
Query WorkBench | Позволяет взаимодействовать с OpenSearch через синтаксис SQL |
Alerting | Позволяет настраивать уведомления на основе проанализированных данных |
Интегрированный инструмент визуализации OpenSearch Dashboards обеспечивает просмотр, экспорт, визуализацию и анализ данных, а также работу с большинством плагинов Сервиса.
Минимальная конфигурация Сервиса обеспечивает:
- полезный объем дискового пространства - 1/2 объема дискового пространства, выделенного для хранения данных Потребителей, за счет избыточной записи (фактор репликации 2), необходимой для обеспечения требований к надежности и доступности не менее 99.5 %;
- возможность разделения индексов на «горячие», «теплые» и «холодные»;
- возможность задания политик управления жизненным циклом индексов;
- возможность выполнения структурированных запросов (SQL-like по точному совпадению) и полнотекстовых запросов (поиск похожих строк и сортировка по релевантности).