unaccent -

Документация пользователя

Работа с данными

Интеграционные сервисы

Управление

Управление процессами

Служебные технологические сервисы

Предоставление кворумного ЦОД

Интеграция с инфраструктурой электронного правительства

Производственный процесс

Демопримеры

Интеграционные шлюзы

Эксплуатационная документация

Часто задаваемые вопросы

Глоссарий

Главная

Работа с данными

1.1 Транзакционная СУБД (Цифровой продукт Тип 2)

Расширения

unaccent

Фильтрующий словарь текстового поиска.

Схема размещения: ext.

Модуль представляет фильтрующий словарь текстового поиска, который убирает надстрочные (диакритические) знаки из лексем. Выводимые словарем данные всегда передаются следующему словарю, если он существует. Применяя словарь, можно выполнить полнотекстовый поиск без учета ударений (диакритики).

Конфигурирование словаря unaccent заключается в настройке параметра RULES, который задает базовое имя файла со списком правил преобразования. Этот файл должен находиться в каталоге $SHAREDIR/tsearch_data/ (под $SHAREDIR понимается каталог с общими данными инсталляции PostgreSQL). Имя файла должно заканчиваться расширением .rules. Расширение в параметре RULES не указывается.

Функция unaccent() удаляет надстрочные (диакритические) знаки из заданной строки, представляя собой обертку вокруг словарей в стиле unaccent. Может вызываться и вне обычного контекста текстового поиска.

unaccent([словарь regdictionary,] строка text) returns text

Если аргумент словарь опущен, будет использоваться словарь с именем unaccent, находящийся в той же схеме, что и сама функция unaccent().

Ограничения

Текущую реализацию unaccent нельзя использовать в качестве нормализующего словаря для словаря thesaurus.

Использование модуля

При установке расширения unaccent в базе создается шаблон текстового поиска unaccent и словарь unaccent на его основе. Для словаря unaccent по умолчанию определяется параметр RULES='unaccent', благодаря чему его можно сразу использовать со стандартным файлом unaccent.rules.

Можно изменить этот параметр, например:

ALTER TEXT SEARCH DICTIONARY unaccent (RULES='my_rules');

Протестировать этот словарь можно так:

SELECT ts_lexize('unaccent','Hôtel');