в работе Украинский язык в Sphinx

dexer7

Пользователь
#1
Версия TP
2.2.3
Хочу добавить Поиск на украинском языке
Добавил правила в charset_table для украинских букв в секцию index конфига Sphinx
Код:
U+404->U+454, U+454,     Є = є
U+406->U+456, U+456,     І = і
U+407->U+457, U+457,     Ї = ї
U+490->U+491, U+491,     Ґ = ґ
PHP:
charset_table = 0..9, _, A..Z->a..z, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F, U+404->U+454, U+454, U+406->U+456, U+456, U+407->U+457, U+457, U+490->U+491, U+491, U+401->U+435, U+451->U+435, U+002D
После внесения изменений перезапустил сервис и сделал --rotate индекса:
Код:
# service sphinxsearch restart
# indexer --rotate --all
В итоге не ищет с украинскими буквами: і, ї... Русский, английский все Ок.
Може кто подскажет, что не так?
 

Exile

Администратор
#2
dexer7, включите логирование в сфинксе, поисковые запросы до него нормальные доходят или уже резанные?
 

dexer7

Пользователь
#5
Обновился до последнего релиза Sphinx 2.2.11-id64-release
С конфига разработчики убрали:
Код:
sql_query_info, charset_type (в index-е), enable_star и max_matches
Временно вышел из положения с поиском на украинском
PHP:
charset_table = 0..9, _, A..Z->a..z, a..z, U+0410..U+042F->U+0430..U+044F, U+0430..U+044F, U+0404->U+0454, U+0454, U+00CC->U+00EC, U+00EC, U+00CF->U+00EF, U+00EF, U+0490->U+0491, U+0491, U+0401->U+0435, U+0451->U+0435, U+002D
Пока только добавил это с латиницы, с кирилицы не пашет.
Код:
U+00CC->U+00EC, U+00EC,     І = і
U+00CF->U+00EF, U+00EF,     Ї = ї
Ищет с буквами "і" и "ї", но в логах по прежнему режет их.
 
Сверху