Стандартизация распознает адрес только по специфической строке
Исходная строка: "Россия Оренбургская Область, пос. Ростоши" распознается как "г Оренбург", что некорректно.
"Ростоши" — вообще не распознается.
Но "Ростоши микрорайон" распознается корректно.
Кажется, это стоит починить.
Ответ
Спасибо что сообщили! Дадата ориентируется на базу налоговой (ФИАС), в которой есть два посёлка Ростоши (видимо, ошибочно). Причём один из них в определённый момент превратился в Оренбург, что и сбивает с толку Дадату. Посмотрим, что можно сделать.
Еще пример.
"ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ" распознает некорректно.
"ЭСЕ-ХАЙЯ" — все ок.
И еще:
"Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ КУДЫМКАР" — нормально.
"Пермский край Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — ок,
"Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — почему-то его тянет в Нижегородскую область, хотя до населенного пункта дойти не может.
Во втором примере нет названия региона, а название района написано с ошибкой («б. сосновский» вместо «большесосновский»). Это слишком слабые признаки, чтобы определить адрес.
Исправили кейсы:
Россия Оренбургская Область, пос. Ростоши
ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ
Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР
Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР
КАНАШСКИЙ РАЙОН КАНАШ Г
Сервис поддержки клиентов работает на платформе UserEcho
Исправили кейсы:
Россия Оренбургская Область, пос. Ростоши
ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ
Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР
Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР
КАНАШСКИЙ РАЙОН КАНАШ Г