0
Исправлен

Стандартизация распознает адрес только по специфической строке

Relines LLC 3 года назад обновлен Антон Жиянов 2 года назад 7

Исходная строка: "Россия Оренбургская Область, пос. Ростоши" распознается как "г Оренбург", что некорректно.

"Ростоши" — вообще не распознается.

Но "Ростоши микрорайон" распознается корректно.


Кажется, это стоит починить.

Ответ

Ответ
Исправлен

Исправили кейсы:


Россия Оренбургская Область, пос. Ростоши

ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ

Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР

Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР

КАНАШСКИЙ РАЙОН КАНАШ Г

На рассмотрении

Спасибо что сообщили! Дадата ориентируется на базу налоговой (ФИАС), в которой есть два посёлка Ростоши (видимо, ошибочно). Причём один из них в определённый момент превратился в Оренбург, что и сбивает с толку Дадату. Посмотрим, что можно сделать.

Еще пример.
"ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ" распознает некорректно.
"ЭСЕ-ХАЙЯ" — все ок.

И еще:

"Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР" — не распознает;
"Пермский край КУДЫМКАРСКИЙ КУДЫМКАР" — нормально.

"Пермский край Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — ок,
"Б. СОСНОВСКИЙ РАЙОН ЧЕРНОВСКОЕ" — почему-то его тянет в Нижегородскую область, хотя до населенного пункта дойти не может.

Во втором примере нет названия региона, а название района написано с ошибкой («б. сосновский» вместо «большесосновский»). Это слишком слабые признаки, чтобы определить адрес.

"КАНАШСКИЙ РАЙОН КАНАШ Г" — не ок;
"КАНАШСКИЙ РАЙОН КАНАШ" — ок.

Ответ
Исправлен

Исправили кейсы:


Россия Оренбургская Область, пос. Ростоши

ВЕРХОЯНСКИЙ ЭСЕ-ХАЙЯ

Пермский край КУДЫМКАРСКИЙ Р-Н КУДЫМКАР

Пермский край КУДЫМКАРСКИЙ РАЙОН Г.КУДЫМКАР

КАНАШСКИЙ РАЙОН КАНАШ Г

Сервис поддержки клиентов работает на платформе UserEcho