Разное распознавание адреса с течением времени
Добрый день.
Столкнулись со следующей проблемой:
В ноябре стандартизация получила на вход адрес
423440, РФ, РТ, г.Альметьевск, ул. 8 марта, 18 б
и распознала его как
Россия, Респ Татарстан, Альметьевский р-н, пгт Нижняя Мактама, ул 8 Марта, д 18Б
Сегодня заметили, что то же самое она распознает как
Респ Татарстан, г Альметьевск, ул 8 Марта, д 18Б
В чем причина такого поведения? Почему разный результат в разное время?
Ответ
Добрый день!
От релиза к релизу мы улучшаем алгоритмы и стараемся распознавать адреса точнее.
Скажите, а в чем проблема?
Новое распознавание корректнее старого – в исходном адресе четко указан Альметьевск. В старом распознавании этот адрес скорее всего получал код качества "Сомнительный", и разбирался не в Альметьевск. Сейчас мы разбираем его уверенно в нужный город.
Проблема в том, что теперь по сути это два разных объекта. Мы получаем отчеты дистрибуторов по отгрузкам в торговые точки. И нам нужно получать из некоторого количества "грязных" адресов одинаковые чистые. Для нас было бы лучше, если бы оба раза они распознались не корректно, но ОДИНАКОВО.
Процент адресов, распознавание которых меняется, очень маленький. Но не улучшать алгоритмы и распознавание мы не можем. Плюс адреса со временем тоже эволюционируют (меняются названия, меняются вышестоящие субъекты).
Более того, сервис вернул код качества 1 при распознавании в Россия, Респ Татарстан, Альметьевский р-н, пгт Нижняя Мактама, ул 8 Марта, д 18Б
Сервис поддержки клиентов работает на платформе UserEcho
Процент адресов, распознавание которых меняется, очень маленький. Но не улучшать алгоритмы и распознавание мы не можем. Плюс адреса со временем тоже эволюционируют (меняются названия, меняются вышестоящие субъекты).