Выбирая продукт, решающий задачу автоматического склонения, мы в первую очередь ожидаем от него высокого качества основной его функции – склонения. Чем меньше ошибок будет делать алгоритм, тем меньше потребуется ручной правки, тем больше уверенность, что он не подведет в условиях "беспилотной" эксплуатации, когда контроль со стороны человека невозможен.
В данной статье описывается методика и результаты тестирования Технического решения "Библиотека функций склонения". Проверке подвергся функционал склонения фамилий, имен и отчеств. На самом деле, каждый продукт индивидуален и реализует свой уникальный набор функций. Но большинство существующих решений реализуют функцию склонения ФИО. Именно она и была проверена в данном исследовании. Отметим, что на этом функционал исследуемого технического решения не ограничивается, подробнее с ним можно ознакомиться здесь.
Методика тестирования.
Для тестов использовался набор из:
Тест считается пройденным, если ответ на запрос (ФИО в именительном падеже, номер падежа) совпадает с правильным ответом. Мерой качества сервиса склонения принимается процент правильных ответов.
Тесты были взяты из программы для тестирования существующих на рынке продуктов по склонению ФИО (ссылка внизу материала), которые в свою очередь были составлены вручную, и в рамках тестирования предполагается их правильность. На деле, конечно, они правильны с точностью до человеческих ошибок составителя. При составлении тестового набора избегались примеры, допускающие неоднозначное склонение, например, женская фамилия Смородина в родительном падеже может быть (кого?) Смородиной или Смородины.
Всего в тестовом наборе около 1000 тестов. Все ФИО были взяты из Интернета – из списков выпускников, военнослужащих, депутатов и т.п., поэтому есть уверенность, что они не выдуманные, а принадлежат реальным людям. Все ФИО трёхчленные, так как некоторые сервисы полагаются на отчество при определении рода или требуют явного указания рода.
При сравнении ответов допускаются некоторые послабления. А именно, считаются одинаковыми буквы Е и Ё, игнорируются пробелы, вставляемые некоторыми сервисами в конце строки, не учитывается регистр букв, не учитывается наличие или отсутствие предлога у формы предложного падежа.
Например, при склонении «ИВАНОВ Илья Петрович» в творительном падеже различные сервисы выдают следующие результаты:
Яндекс: | «ИВАНОВым Ильей Петровичем» |
Крохотулька: | «Ивановым Ильей Петровичем » (лишний пробел в конце) |
Морфер: | «ИВАНОВЫМ Ильёй Петровичем» |
Padeg.dll: | «Ивановым Ильей Петровичем» |
Все они признаются одинаковыми программой тестирования.
Результаты тестирования.
Тестирование ТР "Библиотеки функций склонения" показало великолепные результаты! Правильность преобразования составила более 99%.
Для сравнения:
Продукт | Процент ошибок |
Морфер: | 1.5% |
Padeg.dll: | 2.3% |
Крохотулька: | 16.3% |
Яндекс: | 50.3% |
Библиотека функций склонения: | 0.76% |
Вы можете проверить на качество преобразования имеющееся решение по склонению ФИО у себя, разработка для тестирования доступна для скачивания ниже.
Материал составлен как ответ на некоторые вопросы, с использованием статьи по сравнению с аналогами.
Разработка для тестирования своего "склонятора": TestDECLLibrary.rar (379,56 Кб)
Подобный материал, но в значительно более подробном варианте, с примерами использования итд. Уже публиковал Дмитрий Тарасов.
Забыл линк приложить:
http://club.directum.ru/post/Sklonenie-FIO-dolzhnostejj-i-podrazdelenijj-po-padezham.aspx
Николай, Дмитрий в своем материале описывает функциональность решения, данный же материал описывает методику сравнения эффективности решений по склонению ФИО. Разные темы.
Забавно, директумовский склонятор кому-то помешал
Чтобы не было неоднозначности, в посте выше под фразой "директумовский склонятор" я имел ввиду "склонятор написанный на isbl".
Сергей, ссылка на Ваш материал присутствует в данной статье с самого ее создания. Никто и не оспаривает, что она взята за основу.
Относительно тестирования, могу заверить, специально ничего не подгонялось. Тесты были использованы в том виде как есть.
Иначе, следуя Вашей же логике, ровно с той же вероятностью, что сейчас говорите, можно утверждать что Ваш продукт, относительно данных тестов, показывает именно такие "любые результаты", ведь Вы какраз имеете на руках тестовые данные при сравнении продуктов, включая свой. Доверие? хм... полностью описанная Вами же ситуация. При этом у Вас большой потенциальный рынок и неспящие конкуренты, соблазн велик показать превосходство...
Применения данного набора тестовых данных, вместо составления собственного, было произведено по следующим причинам: а. тесты общественные, доступны всем для собственного тестирования и проверки; б. при составлении собственной выборки больше вероятность подгона нужных данных; в. экономия времени при составлении такого объема данных.
Относительно цен, в настоящий момент они пересматривается.
Авторизуйтесь, чтобы написать комментарий