Искусственный интеллект научился предсказывать решения Европейского суда по правам человека о перспективах поступивших к нему жалоб с точностью до 79 процентов. Добиться такого результата удалось благодаря алгоритму, специально разработанному учеными из Великобритании и США. Статья исследователей опубликована в журнале Computer Science.
Европейский суд по правам человека, известный также как Страсбургский суд, — это международный судебный орган, который занимается рассмотрением жалоб на нарушение основополагающих прав человека. Статистика показала, что в прошлом году в Страсбургский суд было подано в два раза больше жалоб, чем в 2014 году. Большинство заявлений не были приняты к рассмотрению, так как они были либо неправильно составлены, либо решения по ним уже были приняты, либо в тексте не содержалось состава преступления. В итоге только 15 процентов от общего числа обращений дошли до суда.
Поток заявлений в Страсбургий суд увеличивается с каждым годом, а судьям необходимо выбирать из них только достойные внимания. Чтобы решить эту проблему, авторы новой статьи создали искусственный интеллект, который сможет анализировать заявления в автоматическом режиме. Для этого исследователи использовали SVM-классификатор, обученный с помощью дел по трем статьям Конвенции о защите прав человека:
статье 3 о запрете пыток и обращения, унижающего достоинство человека;
статье 6 о праве на справедливое судебное разбирательство;
статье 8 об уважении частной жизни.
SVM-метод, или метод опорных векторов, позволяет классифицировать случаи (в данном случае судебные дела), представляя их подробности как данные в многомерном пространстве. Задача обучения классификатора при этом сводится к поиску такой многомерной плоскости, которая разделила бы эти случаи с минимальной ошибкой. Классификатор в итоге определяет, к какому классу из как минимум двух изначально известных (здесь «нарушение» или «отсутствие нарушения») относится данный объект.
Текст каждого дела был разделен на несколько категорий: общие сведения об истце и жалобе, юридические факты и закон, позволяющий рассмотреть дело по существу. Категория «юридические факты» состояла из двух подразделов — описание событий и действий, которые привели к нарушению прав, и правовые нормы вне Конвенции о защите прав человека, которые распространяются на эти действия. Из этих категорий были извлечены слова (N-граммы), на основе которых для каждого дела был также составлен список тем, которые эти слова объединяют (например, доказательства или условия содержания под стражей). В процессе тренировки алгоритм учился находить как в полном тексте, так и в категориях и темах слова, которые указывают на наличие нарушения. Чтобы система смогла это сделать, делам было присвоено значение либо −1, либо +1, показывающее программе, признал ли суд наличие правонарушения. Всего ученые для своей работы использовали 584 дела: девяносто процентов из них использовались для тренировки системы, а десять — для ее теста.
В результате проверки алгоритму удалось достигнуть точности в 79 процентов. В этом случае система одновременно анализировала слова по тематикам и слова из подкатегории «описание событий и действий, которые привели к нарушению прав». Авторы работы уверены, что в будущем подобный алгоритм научится помогать суду при отборе и сортировке дел по важности, однако сейчас он еще далек от совершенства. Предварительно системе предстоит пройти множество проверок на большем массиве данных и на обращениях, которые еще не были рассмотрены судом.
Ранее исследователи использовали SVM-машину для поиска записей в Twitter, оставленных нетрезвыми пользователями, и для определения по тексту, где именно пользователи находятся в данный момент. В частности, система смогла определить, выпивают пользователи дома или где-нибудь еще, с точностью до 70 процентов. В будущем ученые планировали научить программу по твитам определять возраст, пол, этническую принадлежность и другие характеристики пользователей.
Комментарии