newsare.net
Новый метод может значительно повысить точность и надежность систем машинного обучения. Специалисты из Центра автономии и искусственИнновационный метод делает ИИ умнее, удаляя ошибки до начала обучения
Новый метод может значительно повысить точность и надежность систем машинного обучения. Специалисты из Центра автономии и искусственного интеллекта при Колледже инженерии и компьютерных наук Университета Флориды Атлантик разработали подход, который позволяет автоматически выявлять и удалять ошибки в обучающих данных — еще до того, как модель начнет обучение. Это особенно актуально для таких алгоритмов, как машины опорных векторов (SVM), которые широко применяются в самых разных областях — от диагностики заболеваний и распознавания изображений до анализа текстов и обеспечения безопасности. Машины опорных векторов строят границу между различными классами данных, опираясь всего на несколько ключевых примеров — так называемые опорные векторы. Проблема в том, что даже единственная ошибка в данных, например, если злокачественная опухоль указана как доброкачественная, может исказить всю модель и привести к опасным ошибкам уже обученной языковой модели. Новый подход к обучению помогает избежать таких сценариев, автоматически определяя и устраняя сомнительные или ошибочные метки еще на этапе подготовки данных. Основой технологии стал математический метод — анализ главных компонент сложных данных по норме L1. В отличие от традиционных подходов, которые часто требуют ручной настройки параметров и предположений о характере «шума» в данных, этот метод объективно оценивает, насколько хорошо каждый элемент соответствует остальным в своей категории. Те, что выбиваются из общего паттерна, автоматически помечаются как подозрительные и исключаются из обучающей выборки. Такой подход универсален: он не зависит от типа данных или задачи и не требует вмешательства пользователя, что делает его применение удобным и легко масштабируемым. Read more