Цель исследования. Представленное в данной статье исследование проведено в рамках проекта Salebot.pro (на ресурсе https://salebot.pro) и было нацеленона разработку простой и эффективной реализации диалоговой системы.Методы. План исследования предусматривал анализ различных методов обработки естественных языков и машинного обучения. Реализации методов были взяты из популярных библиотек с открытым исходным кодом. Построена модель диалоговой системы в двух вариантах: на основе фреймворка Spacy и метрического алгоритма оценки, на основе расстояния Левенштейна. Сравнивались простота реализации и затраты на обучение системы и персонала. Результаты. Описанные в статье алгоритмы сопоставляют наиболее похожие слова из двух текстов и подсчитывают средний процент совпадений. Такой подход обеспечивает возможность приемлемой работы на языках со свободным порядком слов, к которым относится и русский язык. Выполненное исследование позволило разработать алгоритм автоматизированного обучения диалоговых систем в режиме реального времени без потери контекста. На той же основе разработан алгоритм обучения диалоговой системы по истории диалога. Предлагается использовать данные алгоритмы совместно. При создании диалоговой системы первоначально необходимо ее обучить на истории диалогов, а затем перманентно обучать в режиме реального времени.Заключение. Достоинством разработанного алгоритма является легкость в реализации и дешевизна построения инфраструктуры, необходимой для обучения модели, и ее обслуживания, а также простота в эксплуатации. Применяется подход, который отличается от обучения с учителем, что позволяет ускорить процесс обучения и ввода в систему новых данных. Особенностью разработанных алгоритмов является игнорирование семантики текста, что делает обучение автоматизированным, а не автоматическим.
展开▼