Предлагается определение обобщённого графа диалога, с помощью которого описывается структура диалога по корпусу однородных диалогов. Задача построения такого графа является актуальной в современном разговорном искусственном интеллекте, однако работ с конкретными результатами мало, часто не даётся полного описания алгоритмов, не выкладывается код с их реализацией. В настоящей работе предложен метод построения обобщённого графа диалога, который был реализован на языке программирования Python и выложен в открытый доступ. Были проведены эксперименты на открытых данных и описаны их результаты.
Ключевые слова: диалоговая система, обработка естественного языка, граф, граф диалога, кластеризация, представления.
Финальную версию работы можно найти тут
Ноутбук с экспериментами можно найти тут
TODO
A definition of a generalized dialogue graph is proposed, with the help of which the structure of a dialogue is described according to the corpus of homogeneous dialogues. The task of constructing such a graph is relevant in modern conversational artificial intelligence, however, there are few works with meaningful results, often a complete description of the algorithms is not given and the code with the implementation is not published. In this paper, a method for constructing a generalized dialogue graph is proposed, which was implemented in the Python programming language and made publicly available. Experiments were carried out on open data and the results were described.
Keywords: dialogue system, NLP, graph, dialogue graph, clustering, representations.
Last version of paper: link
Notebook with experiments: link
TODO