Литвин В.В. Спосіб введення метрики для визначення відстані між текстовими документами

УДК 004.89

В.В. Литвин

Національний університет “Львівська політехніка”,
кафедра інформаційних систем та мереж

СПОСІБ ВВЕДЕННЯ МЕТРИКИ ДЛЯ ВИЗНАЧЕННЯ ВІДСТАНІ МІЖ ТЕКСТОВИМИ ДОКУМЕНТАМИ

© Литвин В.В., 2008

Розглянуто метод оцінювання подібності документів на основі введення метрики між концептуальними графами, що є відповідними моделями цих документів. Для цього вводиться поняття центру ваг концептуального графа, а відстань між документами визначається як відстань між їх центрами ваг. Щоб існував шлях між центрами ваг концептуальних графів, відповідні моделі документів доповнююься контекстом з онтології.

This article considers documents similarity evaluation method, using metrics between conceptual graphs – models of these documents. The idea of “center of weight” is used for solving this task. Difference between the documents is calculated as distance between graph’s centers of weight. If the way between centers doesn’t exist document models are expanded with context from ontology.

Кількість публікацій – 7.

Завантажити статтю