Чирун Л. Б., Кучковський В. В., Висоцька В. А. Особливості методів контент-аналізу текстових масивів даних web-ресурсів у межах регіону

УДК 004.738.5

Л. Б. Чирун, В. В. Кучковський, В. А. Висоцька
Національний університет “Львівська політехніка”,
кафедра інформаційних систем та мереж

ОСОБЛИВОСТІ МЕТОДІВ КОНТЕНТ-АНАЛІЗУ ТЕКСТОВИХ МАСИВІВ ДАНИХ WEB-РЕСУРСІВ У МЕЖАХ РЕГІОНУ

© Чирун Л. Б., Кучковський В. В., Висоцька В. А., 2015

Описано метод інтегрованого опрацювання неоднорідних інформаційних ресурсів web-систем, який ґрунтується на моделі подання даних як узгодженого поєднання значень, правил їх зображення, правил інтерпретації та структури. Метод передбачає декомпозицію загального процесу на підпроцеси інтеграції значень, синтаксису даних, семантики і структури. Перевагою такого підходу до інтеграційних процесів є можливість їх виконання на рівні метасхем даних, що зменшує кількість звернень до власне даних web-систем, обсяги яких можуть бути значними. У статті запропоновано модель життєвого циклу контенту в системах електронної комерції. Модель описує процеси опрацювання інформаційних ресурсів у системах електронної контент-комерції та спрощує технологію автоматизації управління контентом. У роботі проана¬лізовано основні проблеми електронної комерції та функціональних сервісів управління контен¬том. Запропоновано метод управління комерційним контентом як етап життєвого циклу контенту в системах електронної комерції. Метод управління комерційним контентом описує процеси формування інформаційних ресурсів у системах електронної контент-комерції та спрощує технологію управління комерційним контентом. У цій роботі проаналізовано основні проблеми електронної контент-комерції та функціональних сервісів опрацювання комерційного контенту. Запропонований метод дає можливість створити засоби опрацювання інформаційних ресурсів у системах електронної контент-комерції та реалізувати підсистему управління комерційним контентом. Розглянуто питання розроблення методів та програмних засобів опрацювання інформаційних ресурсів у інтернет-системах. Сформульовано новий підхід застосування та впровад¬ження бізнес-процесів для побудови таких систем. Розроблено методи та програмні засоби опрацювання контенту та інформаційного ресурсу.
Ключові слова: контент, інформаційний ресурс, комерційний контент, контент-аналіз, життєвий цикл контенту, контент-моніторинг, контентний пошук, система електронної контент-комерції, web-ресурс, значення даних, інтеграція даних, розподілені системи даних, неоднорідні дані, бізнес-процес, система управління контентом, життєвий цикл контенту.

In the paper the method of integrated processing of heterogeneous information resources web-systems is described. This method is based on the model of data description as a coherent combination of data values, rules of data representation, interpretation rules and data structure. The method involves decomposition of general process into subprocesses of data values integration, data syntax integration, semantics and structure integration. The advantage of this approach is that the integration process can be performed at data metascheme level. It allows to reduce the number of access operation to very large data sets of web-systems. In the given article content lifecycle model in electronic commerce systems is proposed. The model describes the processes of information resources processing in the electronic content commerce systems and simplifies the content automation management technology. In the paper the main problems of e-commerce and content function management services are analyzed. The method of commercial content management as the content life cycle stage in electronic commerce systems is proposed. The method of commercial content management describes the information resources forming in electronic content commerce systems and automation technology that simplifies the commercial content management. The main problems of electronic content commerce and functional services of commercial content management are analyzed. The proposed method gives an opportunity to create an instrument of information resources processing in electronic commerce systems and to implement the subsystem of commercial content management. The article discusses the development of unified methods and software tools for processing information resources in the Internet systems. A new approach to application and implementation of business processes is formulated for the construction of these systems. The methods and software tools of content and information resource processing are developed.
Key words: content, information resources, commercial content, content analysis, content lifecycle, content monitoring, content search, electronic content commerce systems, web-resource, data value, data integration, distributed data systems, heterogeneous data, business-process, content management system, content lifecycle.

Література 8