Кульчицький І. М. Технічні аспекти опрацювання комп'ютером природномовної інформації

УДК 004.415.3

І.М. Кульчицький
Національний університет “Львівська політехніка”,
кафедра прикладної лінгвістики

ТЕХНІЧНІ АСПЕКТИ ОПРАЦЮВАННЯ КОМП’ЮТЕРОМ ПРИРОДНОМОВНОЇ ІНФОРМАЦІЇ

© Кульчицький І.М., 2014
Розглянуто технічні проблеми опрацювання комп’ютером природномовної інформації, які спричинені наявністю багатьох стандартів кодування символів та недотриманням користувачами орфографічних та пунктуаційних правил. Обґрунтовано необхідність попереднього технічного опрацювання таких текстів перед їхнім використанням як у наукових дослідженнях, так і у різних інформаційних системах.
Ключові слова: інформаційний простір, інформаційне середовище, інформаційне суспільство, комп’ютерні технології, кодування символів, стандарти кодування.

The article deals with technical problems of natural language information processing by computer caused by the presence of multiple character encoding standards and non-compliance by users with spelling and punctuation rules. The necessity of previous technical processing of such texts before their use in scientific researches as well as in various information systems has been grounded.
Key words: information space, information environment, information society, computer technologies, character encoding, encoding standards.

Література – 26.