Кульчицький І. М. Вибір розміру вибірки для статистичних опрацювань текстів

УДК 811.161.2’33:519.25

І. М. Кульчицький
Національний університет “Львівська політехніка”,
кафедра прикладної лінгвістики

Вибір розміру вибірки для статистичних опрацювань текстів
© Кульчицький І. М., 2015

Працю присвячено одному із важливих напрямків квантитативних досліджень мови та мовлення – вивченню інформаційно-статистичних властивостей тексту. Здійснено спробу встановити для творів Марка Черемшини відсоток авторських текстів, який достатній для аналізу вірогідних відносних частот символів у його творах та дослідити стійкість цих частот. Зроблено низку висновків про розмір уривків тексту, з яких формується текст-вибірка для статистичних обстежень.
Ключові слова: квантитативні дослідження, вибірка, обсяг вибірки, частота, Марко Черемшина.

The article is dedicated to one of the most important areas of quantitative studies of language and speech that is the study of information and statistical properties of text. An attempt was made to establish Cheremshyna’s literary works percentage sufficient to analyze relative frequencies of characters in his works and to investigate the stability of these frequencies. A number of conclusions were made about the size of text passages which may form text-sample for statistical surveys.
Key words: quantitative study, sample, sample size, frequency, Marko Cheremshyna.

Література – 17