организации текста: лексические единицы несут основную долю смысловой информации любого сообщения» (35, с.60). Возрастание объема нормативного материала, усложнение отношений, регулируемых законодательством, включение в его язык все большего числа слов и терминов из других отраслей затрудняют поддержание надлежащего уровня юридической терминологии только традиционными средствами. Развернувшиеся в последние годы работы, связанные с автоматической обработкой, хранением, поиском и передачей текстовой, в том числе и правовой информации, ставят правовую науку и практику перед необходимостью использования современной электронной техники в качестве средства при анализе языка нормативных актов и его важнейшей части юридической терминологии (112, с. 150-152). С другой стороны, наличие доступа к использованию текстовых баз данных нормативных актов в качестве исходного материала позволяет активно использовать методы прикладной лексикологии и машинной лексикографии для анализа лексики нормативных актов. Прикладная лексикология и машинная лексикография являются сегодня ведущими направлениями автоматизации лингвистических и прикладных разработок. Одним из основных направлений автоматизации лексикографических работ является построение частотных словарей. Частотный словарь тех или иных лексических единиц дает представление о статистической структуре определенного уровня организации того текста, который послужил основанием для составления частотного словаря. Кроме того, полученные статистические данные находят применение при разработке алгоритмов автоматизированного анализа текстовой информации. Потребность в получении статистических данных об организации лексического состава нормативных актов в настоящее время осознается специалистами в области права (например, в банк данных |
ции" подобных систем. При этом необходима выработка системных требований к лингвистическому обеспечению автоматизированных информационных систем, а это, в свою очередь, требует обращения к исследованиям по системным вопросам в лингвистике [Королев, 1981, с. 1]. При разработке лингвистического обеспечения информационно-поисковых систем по законодательству основное внимание направляется на изучение лексического состава нормативных актов. Это объясняется тем, что именно лексический уровень является наиболее мощным по набору и разнообразию языковых номинативных средств [Поликарпов, 1989, с. 64]. Вообще "словарные работы составляют основной объем лингвистического обеспечения при разработке автоматизированных информационно-поисковых систем... Это связано с реальной ролью этого уровня языка в организации текста: лексические единицы несут основную долю смысловой информации любого сообщения". [Златоустова, Королев. Марчук, Поликарпов, 1989, с. 60]. Законодательная терминология значительна по объему и разнообразна по тематике. С целью ее стандартизации в юридической литературе высказывались предложения по составлению алфавитно-предметной переписи (реестра) всех основных терминов, применяемых в законодательстве [Пиголкин, 1971, с. 33]. Возрастание объема нормативного материала, усложнение отношений, регулируемых законодательством, включение в его язык все большего числа слов и терминов из других отраслей затрудняют поддержание надлежащего уровня юридической терминологии только традиционными средствами. Развернувшиеся в последние десятилетия работы, связанные с автоматической обработкой, хранением, поиском и передачей текстовой, в том числе и правовой информации, ставят правовую науку и практику перед необходимостью использования современной электронной техники в качестве средства при анализе языка нормативных актов и его важнейшей части юридической терминологии [Юсупов, 1990, с. 150-152]. С другой стороны, наличие доступа к использованию текстовых баз данных нормативных актов (текстовых массивов на машинных носителях) в качестве исходного материала позволяет активно использовать методы прикладной лексикологии и машинной лексикографии для анализа лексики нормативных актов. 37 Прикладная лексикология и машинная лексикография являются сегодня ведущими направлениями автоматизации лингвистических и прикладных разработок. Одним из основных направлений автоматизации лексикографических работ является построение частотных словарей. Частотный словарь тех или иных лексических единиц дает представление о статистической структуре определенного уровня организации того текста, который послужил основанием для составления частотного словаря. Кроме того, полученные статистические данные находят применение при разработке алгоритмов автоматизированного анализа текстовой информации. Как отмечается в работе [Королев, 1981], "требование алгоритмизации играет все более возрастающую роль в современных АИПС; в ряде случаев оно становится доминирующим и оказывает решающее влияние на построение лингвистического обеспечения системы" [с. 5]. Как уже отмечалось, потребность в получении статистических данных об организации лексического состава нормативных актов в настоящее время осознается и специалистами в области права (например, в банк данных терминологической службы по праву предлагается наряду с рядом словарей включить и сведения, отражающие различные статистические характеристики терминов. Среди них могут быть сведения о числе употребляемых в различных нормативных актах или изданиях (например, в Своде законов СССР) терминов; частоте использования отдельных терминов и т.д. [Юсупов, 1990, с. 165], а также (об этом ниже) число текстов тех отраслей права, в которых встречается термин. Частотный словарь можно рассматривать как своего рода модель текста, как модель распределения частот употребления единиц в тексте [Тулдава, 1987, с. 54] или как "информационно-поисковую систему в миниатюре, которая способна выдавать сведения о различных сторонах текста и словаря" [Частотный словарь русского языка, 1977, с. 7]. Установление взаимной зависимости между частотными и лексико-грамматическими свойствами слов в определенном текстовом массиве позволяет-на практике установить частотную границу перехода от периферийной (в рассматриваемой тематической области) лексики к основной (ядерной); а также частотную границу, разделяющую терминологическую и нетерминологическую лексику |