Проверяемый текст
Крюков, Илья Андреевич; Смысловое наполнение концепта "бизнес" и его репрезентация в русском языке на современном этапе (Диссертация 2012)
[стр. 41]

41 Левина до справочника по физике.
Более того, составители Корпуса хорошо понимали, что для полного и адекватного представления о том, что происходит в современном русском языке (или, если угодно, с современным русским языком) необходимо еще в большей степени расширить рамки Корпуса и включить в него, наряду с письменными текстами, также и записи устной речи [Плунгян 2005: 297].
С появлением Национального корпуса русского языка (НКРЯ) в изучении лингвистики появились новые возможности.

Ведь корпус — нечто большее, чем просто техническое подспорье, — это фактически справочноинформационная система по современному русскому языку, позволяющая получать ответы на самые неожиданные вопросы, — более того, позволяющая ставить новые проблемы, которых лингвистика прошлого почти не касалась.
Прежде всего, Корпус является источником примеров употреблений слов в текстах, т.е.
языкового материала, необходимого для различных лингвистических
исследовании.
Существенным для разработчиков и ценным для пользователей является
также и то, что наличие разметок не только оптимизирует поиск примеров, но и позволяет решать разнообразные лингвистические задачи: изучение семантическои сочетаемости, описание конструкции русского языка, уточнение свойств классов слов и отдельных слов, проверка гипотез и т.д.
Для формулирования запросов и получения соответствующих примеров употреблений из текстов используется программа GRAMFIND, разработанная А.Е.
Поляковым.
Она позволяет осуществлять поиск не только по отдельным словам, но и по целым конструкциям, состоящим из 2-х или 3-х элементов с заданными морфологическими и семантическими признаками.

Очень важным средством оптимизации поиска является таксономическая разметка, позволяющая сужать поиск за счет отнесения слов к каким-либо тематическим классам.

Совершенно очевидно, что вручную собирать примеры по такому огромному количеству текстов чрезвычайно трудно.
Использование же размеченного Корпуса делает подобную задачу вполне обозримой.
[стр. 40]

40 Лингвистическое исследование проводится на текстовых примерах, и Ч чем больше таких примеров, тем качественнее исследование.
Если раньше перед серьезной работой ученый много времени (месяцы или даже годы) тратил на собирание интересующих примеров, их систематизацию, анализ, то теперь, благодаря существованию корпуса языка такая подготовительная раобразом электронное собрание текстов, размеченное таким образом, чтобы в нем можно было быстро найти слова и конструкции с заданными грамматическими и другими интересными лингвисту свойствами» [Плунгян 2005].
С появлением Национального корпуса русского языка (НКРЯ) в изуче* нии лингвистики появились новые возможности.

Прежде всего, Корпус является источником примеров употреблений слов в текстах, т.е.
языкового материала, необходимого для различных лингвистических
исследований.
Если раньше на поиски примеров у лингвистов уходили месяцы, а иногда и годы, то теперь поиск примеров осуществляется автоматически в течение нескольких секунд, а количество получаемых примеров измеряется сотнями и тысячами.
Правда, у этого расширения возможностей, как это всегда бывает, есть и оборотная сторона: эти тысячи примеров необходимо прочитать, осмыслить и расклассифицировать.
Однако эта работа поддается оптимизации с помощью семантической разметки, т.к.
семантическая разметка позволяет не только искать, но и исключать из поиска какие-то примеры.
Кроме этого, в корпусе присутствует морфологическая разметка.
Для формулирования запросов и получения соответствующих примеров употреблений из текстов используется программа GRAMFIND, разработанная А.Е.
Поляковым.
Она позволяет осуществлять поиск не только по отдельным словам, но и по целым конструкциям, состоящим из 2-х или 3-х элементов с заданными морфологическими и семантическими признаками,
например: (а) частица хоть + глагол в форме императива {Хоть плачь); (б) частица как + глагол СВ в буд.
вр.
{Как крикнет)-,

[стр.,41]

41 (в) предлогу + сущ.
(с признаком ‘лицо’) или личн.
мест, в Род.п.
+ сущ.
в Им.п.
(У нас гости; У Пети грипп); и т.п.
Так, например, сделав запрос, пользователь прежде всего получает сам языковой материал, который ему нужен.
Но, кроме того, по полученной выборке примеров можно выяснить, какие семантические классы глаголов, существительных и т.д.
встречаются (а какие — не встречаются) в заданных конструкциях (например, для конструкции «как + глагол СВ в буд.
вр.» не характерны ментальные глаголы, поскольку это конструкция со значением интенсивного действия).
Очень важным средством оптимизации поиска является таксономическая разметка, позволяющая сужать поиск за счет отнесения слов к какимлибо тематическим классам.

Вот некоторые примеры такой разметки для существительных непредметного характера семантики.
t:be:exist — существование (жизнь, наличие, бытие) t:poss — посессивная сфера (обладание, приобретение, покупка, потеря, лишение) t:ment — ментальная сфера (знание, абстракция, воображение, воспоминание, догадка) t:action — мероприятие (аукцион, вернисаж, вечеринка, выборы, именины, заседание, культпоход) t:behav — поведение и поступки человека (разгильдяйство, подхалимаж, неповиновение, ребячество, предательство) t:inter — взаимодействие и взаимоотношение (взаимопомощь, вражда, схватка, драка) Совершенно очевидно, что вручную собирать примеры по такому огромному количеству текстов чрезвычайно трудно.
Использование же размеченного Корпуса делает подобную задачу вполне обозримой.

Существенным для разработчиков и ценным для пользователей является
то, что наличие разметок не только оптимизирует поиск примеров, но и позволяет решать разнообразные лингвистические задачи: изучение семанти

[Back]