Лингвистика

Билет 1

1. Сущность прикладной лингвистики как особого подхода к языковым явлениям. Характерные черты прикладных методик.


В языкознании всегда присутствовали три глобальных исследовательских направления:


· теоретическое (объяснение языковых систем и процессов)

· описательное (конкретное описание языковых явлений)

· прикладное (совершенствование языковой системы).


В рамках последнего направления сформировалась научная дисциплина, которая получила название прикладной лингвистики. Ее отличает подход к языку как к деятельности, а не мертвому продукту.


Прикладная лингвистика


·это комплексная научная дисциплина, изучающая язык в различных ситуациях его применения и разрабатывающая методы совершенствования языковых систем и языковых процессов.


·учение о методах решения разнообразных практических задач с использованием знаний о языке


·учение о совершенствовании языковой способности человека и общества в целом.


Термин прикладная лингвистика появился в конце 20 гг. 20 в., когда была осознана необходимость строгого научного решения прикладных задач с использованием методов формального лингвистического анализа письменных и акустико-лингвистического анализа устных сообщений.


За рубежом под ПЛ часто понимают совершенствование методов преподавания языка (дидактическая лингвистика). В нашей стране ПЛ понимают как компьютерную лингвистику, которая становится сейчас все более широкой дисциплиной почти синонимом ПЛ.


Синонимы ПЛ: компьютерная Л, структурная Л, машинная Л, статистическая Л, математическая Л, искусственный интеллект (ИИ), ...


ПЛ требует строгого структурного подхода к языку и отводит важную роль математике.


Основные задачи ПЛ:


· автоматическое распознавание и синтез речи

· автоматические методы переработки текстовой информации

· создание автоматизированных систем информационного поиска

· составление автоматических словарей и систем машинного перевода

· разработка методов автоматического аннотирования, реферирования и перевода

· разработка экспертных систем

· лингвистическое обеспечение АСУ

· стандартизация научно-технической терминологии


Прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но это не значит , что они игнорируют реальную сложность моделируемого объекта. Методология прикладного исследования должна учитывать многоаспектность, многоуровневость, открытость языкового механизма.


Методология - совокупность общих принципов, определяющая способ исследования какого-либо явления; определяет взгляд на объект, как к нему подойти; философские принципы исследования явлений.


Метод - определенный тип способа исследования, определяемый инструментами, которые используются при изучении объекта исследования (метод компьютерного моделирования, статистический метод)


Собственно лингвистические методы:


· дистрибутивный метод

· трансформационный метод

· метод компонентного анализа

· метод различительных признаков


Методика - конкретный способ исследования, определяемый целью исследования; может объединять несколько методов (методика построения ассоциативных тезаурусов).


Характерные черты прикладных методик


· ведущая роль метода моделирования

· экспериментальный характер прикладных методик

· применение точного метаязыка

· формализованность самих операций исследования (хотя результат может быть приближенным)

· использование искусственного метаязыка описания

· комплексное сочетание разных наук


2. Автоматизированные переводные словари. Принципы построения.


АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях. АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ).

Отличительные свойства АС:

многоязычие

·обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса)

·гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь)

·динамичность (постоянное пополнение словарного состава; оперативность редактирования)

·состав (структура) словаря:

макроструктура - структура словаря:

микроструктура - структура словарной статьи

основная единица словаря

· слово (композиционно)

· словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию

3 главных компонента АС:

·блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме)

·блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ)

(· блок морфологического анализа) (иногда)

·блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя)


Желательно также, чтобы АС обладал:


· блоком лемматизации

· алгоритмом обработки некорректных запросов

· алгоритмом словообразовательного анализа)


АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста. На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме. решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики.


Словарная статья:

Ее структура и наполнение определяется назначением словаря.


Структура словарной статьи (13 зон):

1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста

2.Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация.

3. Зона морфологической информации

4. Рубрика подрубрика стиль (вся информация - в виде цифровых кодов)

5. Зона индекса надежности отражает степень общепринятости данного ПЭ:

А - официальный стандарт

Б - уважаемые словари

В - тетради новых терминов

Г - плавающие

6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер)

7. Зона пояснительных помет - уточнение значения данной ЛЕ

· семантические

· лексические

· синтаксические (обязат. управление)

8. Зона толкований (для многозначных слов и новых терминов)

9. Зона примеров употребления выполняет две функции:

· иллюстративную

· смыслоразличительную

10. Зона фразеологии.

11. Составитель словарной статьи

12. Источник составления словарной статьи -> необязательные

13. Дата составления словарной статьи


Билет 7

1. Лексикография как прикладная дисциплина. Внутренняя и внешняя типология словарей.


Лексикография - прикладная лингвистическая дисциплина, занимающаяся практикой и теорией составления словарей.


Словарь - способ организации и представления знаний. Чем полнее и адекватнее в словаре представлены знания, тем лучше словарь выполняет свою функцию.


Лексикография как научная дисциплина носит комплексный характер, но определяющей чертой лексикографии является ее прикладная направленность. Все многообразие различных типов словарей (нормативные, учебные, переводные, терминологические, идеологические, этимологические ... ) получает практическую ориентацию исходя из целевой установки словаря.


Лексикография разрабатывает оптимальные средства выявления и фиксации семантических фактов определенных практических целях. Главная проблема в разработке оптимальной стратегии новых словарей - проблема обоснованности словарей как с точки зрения их состава, так и в плане адекватности подаваемой в них информации. Лексикография в широком смысле охватывает все множество инвентарей языковых единиц с приписанной им информацией того или иного рода. Наиболее богата и сложна для отражения семантическая информация.


Лексикографическая деятельность распадается на ряд этапов:


1. разработка системы требований, касающихся внешних параметров словаря (назначения, круга пользователей, инф. области ...)

2. разработка системы требований, касающихся внутренней параметров словаря (единиц описания, основных свойств метаязыка. объема, структуры, видов словарной информации ...)

3. формальная инвентаризация выбранных подъязыков (отбор текстов, расписывание контекстов, характеристика грамм. форм, составление предварительных словников ...)

4. экспериментальные исследования семантики описываемых единиц (дистрибутивный анализ текстов, тесты с носителями языка ...)

5. обобщение экспериментальных данных

6. построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов

7. сбор и систематизация дополнительной информации о каждой языковой единице

8. оформление словарных статей

9. системный анализ и упорядочение словарных статей

10. оформление словаря в целом, включая вспомогательные указатели.


Аспекты лексикографии:


· историко-филологический - изучение истории словарей как части истории культуры общества

· гносеологический (когнитивный) - изучение словарей как сокровищниц знаний. накопленных обществом

· семантико-лексикологический - использование словарей для лексико-семантического описания языка

·прикладной (самый важный) - прикладная лексикография направлена на совершенствование словарей с точки зрения тех или иных практических требований к словарям


Виды информации подаваемой в словаре определяют внутреннюю типологию словарей:

I. Объекты описания:

1) формальные/ семантические

2) природа объектов (лекс.-семантический или морфо-семантический уровень; в парадигматическом или в синтагматическом аспекте)

3) статус объекта (является ли словарь нормативным или описательным)

4) хронологический период

5) по сфере общения (подъязык)

6) степень охвата языка

II. Системные свойства

1) какая грамматическая информация дается об описываемых единицах?

2) какие стилистические пометы используются?

3) какой тип определения (дефиниции) дается?

4) включается ли экстралингвистическая информация?

5) в какой мере учитываются семантические отношения?

6) объясняется ли мотивированность описываемой единицы?

III. Актуализация в языковой жизни

1) указывается ли происхождение единиц?

2) указывается ли активность единицы в языковой жизни (частотность)?

3) показывается ли реализация единиц в контексте

IY. Прагматика пользователя

1) количество входов в словарь

2) каков порядок расположения единиц в словаре (по формальному или семантическому признаку?

3) имеются ли в словаре указатели?

4) даются ли металингвитсические сведения (история изучения, разные трактовки)?

Y. Связь с другими языками

1) производится ли генетическое сопоставление единиц и их значений с родственными языками?

2) производится ли типологическое сопоставление материала неродственных языков?


Цели словаря задают внешнюю (функциональную) типологию словарей:


Типы словарей

Цель

учебные словариобучение
переводные словариперевод
нормативные словаринормирование
терминологические словарисистематизация, уточнение научных понятий

Типология словарей по Ожегову:

·большой (представляет совр. русский язык в широкой ист. перспективе)

·средний (с детальной разработкой исторически оправданного стилистического многообразия лит. РЯ)

·краткий (популярного типа, стремящийся к активной нормализации совр. лит. речи)


Типология словарей по Щербе:

· словарь-справочник - словарь академического типа

· энциклопедический - общий словарь

· тезаурус - обычный толковый или переводной словарь

· обычный толковый или переводной словарь - идеологический словарь

· толковый словарь - переводной словарь


2. Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.


АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.


2 основные задачи АИПС:

· хранение информации

· поиск и выдача информации


Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ.


Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ.


Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.


Результатом поисковой операции является выборка релевантных ПОДов.


Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.


В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...)


выделение нужной пользователю информации осложняется двумя обстоятельствами:

· несоответствие между формулировкой запроса и реальной информацией нужной потребителю

· перевод запроса в ПОЗ


Мера соответствия документа информационной потребности называетсяпертенетностью.

Соответствие документа запросу называетсярелевантностью:

· смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)

· формальная (соответствие документа поисковому предписанию)


ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.


Классификация ИПЯ:


предкоординированные ИПЯ

присутствует заранее заданная классификационная схема

посткоординируемые ИПЯ

отсутствует заранее заданная классификационная схема


Типы классификаций


иерархическая

задает дерево знаний, например всей литературы по лингвистике

алфавитно-предметная

например, телефонный справочник

фасетная

опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета


Фасетная классификация: фильмы:

жанрцветформат

Ж1

Ж2

Ц1 цветной

Ц2 черно-белый

Ф1 широкоформатный

фасетная формула: Ж1 Ц2 Ф1


Общие недостатки предкоординированных ИПЯ:

· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков

· все классификации имеют недостаточную глубину

· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование


Посткоординируемые ИПЯ:


семантические коды

в ЛЕ в явном виде заданы парадигматические отношения


дескрипторы

оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство


Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель;

RX коды

ручное индексирование

грамматики мешочного типа

(теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов.

позиционно-скобочные грамматики

сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения:


сетевые грамматики

в явном виде задается смысл связи между элементами текста (Скрэгг)



ИПЯ с ПСГ:

· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.

· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду


4

Актуально: