ВІКІСТОРІНКА
Навигация:
Інформатика
Історія
Автоматизація
Адміністрування
Антропологія
Архітектура
Біологія
Будівництво
Бухгалтерія
Військова наука
Виробництво
Географія
Геологія
Господарство
Демографія
Екологія
Економіка
Електроніка
Енергетика
Журналістика
Кінематографія
Комп'ютеризація
Креслення
Кулінарія
Культура
Культура
Лінгвістика
Література
Лексикологія
Логіка
Маркетинг
Математика
Медицина
Менеджмент
Металургія
Метрологія
Мистецтво
Музика
Наукознавство
Освіта
Охорона Праці
Підприємництво
Педагогіка
Поліграфія
Право
Приладобудування
Програмування
Психологія
Радіозв'язок
Релігія
Риторика
Соціологія
Спорт
Стандартизація
Статистика
Технології
Торгівля
Транспорт
Фізіологія
Фізика
Філософія
Фінанси
Фармакологія


Об'єкт, предмет і завдання корпусної лінгвістики

Лекція

КОРПУСНА ЛІНГВІСТИКА

План

1. Об'єкт, предмет і завдання корпусної лінгвістики.

2. Корпуси текстів та засади їх створення.

3. Характеристика найвідоміших корпусів текстів.

4. Особливості використання корпусних менеджерів.

Мета: визначити основні термінологічні поняття корпусної лінгвістики; з’ясувати об'єкт, предмет і завдання корпусної лінгвістики; ознайомитися з типами корпусами текстів, наявними в мережі Інтернет; розглянути програмні засоби для роботи з корпусами текстів.

Рекомендована література та посилання:

а) основна література:

° Дарчук Н. П. Комп'ютерна лінгвістика (автоматичне опрацювання тексту): підручник. – К.: Видавничо-поліграфічний центр «Київський університет», 2008. – 351 с.

° Карпіловська Євгенія Анатоліївна. Вступ до прикладної лінгвістики : комп’ютерна лінгвістика : Підручник / Євгенія Анатоліївна Карпіловська. – Донецьк : ТОВ «Юго-Восток, ЛТД», 2006. – 188 с. – С.7 – 19.

б) додаткова література:

° Баранов А.Н. Введение в прикладную лингвистику. – М.: Едиториал УРСС, 2003. – 360 с.

° Демська-Кульчицька О. Основи національного корпусу української мови.— К.: Інститут українсьокї мови національної академії наук України, 2005.— 219 с.

° Корпусна лінгвістика / В. А. Широков, О. В. Бугаков, Т. О. Грязнухіна та ін. – К.: Довіра, 2005. – 471 с.

° Зубов А. В. информационные технологии в лингвистике: Учеб. пособие для студ. лингв. фак-тов высш. учеб. заведений/ А. В. Зубов, И. И. Зубова — М.: Издательский центр «Академия», 2004. — 208 с.

 


в) посилання на джерела в Інтернеті:

 

v КОРПУСИ ТЕКСТІВ ЛАБОРАТОРІЇ КОМП’ЮТЕРНОЇ ЛІНГВІСТИКИ КНЛУ – http://complinguide.com.ua/Corpora.aspx

v КОРПУС ТЕКСТІВ З КОМП’ЮТЕРНОЇ ЛІНГВІСТИКИ – http://csit2009.org/content/korpus-tekstiv-z-komp%E2%80%99yuternoyi-lingvistyky

v КОРПУС УКРАЇНСЬКОЇ МОВИ ЛАБОРАТОРІЇ КОМП'ЮТЕРНОЇ ЛІНГВІСТИКИ КИЇВСЬКОГО НАЦІОНАЛЬНОГО УНІВЕРСИТЕТУ ІМЕНІ ТАРАСА ШЕВЧЕНКА (доступний для онлайн-пошуку) – http://www.mova.info/corpus.aspx?l1=209

v УКРАЇНСЬКИЙ НАЦІОНАЛЬНИЙ ЛІНГВІСТИЧНИЙ КОРПУС (42 мільйони слововживань) – http://lcorp.ulif.org.ua/virt_unlc/

v УКРАЇНСЬКИЙ МОВНО-ІНФОРМАЦІЙНИЙ ФОНД НАН УКРАЇНИ – http://lcorp.ulif.org.ua/

v ОНЛАЙН-КОНКОРДАНС РОМАНУ ІВАНА ФРАНКА «ПЕРЕХРЕСНІ СТЕЖКИ» – http://www.ktf.franko.lviv.ua/~andrij/science/Franko/concordance.html

v ПАРАЛЕЛЬНИЙ РОСІЙСЬКО-УКРАЇНСЬКИЙ КОРПУС НА САЙТІ НАЦІОНАЛЬНОГО КОРПУСУ РОСІЙСЬКОЇ МОВИ– http://www.ruscorpora.ru/corpora-other.html

v ПАРАЛЕЛЬНИЙ ПОЛЬСЬКО-УКРАЇНСЬКИЙ КОРПУС

http://www.domeczek.pl/~polukr/index.php?option=welcome

v БРИТАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (BNC) - 100 мільйонів слів - зразків письмового й усного мовлення з широкого діапазону джерел – http://www.natcorp.ox.ac.uk/

v АМЕРИКАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (ANC) – http://www.americannationalcorpus.org/

v КОРПУС ПОЛЬСЬКОЇ МОВИ (KORPUS JĘZYKA POLSKIEGO PWN). Польського наукового видавництва при Польській Академії наук.– http://korpus.pwn.pl/

v ЧЕСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (ČESKÝ NÁRODNÍ KORPUS) – http://ucnk.ff.cuni.cz/

v СЛОВАЦЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС(SLOVENSKÝ NÁRODNÝ KORPUS) – http://korpus.juls.savba.sk/

v ІРЛАНДСЬКИЙ КОРПУС ЕЛЕКТРОННИХ ТЕКСТІВ: Онлайн-ресурси з ірландської історії, літератури, політики - C.E.L.T. Давньоірландські оригінали кельтських саг (скел), поезія бардів, давньоірландська лірична поезія, літописи, клерикальна література, граматики, латинські тексти, англійські переклади –http://www.ucc.ie/celt/publishd.html

v НАЦІОНАЛЬНИЙ КОРПУС РОСІЙСЬКОЇ МОВИ – http://www.ruscorpora.ru/

v ЛАБОРАТОРІЯ ЗАГАЛЬНОЇ І КОМП’ЮТЕРНОЇ ЛЕКСИКОЛОГІЇ ТА ЛЕКСИКОГРАФІЇ–http://www.philol.msu.ru/~lex/main.htm

v «КОМП’ЮТЕРНИЙ КОРПУС ТЕКСТІВ РОСІЙСЬКИХ ГАЗЕТ КІНЦА ХХ ст.» – (Демонстраційний варіант близько 200 тис. слововживань) – http://209.85.135.132/search?q=cache:63wxC-8EgdcJ:www.philol.msu.ru/~lex/corpus/+корпус+текстов+TRACTOR&cd=4&hl=uk&ct=clnk&gl=ua

v ПЕРЕЛІК ПОСИЛАНЬ НА ЛІНГВІСТИЧНІ КОРПУСИ НА САЙТІ НАЦІОНАЛЬНОГО КОРПУСУ РОСІЙСЬКОЇ МОВИ (рос.)– http://www.ruscorpora.ru/corpora-other.html

v КАТАЛОГ КОРПУСНИХ МЕНЕДЖЕРІВ І ЛІНГВІСТИЧНИХ ПРОГРАМ У МЕРЕЖІ ІНТЕРНЕТ–http://www.rvb.ru/soft/catalogue/catalogue.html#TextAnalysis

v КОРПУСНА ІНФОРМАЦІЙНО-ДОСЛІДНИЦЬКА СИСТЕМА (КИИСА) – http://www.philol.msu.ru/~lex/kiisa.html\

v

 

 


Корпуси текстів та засади їх створення

 

Корпус текстів характеризується чотирма основними параметрами:

 

- по-перше, він повинен бути достатньо великого обсягу;

- по-друге, корпус повинен бути структурованим або розміченим;

- по-третє, тексти, складові певного корпусу, повинні бути в електронному варіанті;

- по-четверте, в поняття «Електронний корпус» входить, як правило, спеціальне програмне забезпечення для роботи з цим корпусом.

 

Цінність корпусу вбачається в наступному:

 

- одного разу зроблений корпус може багато разів використовуватися;

- корпус показує мовні дані в їх реальному оточенні, що дозволяє досліджувати лексичну і граматичну структуру мови, а також безперервні процеси мовних змін, що відбуваються в мові впродовж певного відрізка часу;

- корпус характеризується збалансованим складом текстів, що дозволяє використовувати його для тестування пошукових машин, автоматичних аналізаторів та синтезаторів текстів, систем перекладу, а також використовувати його в різних лінгвістичних дослідженнях;

- корпус має важливе значення для викладання мови, оскільки за допомогою корпусу можна швидко і ефективно перевірити особливості вживання незнайомого слова або граматичної форми.

 

Отже, для вирішення різних лінгвістичних завдань мало лише наявності масиву текстів. Потрібно також, щоб тексти містили в собі додаткову лінгвістичну та екстралінгвістичну інформацію. Так у корпусних лінгвістиці виникла ідея розміченого корпусу.

Розмітка ( tagging, annotation ) полягає в приписуванні текстам і їх компонентів спеціальних міток ( tag, tags ) : зовнішніх, екстралінгвістичних (відомості про автора і відомості про текст : автор, назва, рік і місце видання, жанр, тематика ; відомості про автора можуть включати не тільки його ім'я, але також вік, стать, роки життя та багато іншого. Це кодування інформації має назву метаразмітки ), структурних (глава, абзац, речення, словоформа ) і власне лінгвістичних, що описують лексичні, граматичні та інші характеристики елементів тексту. При виборі цих даних необхідно керуватися цілями дослідження і потребами лінгвістів, а також можливостями щодо внесення в текст тих чи інших додаткових ознак. Серед лінгвістичних типів розмітки виділяються:

морфологічна розмітка. В іноземній термінології використовують термін part - of - speech tagging (POS - tagging ), дослівно - частиномовна розмітка. Насправді морфологічні мітки включають не тільки ознаки частин мови, але й ознаки граматичних категорій, властивих даній частині мови. Це основний тип розмітки: по-перше, більшість великих корпусів є саме морфологічно розміченими корпусами, по-друге, морфологічний аналіз розглядається як основа для подальших форм аналізу - синтаксичного і семантичного, і, по-третє, успіхи в комп'ютерній морфології дозволяють автоматично розмічати корпуси великих розмірів;

синтаксична розмітка, що є результатом синтаксичного аналізу, або парсингу ( англ. parsing ), що здійснюється на основі даних морфологічного аналізу. Цей вид розмітки описує синтаксичні зв'язки між лексичними одиницями і різні синтаксичні конструкції (наприклад, підрядне речення, дієслівне словосполучення);

семантична розмітка. Хоча для семантики немає єдиної Семантичної теорії, найчастіше семантичні теги позначають семантичні категорії, до яких належить дане слово або словосполучення, і більш вузькі підкатегорії, що уточнюють його значення;

анафорична розмітка. Фіксує референтні зв'язку, наприклад, займенникові;

просодична розмітка. У просодичних корпусах застосовуються мітки, що описують наголос і інтонацію. У корпусах усної розмовної мови просодична розмітка часто супроводжується так званою дискурсною розміткою, яка служить для позначення пауз, повторів, застережень.

Існують також інші типи розмітки.

 

АМЕРИКАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (ANC)

Заснування 1990р.
Обсяг 22 млн слів
Склад Письмова та усна частини.
Структура Відкритий Американський Національний Корпус (OANC), що складається з близько 15 мільйонів слів американського варіанту англійської мови, автоматично. Вручну розмічений підкорпус (MASC), 500 000 слів американського варіанту англійської мови здебільшого взяті з OANC, з ручною розміткою. ANC Second Release, розширений набір OANC в тому числі 800 000 додаткових слів. MASC Корпус речень складається з приблизно 110 000 речень взятих з MASC і OANC, які були вручну розмічені.
Розмітка і можливості пошуку Корпус оснащений метатекстовую, частиномовної розміткою. Підкорпус, 11 млн слів, має часткову синтаксичну розмітку. Є також розмітка власних назв для людей, організацій і географічних об'єктів. Розмітка Відкритого Американського Національного Корпуса (OANC) складається з: структурної розмітки (розділи, глави і т.д.), межі речень, сліва з частиною мови та лемою, семантично значущі об'єкти (особи, місце розташування, організації, дати).

БРИТАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (BNC)

Обсяг 100 мл слів
Заснування 1991-1994р.
Склад Письмова частина – 90% (тексти з регіональних та національних газет, опублікувані дослідження, журнали або періодичні видання, художні та науково-популярні книги, опубліковані та неопубліковані матеріали, листівки, брошури, листи, нариси, студентські твори, виступи, скрипти та багато інших типів текстів). Усна частина – 10% (представлена у вигляді орфографічної транскрипції)
Розмітка та можливості пошуку Морфологічна розмітка. Можна шукати конкретну словоформу; всі форми однієї лексеми по лемі; словосполучення, включаючи розривні; вибрані граматичні форми лексеми; здійснювати більш складний пошук з використанням спеціальної мови (CQL - мова запиту до корпусу); шукати більш складні конструкції з використанням спеціального конструктора запитів; отримувати інформацію про джерела прикладів, інформацію про відносну частоту, інформацію про частоту сполучень.
Лінгвістична інформація Лексична, семантична / прагматична, синтаксична, морфологічна, графологічна, орфографічна.
Призначення Може будти використаний для видань довідників, академічних і лінгвістичних досліджень, під час навчання мов, для створення штучного інтелекту, для обробки природної мови, для обробки мови та систем пошуку інформації.

КОРПУСНІ МЕНЕДЖЕРИ

КАТАЛОГ НИХ МЕНЕДЖЕРІВ І ЛІНГВІСТИЧНИХ ПРОГРАМ У МЕРЕЖІ ІНТЕРНЕТ–http://www.rvb.ru/soft/catalogue/catalogue.html#TextAnalysis

 

Лекція

КОРПУСНА ЛІНГВІСТИКА

План

1. Об'єкт, предмет і завдання корпусної лінгвістики.

2. Корпуси текстів та засади їх створення.

3. Характеристика найвідоміших корпусів текстів.

4. Особливості використання корпусних менеджерів.

Мета: визначити основні термінологічні поняття корпусної лінгвістики; з’ясувати об'єкт, предмет і завдання корпусної лінгвістики; ознайомитися з типами корпусами текстів, наявними в мережі Інтернет; розглянути програмні засоби для роботи з корпусами текстів.

Рекомендована література та посилання:

а) основна література:

° Дарчук Н. П. Комп'ютерна лінгвістика (автоматичне опрацювання тексту): підручник. – К.: Видавничо-поліграфічний центр «Київський університет», 2008. – 351 с.

° Карпіловська Євгенія Анатоліївна. Вступ до прикладної лінгвістики : комп’ютерна лінгвістика : Підручник / Євгенія Анатоліївна Карпіловська. – Донецьк : ТОВ «Юго-Восток, ЛТД», 2006. – 188 с. – С.7 – 19.

б) додаткова література:

° Баранов А.Н. Введение в прикладную лингвистику. – М.: Едиториал УРСС, 2003. – 360 с.

° Демська-Кульчицька О. Основи національного корпусу української мови.— К.: Інститут українсьокї мови національної академії наук України, 2005.— 219 с.

° Корпусна лінгвістика / В. А. Широков, О. В. Бугаков, Т. О. Грязнухіна та ін. – К.: Довіра, 2005. – 471 с.

° Зубов А. В. информационные технологии в лингвистике: Учеб. пособие для студ. лингв. фак-тов высш. учеб. заведений/ А. В. Зубов, И. И. Зубова — М.: Издательский центр «Академия», 2004. — 208 с.

 


в) посилання на джерела в Інтернеті:

 

v КОРПУСИ ТЕКСТІВ ЛАБОРАТОРІЇ КОМП’ЮТЕРНОЇ ЛІНГВІСТИКИ КНЛУ – http://complinguide.com.ua/Corpora.aspx

v КОРПУС ТЕКСТІВ З КОМП’ЮТЕРНОЇ ЛІНГВІСТИКИ – http://csit2009.org/content/korpus-tekstiv-z-komp%E2%80%99yuternoyi-lingvistyky

v КОРПУС УКРАЇНСЬКОЇ МОВИ ЛАБОРАТОРІЇ КОМП'ЮТЕРНОЇ ЛІНГВІСТИКИ КИЇВСЬКОГО НАЦІОНАЛЬНОГО УНІВЕРСИТЕТУ ІМЕНІ ТАРАСА ШЕВЧЕНКА (доступний для онлайн-пошуку) – http://www.mova.info/corpus.aspx?l1=209

v УКРАЇНСЬКИЙ НАЦІОНАЛЬНИЙ ЛІНГВІСТИЧНИЙ КОРПУС (42 мільйони слововживань) – http://lcorp.ulif.org.ua/virt_unlc/

v УКРАЇНСЬКИЙ МОВНО-ІНФОРМАЦІЙНИЙ ФОНД НАН УКРАЇНИ – http://lcorp.ulif.org.ua/

v ОНЛАЙН-КОНКОРДАНС РОМАНУ ІВАНА ФРАНКА «ПЕРЕХРЕСНІ СТЕЖКИ» – http://www.ktf.franko.lviv.ua/~andrij/science/Franko/concordance.html

v ПАРАЛЕЛЬНИЙ РОСІЙСЬКО-УКРАЇНСЬКИЙ КОРПУС НА САЙТІ НАЦІОНАЛЬНОГО КОРПУСУ РОСІЙСЬКОЇ МОВИ– http://www.ruscorpora.ru/corpora-other.html

v ПАРАЛЕЛЬНИЙ ПОЛЬСЬКО-УКРАЇНСЬКИЙ КОРПУС

http://www.domeczek.pl/~polukr/index.php?option=welcome

v БРИТАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (BNC) - 100 мільйонів слів - зразків письмового й усного мовлення з широкого діапазону джерел – http://www.natcorp.ox.ac.uk/

v АМЕРИКАНСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (ANC) – http://www.americannationalcorpus.org/

v КОРПУС ПОЛЬСЬКОЇ МОВИ (KORPUS JĘZYKA POLSKIEGO PWN). Польського наукового видавництва при Польській Академії наук.– http://korpus.pwn.pl/

v ЧЕСЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС (ČESKÝ NÁRODNÍ KORPUS) – http://ucnk.ff.cuni.cz/

v СЛОВАЦЬКИЙ НАЦІОНАЛЬНИЙ КОРПУС(SLOVENSKÝ NÁRODNÝ KORPUS) – http://korpus.juls.savba.sk/

v ІРЛАНДСЬКИЙ КОРПУС ЕЛЕКТРОННИХ ТЕКСТІВ: Онлайн-ресурси з ірландської історії, літератури, політики - C.E.L.T. Давньоірландські оригінали кельтських саг (скел), поезія бардів, давньоірландська лірична поезія, літописи, клерикальна література, граматики, латинські тексти, англійські переклади –http://www.ucc.ie/celt/publishd.html

v НАЦІОНАЛЬНИЙ КОРПУС РОСІЙСЬКОЇ МОВИ – http://www.ruscorpora.ru/

v ЛАБОРАТОРІЯ ЗАГАЛЬНОЇ І КОМП’ЮТЕРНОЇ ЛЕКСИКОЛОГІЇ ТА ЛЕКСИКОГРАФІЇ–http://www.philol.msu.ru/~lex/main.htm

v «КОМП’ЮТЕРНИЙ КОРПУС ТЕКСТІВ РОСІЙСЬКИХ ГАЗЕТ КІНЦА ХХ ст.» – (Демонстраційний варіант близько 200 тис. слововживань) – http://209.85.135.132/search?q=cache:63wxC-8EgdcJ:www.philol.msu.ru/~lex/corpus/+корпус+текстов+TRACTOR&cd=4&hl=uk&ct=clnk&gl=ua

v ПЕРЕЛІК ПОСИЛАНЬ НА ЛІНГВІСТИЧНІ КОРПУСИ НА САЙТІ НАЦІОНАЛЬНОГО КОРПУСУ РОСІЙСЬКОЇ МОВИ (рос.)– http://www.ruscorpora.ru/corpora-other.html

v КАТАЛОГ КОРПУСНИХ МЕНЕДЖЕРІВ І ЛІНГВІСТИЧНИХ ПРОГРАМ У МЕРЕЖІ ІНТЕРНЕТ–http://www.rvb.ru/soft/catalogue/catalogue.html#TextAnalysis

v КОРПУСНА ІНФОРМАЦІЙНО-ДОСЛІДНИЦЬКА СИСТЕМА (КИИСА) – http://www.philol.msu.ru/~lex/kiisa.html\

v

 

 


Об'єкт, предмет і завдання корпусної лінгвістики

 

° Корпусна лінгвістика - дисципліна в межах комп'ютерної лінгвістики, предметом якої є комплекс теоретичних та процедурних завдань, що забезпечують формування корпусів текстів (=текстозорієнтованих баз даних) та їх аналізу.

° Корпус текстів - це вид корпусу даних, одиницями якого є тексти або їх достатньо значні фрагменти, що включають, наприклад, якісь повні фрагменти макроструктури текстів даної проблемної області.

 

Об'єктом корпусної лінгвістики є корпуси текстів, а предметом ­– комплекс теоретичних та процедурних завдань, що забезпечують формування корпусів текстів.

 

Характеризуючи різновиди лінгвістичних баз даних, ми поряд зі словникозорієнтованими виділили текстозорієнтовані бази даних.

Такими, нагадаємо, є бази, основою формування яких є різноманітні за тематикою, структурою, обсягом, жанром, мовою та часом створення тексти. З появою сканерів процес формування таких баз значно спростився і пришвидшився, проте сканери не розв'язали власне лінгвістичних проблем побудови таких баз даних. До них належать проблеми добору текстів та їхнього аналізу, а саме: виділення різних типів представленої в них інформації про мову та об'єкти позамовної дійсності, так звану внутрішньо- і позамовну інформацію. Отже, текстозорієнтовані бази даних, як і бази словникозорієнтовані, можуть залежно від способу організації в них інформації виступати як бази даних та як бази знань про мову та відбиту в ній "картину світу" (^інтелектуальні бази даних). Такі корпуси даних, добутих з текстів, та самі корпуси текстів становлять об'єкт вивчення корпусної лінгвістики - самостійної дисципліни в межах комп'ютерної лінгвістики.

На сьогодні сформувалися два напрямки створення текстозорієнтованих баз даних: формування корпусів текстів, або повнотекстових баз даних і створення електронних картотек, або ілюстративних баз даних, або баз цитат.

 

° Повнотекстова база даних (=корпус текстів) - упорядкована сукупність текстів у цілісному вигляді

° Електронна картотека (=ілюстративна база даних, база цитат) - організована сукупність мовних одиниць (слів, словосполук тощо) з інформацією про їхнє вживання в тексті

 

Кожен з цих напрямків має свою специфіку у підході до організації мовної інформації в базах даних та в розробленні засобів їхнього опрацювання - текстових процесорів. Зауважимо принагідно, що ці два напрямки не заперечують, а доповнюють один одного, оскільки становлять наслідки опрацювання під різним кутом зору одного лінгвістичного об'єкту - тексту.

Структура і конкретне наповнення повнотекстових баз даних зумовлені характером тих теоретичних та практичних завдань, які така база покликана розв'язувати. Наприклад, за повнотою представлення функціонування мовної системи можна виділити фундаментальні та дослідницькі (=пошукові) корпуси текстів.

 

° Фундаментальна п.б.д. (=к.т.) - максимально повна й представницька сукупність текстів певною мовою

° Дослідницька (пошукова) п.б.д. (=к.т.) - сукупність текстів, за обсягом і якістю джерел достатня для виконаннях певних класів дослідницьких завдань

 

Свого часу Олександр Сергійович запропонував розрізняти корпуси текстів реєструвальногота інтерпретаційного, або дослідницького типу. Перші становлять фактичне підґрунтя для створення других.

Реєструвальні корпуси подають тексти як цілісні об'єкти, як факт реалізації мовної системи.

 

Корпуси інтерпретаційні становлять інформаційно-довідкові та дослідницькі системи, що дають користувачеві змогу одержувати з корпусу текстів потрібну йому інформацію про окремі мовні об'єкти та їхні властивості.

 

Як правило, корпуси текстів за допомогою спеціальних засобів доступу до них та їхнього опрацювання (=текстових процесорів) виконують функції як реєструвальні, або представницькі, так і інтерпретаційні, або дослідницькі чи інформаційно-довідкові.

 

© 2013 wikipage.com.ua - Дякуємо за посилання на wikipage.com.ua | Контакти