Браунівський корпус

Автор работы: Пользователь скрыл имя, 20 Октября 2013 в 21:17, реферат

Описание работы

1) Із кожного тексту буде взято один уривок довжиною 2000 слововживань + ще кілька слововживань до кінця поточного речення. Окрім тих випадків, коли довжина тексту менша за 2 тис. слововживань. У такому разі фрагмент, який ввійде до корпусу, складатиметься з кількох коротких текстів кількох авторів (наприклад, короткі новини). Вибір уривку з тексту необхідно попередньо погодити зі мною.

Файлы: 1 файл

Dobirannya_textiv_dlya_Braunskogo_korpusu_ukray.doc

— 67.50 Кб (Скачать файл)

Підбір текстів для  Браунського корпусу української  мови


 

І. Вимоги до текстів у корпусі

1. Оригінальні (тобто неперекладні) твори. 

2. Прозові тексти.

3. Зредаговані тексти.

4. Час публікації текстів –  2011 р. (Заувага: час написання тексту  має відрізнятися від часу його публікації не більше ніж на 2 роки, тобто перевидання поезій О. Олеся в 2011 р. не підходить).

5. Кожен текст має бути паспортизований  (перелік параметрів для заповнення  інформації про текст див. нижче).

 

Важливо розуміти

  1. Із кожного тексту буде взято один уривок довжиною 2000 слововживань + ще кілька слововживань до кінця поточного речення. Окрім тих випадків, коли довжина тексту менша за 2 тис. слововживань. У такому разі фрагмент, який ввійде до корпусу, складатиметься з кількох коротких текстів кількох авторів (наприклад, короткі новини). Вибір уривку з тексту необхідно попередньо погодити зі мною.
  2. У корпус усі уривки ввійдуть в електронному вигляді, тому в разі паперового першоджерела необхідно буде оцифрувати цей уривок. З огляду на це, бажана добра якість паперової версії тексту, щоб сканування/розпізнавання тесту не було проблематичним.
  3. У тому випадку, якщо не вдасться знайти необхідну кількість певних текстів, опублікованих, у 2011 р., можна долучити тексти 2010 р., попередньо погодивши це зі мною.

ІІ. Кількісний розподіл текстів у корпусі за категоріями

 

  • Усім студентам варто об’єднатися в невеличкі групи по 1-8 осіб (із розрахунку, що кожен студент має знайти ~10 текстів), щоб спільно добирати тексти в межах певної категорії.
  • У корпусі всього 15 категорій 2 типів – інформативні та художні тексти. Кожна категорія складається з підкатегорій, упорядкованих за тематичним або жанровим принципом. У таблиці наведено кількісний розподіл тестів у межах категорії, яким він є в Браунському корпусі американської англійської мови та /або аналогічному корпусі британської англійської (ЛОБ – LOB, Lancaster-Oslo/Bergen Corpus).

 

Категорія

Інформація про кількісне співвідношення текстів у межах категорії

I. ІНФОРМАТИВНІ ТЕКСТИ

A. ПРЕСА: Репортаж (44 тексти)

Політичний

Спортивний

Суспільство

Екстрені новини

Фінансовий

Культура

В корпусі ЛОБ  дотримано балансу  між загальнонаціональною й місцевою періодикою (у пропорції 60:40). Є також  розподіл на щоденні, видання для  кожної підкатегорії в категоріях А, В і С.

Кількість: 13 текстів – політика (з місцевих не брали), 7 – спорт, 3 – суспільство, 10 – екстрені новини, 4 – фінанси (з місцевих не брали), 7 – культура.

Заувага, для українського корпусу є сенс узяти більше політичних та суспільних текстів коштом спорту й культури, оскільки саме ці теми переважають.

Екстрені  новини – це особливий різновид новин, коли репортери виїжджають на місце події й звідти подають  оперативні повідомлення.

B. ПРЕСА: Редакційні статті (27 текстів)

Редакційна стаття від видання

Особиста редакційна стаття

Листи до редакції

В корпусі ЛОБ  дотримано балансу  між загальнонаціональною й місцевою періодикою (у пропорції 60:40). Є також  розподіл на щоденні, видання для  кожної підкатегорії в категоріях А, В і С.

 

 

Перша підкатегорія – це редакційна стаття, яка не має одноосібного автора, на відміну від текстів у другій підкатегорії.

Орієнтовне  кількісне співвідношення – по 9 кожного з трьох типів текстів.

C. ПРЕСА: Огляди (17 текстів)

театр

література

музика

танці

В корпусі ЛОБ  дотримано балансу між загальнонаціональною й місцевою періодикою (у пропорції 60:40). Є також розподіл на щоденні, видання для кожної підкатегорії в категоріях А, В і С.

У корпусі ЛОБ у цій категорії переважають загальнонаціональні видання.

D. РЕЛІГІЙНА ЛІТЕРАТУРА (17 текстів)

Книжки

Періодика

Брошури

У Браунському корпусі: 7 книжок, 6 періодичних видань і 4 трактати.

У корпусі ЛОБ вирішили дібрати в категорію D тексти, якомога різноманітніші за стилем: від теологічних до популярних, намагаючись підібрати тексти «суто» про релігійні питання. А загальніші проблеми (наприклад, релігія і суспільство) потрапляють у категорію F чи G.

E. ДОЗВІЛЛЯ ТА РЕМЕСЛА (36 текстів)

Книжки

Періодика

Оригінальна назва в буквальному  перекладі: ВМІННЯ ТА ХОББІ. Укладачі ЛОБ додали «trade» (робоча, або прикладна, професія, тобто яка вимагає ручної роботи й уміння, наприклад, будівельник), бо виявили в Браунському корпусі матеріал із журналів про trade.

У Браунському корпусі: 2 книжки і 34 періодичні видання.

У корпусі ЛОБ такий тематичний поділ: 5 текстів – домоводство, домашні ремесла/вміння, 5 – хобі, 3 – музика й танці, 1 – домашні тварини, 4 – спорт, 2 – їжа й вино, 2 – подорожі, 4 – різне, 9 – робочі професії, фахові журнали, 3 – фермерство = 38 текстів.

F. ПОПУЛЯРНА ЛІТЕРАТУРА (48 текстів)

Книжки

Періодика

У Браунському корпусі: 23 книжки і 25 періодичних видань.

У корпусі  ЛОБ: 22 – популярна політика, психологія, соціологія, 8 –популярна історія, 3 - популярна медицина, здоров’я, 4 – "культура", 7 – різне = 44 текстів.

У корпусі ЛОБ в категоріях E та F було введено підкатегорії «різне». Туди потрапили видання, що їх було відібрано на початку безвідносно до категорії, а потім встановлено, що вони належать до E чи F, але не попадають у наявні підкатегорії.

G. КРИТИКА, ЕСЕЇ, МЕМУАРИ (75 текстів)

Книжки

Періодика

У Браунському корпусі: 38 книжок і 37 періодичних видань.

До цієї категорії належить художня, мистецтвознавча  критика, есеї, біографії, мемуари, розгляд  «інтелектуальних питань» – інтелектуальні розправи. !!! Ця категорія належить до розділу «Інформативні тексти».

У корпусі  ЛОБ: 35 - біографії й мемуари, 16 - літературознавчі есеї й критика, 9 - мистецтвознавство, 27 - есеї загалом.

Укладачі  ЛОБ побачили, що в G і J є літературознавство й ввели критерій: більше дискурсивна літературознавча критика – до G, а більше сперта на тексти – до J. (Тобто якщо хтось більше розвиває свої думки – це G, а хто більше аналізує конкретні літературні тексти й робить висновки – це J.)

H. АДМІНІСТРАТИВНІ ДОКУМЕНТИ (30 текстів) 

Урядові/державні документи

Звіти організацій

Промислові звіти

Освітні документи

Індустрійні видання

У Браунському корпусі: 24 урядових док., 2 звіти організацій (фондів), 2 промислові звітти, 1 освітній документ (каталог коледжу), 1 індустрійне видання.

У корпусі ЛОБ уряд./держ. документи поділені на: 12 – звіти й публікації міністерств, 2 – державні акти, угоди, 5 – протоколи (тобто стенограми) засідань, дебатів, 5 – інші урядові документи.

J. НАУКОВА ЛІТЕРАТУРА (80 текстів)

Природничі науки

Медицина

Математика

Соціальні науки

Політологія, право, педагогіка

Гуманітарні науки

Техніка та інженерна справа

У Браунському корпусі: 12 – природничі науки, 5 – медицина, 4 – математика, 14 – соціальні науки, 15 – політологія/право/педагогіка, 18 – гуманітарні науки, 12 – техніка та інженерна справа.

У корпусі ЛОБ:

соціальні науки: 4 – психологія, 5 – соціологія, 1 – демографія, 4 –лінгвістика.

політологія/право/педагогіка: 8 – політика й економіка (по суті, додано економіку), 3 – право, 4 – педагогіка/освіта.

гуманітарні науки: 4 – філософія, 5 – історія, 4 – літературознавство, 4 – мистецтво, 1 – музика.

II. ХУДОЖНІ ТЕКСТИ

K. ХУДОЖНЯ ЛІТЕРАТУРА: Загальна (29 текстів)

Романи

Повісті

Оповідання

У Браунському корпусі: 20 романів і 9 оповідань.

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють. І кількісно варто віддати перевагу оповіданням.

L. ХУДОЖНЯ ЛІТЕРАТУРА: Детективи (24 тексти)

Романи

Повісті

Оповідання

У Браунському корпусі: 20 романів і 4 оповідання.

В оригіналі  тут згадано ще MYSTERY – детективи, особливо про загадкові вбивства, де загадкові явища прояснюються лише в кінці. Болгари додали поліцейські історії та твори в стилі «екшн».

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють.

M. ХУДОЖНЯ ЛІТЕРАТУРА: Наукова фантастика (6 текстів) 

Романи

Повісті

Оповідання

У Браунському корпусі: 3 романи й 3 оповідання.

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють.

N. ХУДОЖНЯ ЛІТЕРАТУРА: Пригодницька література (29 текстів)

Романи

Повісті

Оповідання

У Браунському корпусі: 15 романів і 14 оповідань.

В оригіналі  «пригоди та вестерни». Болгари визнали, що в них замало пригодницької  літератури, а вестернів узагалі  немає, й тому замінили ці підкатегорії на літературу в стилі фентезі та психологічні трилери (з яких деякі пригодницькі, а інші взагалі «антипригодницькі»)

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють.

P. ХУДОЖНЯ ЛІТЕРАТУРА: Любовна література (29 текстів)

Романи

Повісті

Оповідання

У Браунському корпусі: 14 романів і 15 оповідань.

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють.

R. ГУМОРИСТИЧНА ЛІТЕРАТУРА (9 текстів)

Романи

Есеї тощо.

У Браунському корпусі: 3 романи й 6 оповідань тощо (очевидно, фейлетони, гуморески).

Варто додати повісті – цей тип в англійськомовній традиції не виокремлюють.

У корпусі  ЛОБ поділ на статті з періодики, статті з інших гумористичних  книжок, які не є романами.


ІІІ. Паспортизація текстів

Для кожного  дібраного тексту необхідно заповнити таку анкету.

1. Автор/ Автори

1.1. Прізвище 

1.2. Ім'я: Повне  /Ініціали (якщо відоме)

2. Назва тексту

3. Назва видання

3.1. том

3.2. серія

3.3. випуск

3.4. номер

3.5. частина

3.6. місце публікації

3.7. назва видавництва 

3.8. назва сайту

3.9. адреса сайту

3.10. рік публікації

3.11. кількість сторінок

3.12. № сторінки/нок, з якої/их взято текст (у випадку друкованих видань)

3.13. Тип видання (для періодики, категорії А-С): загальнонаціональне / регіональне; щорічне / щоквартальне / щомісячне / щотижневе / щоденне

4. Дата створення  тексту 

5. Місце створення  тексту

6. Довжина фрагменту  (кількість слів) – заповнюється  пізніше, коли  буде визначено,  який саме фрагмент тексту  увійде до корпусу.

7. Категорія  у Браунському корпусі: А-R

8. Тема

(політика

спорт

суспільство

економіка -  включно з фінансами – але слід відрізняти економічні новини від економічної теорії (вона в гуманітарних науках)

театр

література

музика

танці

релігія

природничі науки і  математика

медицина

суспільні науки - розділ «політологія, право, педагогіка» належить частково до соціології (політологія і право), а частково до гуманітарних наук (педагогіка)

гуманітарні науки  - включно з літературознавством, мистецтвознавством, музикознавством

техніка та інженерна  справа

дозвілля та ремесла )

9. Стиль

(Художній

Науковий

Офіційно-діловий

Публіцистичний

Конфесійний

Епістолярний)

10. Жанр (залежить від категорії)

11. Форма тексту – письмовий (це значення за замовчуванням)

12. Первісний тип тексту – електронний/друкований

13. Оригінальність тексту – оригінал (це значення за замовчуванням)

14. Копірайт/дозвіл

15. Помилки

16. Дата публікації  тексту (для  онлайн текстів, опублікуваних уже не вперше)

17. Додаткові  дані

 


Информация о работе Браунівський корпус