Справочный Корпус Бамана

Поиск в корпусе

Инструкция по поиску в корпусе (PDF)

Частотный список лемм (UTF-8)

Справочный корпус бамана представляет собой аннотированный массив текстов на языке бамана (группа манден, семья манде, макросемья нигер-конго), на котором говорят 12-14 миллионов человек в Республике Мали (Западная Африка). В Корпус включаются письменные тексты различных жанров, как опубликованные (газеты, журналы, художественная литература и фольклор, учебники, практические пособия, религиозная литература…), так и неопубликованные (письма читателей в газеты; тексты, записанные собирателями…), созданные в разное время выходцами из разных диалектных зон бамана, а также транскрипции устных текстов. Это даёт основания считать, что Корпус, по мере своего количественного роста, будет всё полнее отражать нормативный вариант языка бамана во всём его разнообразии (и с учётом различных диалектных влияний).

В апреле 2012, когда был открыт доступ к Корпусу, его объём составлял примерно 1 100 100 словоупотреблений, в т.ч. около 28 000 в подкорпусе со снятой омонимией, и с тех пор эти цифры постоянно растут. Все тексты, включённые в Корпус, снабжены аннотацией, внесённой автоматическим морфологическим анализатором (частеречные пометы, французские глоссы, покомпонентный анализ сложных слов и дериват); в дезамбигуизированном подкорпусе вся омонимия, порождённая при автоматической аннотации, снята вручную. Начиная с февраля 2018 г., подкорпус с неснятой омонимией при каждом обновлении обрабатывается созданной Жан Жаком Мериком программой (основанной на его списке устойчивых выражений в бамана), что позволяет снизить число омонимичных разборов более чем в два раза. Постоянно проводится работа по повышению качества аннотации текстов.

Долгосрочной целью проекта явлется доведение объёма Корпуса до 7-10 миллионов словоупотреблений. В апреле 2018 года была достигнута поставленная первоначально задача доведения объёма текстов в подкорпусе со снятой омонимией до 1 млн. токенов.

Тогда же был опубликован синтаксически аннотированный подкорпус (который на момент публикации содержал 11381 слово и 956 предложений), в котором, помимо морфологической информации, отражена также синтаксическая структура текстов. Синтаксическая аннотация даётся в формате Universal Dependencies. Этот подкорпус доступен с поисковой страницы NoSketchEngine (ссылка «Поиск в корпусе» на стартовой странице, затем «Corpus – Corbama UD»).

В апреле 2018 года также был опубликован параллельный бамана-французский и французско-баманский корпус, который насчитывал в это время 99 163 слова в баманской в части и 116 177 слов во французской части. В этот корпус входят тексты, созданные изначально на бамана и переведённые на французский, или созданные на французском и затем переведённые на бамана, а также созданные на третьем языке и переведённые независимо на бамана и на французский (например, Коран). Сегменты баманского текста (как правило, предложения) поставлены в соответствие («синхронизированы») с сегментами французского текста. Параллельный корпус доступен с поисковой страницы NoSketchEngine (ссылка «Поиск в корпусе» на стартовой странице, затем «Corpus – Corbamafara» для поиска по баманским формам, или «Corpus – Corfarabama», для поиска по французским формам).

С апреля 2018 года Справочный корпус бамана входит в макро-проект «Mande Corpora», объединяющих несколько корпусных проектов для языков манде. Домашняя страница Mande Corpora доступна по данной ссылке.

Новости

Выпуск 1 апреля 2020 года

Общий объем корпуса: 11,140,640 слов. Подкорпус со снятой омонимией: 1,513,289 слова. Подкорпус с неснятой омонимией: 9,627,351 слов, в том чиле в в Пре-корпусе (ручной набор без выверки опечаток и метаразметки) : 3,827,309 слов. Параллельный бамана-французский и французско-баманский корпус: 225,288 слов в баманской части, 240,829 слов во французской части. Синтаксически аннотированный подкорпус: 1001 предложение и 12,045 слов.

Новации в Справочном корпусе бамана:

  1. В Корпус введены практически все имеющиеся в наличии письменные тексты бамана. Дальнейшее пополнение Корпуса планируется в основном за счёт новых публикаций и интернет-материалов, хотя мы надеемся также заполнить остающиеся лакуны в списке старых публикаций. Как бы то ни было, в дальнейшем рост абсолютного объёма Корпуса будет будет иметь значительно более низкие темпы, чем до сих пор. Работа по развитию Корпуса будет направлена, в первую очередь, на его качественное улучшение: сверку двойного набора и внесение метаданных в тексты «Пре-корпуса»; ручное снятие омонимии; совершенствование автоматического снятия омонимии; увеличение параллельного бамана-французского корпуса, а также корпуса с синтаксической аннотацией.
  2. В подкорпусе, обозначаемом как «Подкорпус с неснятой омонимией», а также в Пре-корпусе (т.е. в corbama-brut) проведено автоматическое (частичное) снятие омонимии путём применения программы, разработанной Жан Жаком Мериком и основанной на списке коллокаций. В результате доля омонимичных слов снижена до 25%, против 38% в предыдущей версии Корпуса (без применения этой программы эта доля составляла около 70%).
  3. В параллельном бамана-французском подкорпусе была уменьшена рассинхронизированная часть, однако избавиться от неё полностью пока что не удалось. При поиске рассинхронизированные фрагменты появляются в конце конкорданса.
  4. Справочный Корпус Бамана был переведён на платформу Huma-Num Национального центра научных исследований Франции (CNRS).

Новые тексты в подкорпусе со снятой омонимией:

  • Sidibe, Tumani Yalam. Cɛ jalamugufintigi. (Oroman tila 2 kɔnɔ). Bamako: CMDT/Imprimérie Kibaru, 1991, 8167 слов.
  • Soumaré, Penda. La femme sorcière. Galadio. Traduit par Coulibaly, Soulyemane; Coulibaly, Mamadou; Traoré, Mariam; Cissé, Seydou. Paris: l’Harmattan, 1996, 57 p., 1568 mots.
  • Susɔkɔ, Jeli Baba. Maraka Madi ni Bamanan Madi. Bamako : DNAFLA, 1992, 8182 слов.
  • Tarawele, Daramani. Baganlatɔlɔla: Misi ni saga. Bamakɔ: Kalan Diya, 2006, 6610 mots.
  • Tarawele, Daramani. Batigɛmisi. Bamakɔ: EDIM S.A., 1996, 14534 mots.

Периодика:

  • Dibifara 25, décembre 2003, 2920 слов
  • Dibifara 38, septembre 2006, 2673 слов
  • Faso kumakan, 15.08.1987, 2447 слов
  • Jɛkabaara 3, mars 1986, 4256 слов
  • Jɛkabaara 280, février 2009, 6496 слов
  • Kibaru 200, sept. 1989, 5313 слов
  • Kibaru 400, mai 2005, 11234 слов
  • Kibaru 567, avril 2019, 8745 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Balo, Massama. Daa Monson ni Ɲɛnama. Traduit par Dramé, Tieblé; Samaké, Raymond Paul. Bamako: École Normale Supérieure, 1979, 15665 слов.
  • Dembélé, Karim; Diarra, Zamalé. Chansons des chasseurs recueuillis dans la région de San (textes inédits en bambara et bomu). Bamako, 1979, 2229 слов.
  • Koné, Tiémoko. Soundiata. Trad. par Lassana Doucouré et Mme Marta. Bamako: Institut des sciences humaines – Niamey : Centre régional de documentation pour la tradition orale, (1970). 23712 слов.
  • Traoré, Benoît. Diɲɛkɔrɔba. Ed. par Bailleul, Charles (Kulubali, Baabilen). Bamako: Donniya, 1996, 27 p., 3106 слов.

Периодика:

  • Dibifara 1, sept. 2001, 6913 слов
  • Dibifara 2, oct. 2001, 6856 слов
  • Dibifara 3, nov. 2001, 7339 слов
  • Dibifara 4, dec. 2001, 5952
  • Dibifara 15, janv. 2003, 3755
  • Dibifara 26, dec. 2003, 2896 слов
  • Dibifara 27, janv. 2004, 3171 слов
  • Dibifara 38, sept. 2006, 2621 слов
  • Kalamɛnɛ 5 nov. 1992, 6354 слов
  • Kalamɛnɛ 6 dec. 1992, 5248 слов
  • Kalamɛnɛ 7 janv. 1993, 3843 слов
  • Kalamɛnɛ 8 fevr. 1993, 3235 слов
  • Kalamɛnɛ 9 janv. 1996, 2201 слов
  • Kalamɛnɛ 10 mars 1996, 2669 слов
  • Kalanso 1, juin 1977, 10871 слов

Kibaru

  • Kibaru danma 1974, 5279 слов
  • Kibaru, danma nimòrò, 22.09.1983, 3471 слов
  • Kibaru 190-191, nov.-déc. 1987, 9091 слов
  • Kibaru 195, avril 1989, 4660 слов
  • Kibaru 196, mai 1989, 4957 слов
  • Kibaru 197, juin 1989, 4931 слов
  • Kibaru 198, juillet 1989, 4471 слов
  • Kibaru 199, août 1989, 5016 слов
  • Kibaru 200, sept. 1989, 5254 слов
  • Kibaru 201, oct. 1989, 3718 слов
  • Kibaru 217, fev. 1990, 677 слов
  • Kibaru 240, janv. 1992, 2134 слов
  • Kibaru 1992 danma nimoro, 3286 слов
  • Kibaru 251, déc. 1992, 3126 слов
  • Kibaru 252, janvier 1993, 168 слов
  • Kibaru 325, fevrier 1999, 9129 слов
  • Kibaru 333, oct. 1999, 8 717 слов
  • Kibaru 335, dec. 1999, 10620 слов
  • Kibaru 339, avril 2000, 10760 слов
  • Kibaru 345, oct. 2000, 10082 слов
  • Kibaru 550, nov. 2017, 10289 слов
  • Kibaru 551, dec. 2017, 10622 слов
  • Kibaru 562, nov. 2018, 11996 слов
  • Kibaru 563, dec. 2018, 12445 слов
  • Kibaru 564, janv. 2019, 12185 слов
  • Kibaru 565, fevr. 2019, 8695 слов
  • Kibaru 566, mars 2019, 12619 слов
  • Kɔtɛ 1, juill. 1980, 1248 слов
  • Kɔtɛ 2, oct. 1980, 1084 слов
  • Kɔtɛ 3, janv. 1981, 1277 слов
  • Kɔtɛ 4, juill. 1981, 918 слов
  • Kɔtɛ 9, janv. 1986, 1927 слов
  • Kɔtɛ 10, sept. 1987, 2112 слов
  • Kɔtɛ 11, juin 1988, 2135 слов
  • Kɔtɛba kura 1, juin 1977, 2849 слов
  • Kɔtɛba kura 2, mai 1978, 2877 слов
  • Kɔtɛba kura 3, mai 1979, 4528 слов
  • Nafarinma 1, sept. 2001, 3930 слов
  • Ntuloma 01, sept. 1992, 6478 слов
  • Ntuloma 02, dec. 1992, 6916 слов
  • Ntuloma 03, mars 1993, 6486 слов
  • Ntuloma 04, juin 1993, 4879 слов
  • Ntuloma 05, sept. 1993, 7771 слов
  • Ntuloma 06, dec. 1993, 5848 слов
  • Ntuloma 07, mars 1994, 5733 слов
  • Ntuloma 08, juin 1994, 5224 слов
  • Ntuloma 10, dec. 1994, 3612 слов
  • Ntuloma 11, mars 1995, 3619 слов
  • Nyètaa 01, juillet 1979, 7487 слов
  • Nyètaa 02, octobre 1979, 11478 слов
  • Nyètaa 03, janvier 1980, 14483 слов
  • Nyètaa 05, mai 1981, 12040 слов
  • Nyètaa 06, mars 1983, 10233 слов
  • Nyètaa 10, juin 1985, 10234 слов
  • Nyètaa 11, mai 1986, 8363 слов
  • Nyètaa numéro spécial, sept. 1986 (12?), 10796 слов

Выпуск 27 июня 2019

Общий объем корпуса: 10 883 364 слова. Подкорпус со снятой омонимией: 1 439 054 слова. Параллельный бамана-французский и французско-баманский корпус: 225 288 слов в баманской части, 240 829 слов во французской части. Синтаксически аннотированный подкорпус: 1001 предложение и 12045 слов.

Новые тексты в подкорпусе со снятой омонимией Coulibaly, Soulyemane; Coulibaly, Mamadou; Traoré, Mariam; Cissé, Seydou. La femme sorcière. Galadio. Paris: l’Harmattan, 1996, 57 p., 1568 mots. Ɲɛ kɛnɛya sabatili walew. Bamako: Organisation pour la prévention de la cécité – DNAFLA, 111 p., 11426 mots. Sallée, Aliette; Rolland, Denis. Téné: conte bilingue bambara-français. Paris: l’Harmattan, 1995, 24 p. 1448 mots. Werner, David. Dɔgɔtɔrɔ tɛ sigida min na: Wulakɔnɔmɔgɔw ka yɛrɛfurakɛgafe (Là où il n’y a pas de docteur: Un manuel de soins de santé). Trad. par Bengali, Salifou; Bouaré, Fatoumata; Coulibaly, Abdoulaye; Dembélé, Diatrou. Bamako, 2016. http://gafe.dokotoro.org/multi.html 221100 mots.

Периодика: Jɛkabaara 300, octobre 2010, 6370 слов

  • Kibaru 500, septembre 2013, 99619 слов
  • Kibaru 558, juillet 2018, 11987 слов
  • Kibaru 559b, août 2018, 18224 слов
  • Kolonkisɛ 10, 01.02.1998, 4117 слов

Новые тексты в подкорпусе с неснятой омонимией: Werner, David; Thuman, Carol; Maxwell, Jane. Dɔgɔtɔrɔ tɛ sigida min na: Wulakɔnɔmɔgɔw ka yɛrɛfurakɛgafe. Traduit par: Bengali, Salifou; Bouaré, Fatoumata; Coulibaly, Abdoulaye; Dembélé, Diatrou; Magassa, Yagare. http://gafe.dokotoro.org/multi.html. 211422 mots.

Периодика:
  • Faso kumakan 24.10.1982, 1539 слов
  • Faso kumakan 14.11.1982, 1551 слов
  • Faso kumakan 28.11.1982, 1073 слов
  • Faso kumakan 12.12.1982, 1246 слов
  • Faso kumakan 19.12.1982, 730 слов
  • Faso kumakan 02.01.1983, 1422 слов
  • Faso kumakan 09.01.1983, 1719 слов
  • Faso kumakan 16.01.1983, 1754 слов
  • Faso kumakan 23.01.1983, 1404 слов
  • Faso kumakan 06.02.1983, 1450 слов
  • Faso kumakan 13.02.1983, 1767 слов
  • Faso kumakan 27.03.1983, 1532 слов
  • Faso kumakan 03.04.1983, 1965 слов
  • Faso kumakan 10.04.1983, 1867 слов
  • Faso kumakan 17.04.1983, 1950 слов
  • Faso kumakan 24.04.1984, 1248 слов
  • Faso kumakan 01.03.1984, 1790 слов
  • Faso kumakan 25.03.1984, 1532 слов
  • Faso kumakan 15.07.1984, 1691 слов
  • Faso kumakan 01.08.1984, 1853 слов
  • Faso kumakan 27.10.1984, 1188 слов
  • Faso kumakan 03.11.1984, 1024 слов
  • Faso kumakan 24.11.1984, 1234 слов
  • Faso kumakan 15.12.1984, 1401 слов
  • Faso kumakan 09.02.1985, 1102 слов
  • Faso kumakan 09.03.1985, 1468 слов
  • Faso kumakan 16.03.1985, 1330 слов
  • Faso kumakan 30.03.1985, 1518 слов
  • Faso kumakan 27.04.1985, 1623 слов
  • Faso kumakan 04.05.1985, 1791 слов
  • Faso kumakan 01.06.1985, 1405 слов
  • Faso kumakan 29.06.1985, 1604 слов
  • Faso kumakan 10.08.1985, 1228 слов
  • Faso kumakan 17.08.1985, 966 слов
  • Faso kumakan 12.10.1985, 1542 слов
  • Faso kumakan 23.11.1085, 1243 слов
  • Faso kumakan 28.12.1985, 1108 слов
  • Faso kumakan 11.01.1986, 1648 слов
  • Faso kumakan 18.01.1986, 1244 слов
  • Faso kumakan 25.01.1986, 1101 слов
  • Faso kumakan 15.02.1986, 1509 слов
  • Faso kumakan 29.03.1986, 1742 слов
  • Faso kumakan 05.04.1986, 1474 слов
  • Faso kumakan 03.05.1986, 1205 слов
  • Faso kumakan 17.05.1986, 1329 слов
  • Faso kumakan 07.06.1986, 1545 слов
  • Faso kumakan 12.07.1986, 1630 слов
  • Faso kumakan 19.07.1986, 1312 слов
  • Faso kumakan 06.09.1986, 1334 слов
  • Faso kumakan 13.09.1986, 1828 слов
  • Faso kumakan 11.10.1986, 1449 слов
  • Faso kumakan 11.10_1986bis (04.10.1986?), 2010 слов
  • Faso kumakan 18.10.1986, 1586 слов
  • Faso kumakan 09.11.1986, 1550 слов
  • Faso kumakan 07.02.1987, 1627 слов
  • Faso kumakan 14.03.1987, 1731 слов
  • Faso kumakan 28.03.1987, 1440 слов
  • Faso kumakan 18.04.1987, 1917 слов
  • Faso kumakan 09.05.1987, 1846 слов
  • Faso kumakan 23.05.1987, 2159 слов
  • Faso kumakan 13.06.1987, 2046 слов
  • Faso kumakan 15.08.1987, 2429 слов
  • Irisila kunnafoni 07.1983, 867 слов
  • Irisila kunnafoni 08.1988, 1101 слов
  • Jama 1, juillet 1979, 10309 слов
  • Jama 2, octobre 1979, 8982 слов
  • Jama 3, juin 1980, 7515 слов
  • Jama 4, 1984, 16813 слов
  • Jama 5, 1989, 11836 слов
  • Jama 6, 1990, 13216 слов
  • Jama 7, 1992, 5741 слов
  • Jama 8, 1994, 14428 слов
  • Jama 9, 1998, 13509 слов
  • Jama 11, 2002, 15079 слов
  • Jama 13, 2008, 8192 слов
  • Kalamɛnɛ 1 mai 1992, 4351 слов
  • Kalamɛnɛ 2 juillet 1992, 5829 слов
  • Kalamɛnɛ 3 sept. 1992, 3435 слов
  • Kalamɛnɛ 4 oct. 1992, 5259 слов
  • Kibaru 422, mars 2007, 9567 слов
  • Kibaru 423, avril 2007, 9653 слов
  • Kibaru 424, mai 2007, 9500 слов
  • Kibaru 425, juin 2007, 9798 слов
  • Kibaru 426, juillet 2007, 9891 слов
  • Kibaru 427, août 2007, 9353 слов
  • Kibaru 428, sept. 2007, 9425 слов
  • Kibaru 430, nov. 2007, 10052 слов
  • Kibaru 431, dec. 2007, 9791 слов
  • Kibaru 432, janv. 2008, 10223 слов
  • Kibaru 433, fevrier 2008, 9885 слов
  • Kibaru 434, mars 2008, 9373 слов
  • Kibaru 435, avril 2008, 9112 слов
  • Kibaru 436, mai 2008, 9442 слов
  • Kibaru 437, juin 2008, 9228 слов
  • Kibaru 438, juillet 2008, 9554 слов
  • Kibaru 440, sept. 2008, 8699 слов
  • Kibaru 441, oct. 2008, 7908 слов
  • Kibaru 442, nov. 2008, 9708 слов
  • Kibaru 443, dec. 2008, 9430 слов
  • Kibaru 444, janv. 2009, 9211 слов
  • Kibaru 445, fevr. 2009, 8653 слов
  • Kibaru 446, mars 2009, 9959 слов
  • Kibaru 447, avril 2009, 9444 слов
  • Kibaru 448, mai 2009, 9578 слов
  • Kibaru 449, juin 2009, 9406 слов
  • Kibaru 450, juillet 2009, 9015 слов
  • Kibaru 451, août 2009, 9415 слов
  • Kibaru 455, dec. 2009, 11737 слов
  • Kibaru 456, janv. 2010, 11012 слов
  • Kibaru 457, fevr. 2010, 11452 слов
  • Kibaru 458, mars 2010, 11231 слов
  • Kibaru 459, avril 2010, 11557 слов
  • Kibaru 460, mai 2010, 10843 слов
  • Kibaru 463, août 2010, 11236 слов
  • Kibaru 465, oct. 2010, 11018 слов
  • Kibaru 468, janv. 2011, 10438 слов
  • Kibaru 469, fevr. 2011, 10891 слов
  • Kibaru 470, mars 2011, 11062 слов
  • Kibaru 471, avril 2011, 11062 слов
  • Kibaru 472, mai 2011, 11273 слов
  • Kibaru 473, juin 2011, 12435 слов
  • Kibaru 474, juillet 2011, 11185 слов
  • Kibaru 475, août 2011, 11363 слов
  • Kibaru 476, sept. 2011, 10209 слов
  • Kibaru 477, oct. 2011, 11155 слов
  • Kibaru 478, nov. 2011, 9697 слов
  • Kibaru 479, dec. 2011, 10583 слов
  • Kibaru 480, janv. 2012, 10960 слов
  • Kibaru 481, fevr. 2012, 11016 слов
  • Kibaru 482, mars 2012, 11026 слов
  • Kibaru 483, avril 2012, 10608 слов
  • Kibaru 484, mai 2012, 10941 слов
  • Kibaru 485, juin 2012, 11590 слов
  • Kibaru 486, juillet 2012, 11726 слов
  • Kibaru 487, août 2012, 10605 слов
  • Kibaru 488, sept. 2012, 11674 слов
  • Kibaru 489, oct. 2012, 11063 слов
  • Kibaru 490, nov. 2012, 11353 слов
  • Kibaru 491, dec. 2012, 11016 слов
  • Kibaru 492, janv. 2013, 10958 слов
  • Kibaru 493, fevr. 2013, 11335 слов
  • Kibaru 494, mars 2013, 11350 слов
  • Kibaru 495, avril 2013, 11130 слов
  • Kibaru 496, mai 2013, 11069 слов
  • Kibaru 497, juin 2013, 10944 слов
  • Kibaru 498, juillet 2013, 10546 слов
  • Kibaru 499, août 2013, 11528 слов
  • Kibaru 501, oct. 2013, 10223 слов
  • Kibaru 502, nov. 2013, 10208 слов
  • Kibaru 503, dec. 2013, 10119 слов
  • Kibaru 504, janv. 2014, 10834 слов
  • Kibaru 505, fevr. 2014, 10999 слов
  • Kibaru 506, mars 2014, 10551 слов
  • Kibaru 507, avril 2014, 10855 слов
  • Kibaru 508, mai 2014, 11164 слов
  • Kibaru 509, juin 2014, 12114 слов
  • Kibaru 510, jillet 2014, 10399 слов
  • Kibaru 511, août 2014, 10558 слов
  • Kibaru 512, sept. 2014, 11222 слов
  • Kibaru 513, oct. 2014, 11687 слов
  • Kibaru 514, nov. 2014, 11577 слов
  • Kibaru 515, dec. 2014, 11274 слов
  • Kibaru 516, janv. 2015, 10315 слов
  • Kibaru 518, mars 2015, 10879 слов
  • Kibaru 519, avril 2015, 10539 слов
  • Kibaru 520, mai 2015, 9986 слов
  • Kibaru 521 juin 2015, 10354 слов
  • Kibaru 522 juillet 2015, 11090 слов
  • Kibaru 523 août 2015, 11454 слов
  • Kibaru 524 sept. 2015, 10795 слов
  • Kibaru 525 octobre 2015, 11850 слов
  • Kibaru 559a, août 2018, 6276 слов
  • Kibaru 560, sept. 2018, 12489 слов
  • Kibaru 561, octobre 2018, 11860 слов

Выпуск 15 апреля 2018

Общий объем корпуса: 5 220 107 слов

  • Подкорпус со снятой омонимией: 1 075 790 слов
  • Параллельный бамана-французский и французско-баманский корпус: 99 163 слов в баманской в части, 116 177 слова во французской части.
  • Синтаксически аннотированный подкорпус: 956 предложений и 11381 слов.
  • Подкорпус с неснятой омонимией: 4 144 317 слов.

Инновации в Корпусе:

  1. Сайт Справочного корпуса бамана (вместе со всеми своими подкорпусами) включён в сайт «Mande Corpora – Аннотированные текстовые корпуса на языках манде», который, помимо баманского включает также корпуса языков манинка и восточного дан (в ближайшем будущем планируется публикация на этом сайте корпусов и других языков семьи манде). Стартовая страница этого сайта доступна по этой сслыке.
  2. Опубликован параллельный бамана-французский и французско-баманский корпус. Выравнивание к параллельных корпусах выполнено на уровне предложений. Поиск в этом корпусе возможен как по баманскому, так и по французскому подкорпусам. При поиске по параллельному корпусу для каждого результата выводится предложение из параллельного корпуса.
  3. Опубликован синтаксически аннотированный подкорпус. Синтаксическая аннотация выполнена в формате Universal Dependencies.

Оба новых корпуса доступны с поисковой страницы NoSketchEngine (ссылка «Поиск в корпусе» на стартовой странице). Для поиска в синтаксически аннотированном подкорпусе нужно выбрать опцию «Corpus – Corbama UD». Для поиска в параллельном корпусе нужно выбрать опцию «Corpus – Corbamafara» (для поиска по баманскому слову) или «Corpus – Corfarabama» (для поиска по французскому слову).

Новые тексты в подкорпусе со снятой омонимией

  • Dumestre, Gérard & Touré, Seydou. Chroniques amoureuses. 92780 слов.

Периодика:

  • Kibaru 111, mai 1981, 3785 слов убрать и неснятого подкорпуса!
  • Kibaru 545, juin 2017, 11780 слов
  • Kibaru 546, juillet 2017, 12234 слов
  • Kibaru 547, août 2017, 11397 слов
  • Kibaru 548, sept. 2017, 11402 слов
  • Kibaru 549, oct. 2017, 11077 слов
  • Kibaru 552, janv. 2018, 11034 слов
  • Kibaru 553, fevr. 2018, 11391 слов

Синтаксически аннотированный корпус включает в себя следующие тексты:

  • Görög-Karady, Veronika; Meyer, Gérard. Contes bambara. Mali et Sénégal Oriental. Paris, Fleuve et Flamme, 1985, 174 p., 11381 mots.

Параллельный бамана-французский и французско-баманский корпус включает следующие тексты (указано число слов бамана, через косую черту – число французских слов):

  • Bailleul Ch. Sagesse bambara : proverbes et sentences. Bamako : Editions Donniya, 2005, 463 p. Chapitres 1 (4780/6484 mots), 2a (4906/6816 mots), 2b (6510/9311 mots), 2c (11641/16728 mots), 2d (4974/6905 mots), 2e (14883/20634 mots), 2f (2600/3753 mots).
  • Oumar N. Diarra, Nsiiirinw, 2012: Dununba kumata, 1491/1643 mots; Juguya sara, 664/752 mots.
  • (Kouyaté, Seydou Badian.) Sous l’orage. (une adaptation du livre). Pièce de théâtre jouée en bambara par des élèves du Lycée Askia Mohamed, 6611/6201 mots
  • Kuranɛ kɔrɔ, bayɛlɛmanen bamanankan na Alihaji Modibo Jara bolo. (Bamakɔ.) Vol. 1, 2011. Suran 1 (108/73 mots), 2 (16078/12114 mots).
  • Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997. Faamanjè ni Faantannjè, par Taïrou Bambéra, pp. 11-89, 13178/10766 mots; Cikèla ni bara, par Baba Fane, pp. 123-132, 9044/8683 mots; Suruku ni kònyòmusow, par Cèman Sangare, pp. 92-121, 4388/4089 mots.

Новые тексты в подкорпусе с неснятой омонимией:

  • Jarasuba, Caka. Koorokaara y’a ta juru sara cogo min suruku la. Bamako: Fayida, 1991, 16 p., 824 слова.

Периодика:

  • Kibaru 299, dec. 1996, 11432 слов
  • Kibaru 300, janv. 1997, 11044 слов
  • Kibaru 301, fevr. 1997, 11203 слов
  • Kibaru 302, mars 1997, 11109 слов
  • Kibaru 303, avril 1997, 9075 слов
  • Kibaru 305, juin 1997, 12916 слов
  • Kibaru 306, juillet 1997, 11380 слов
  • Kibaru 307, août 1997, 11097 слов
  • Kibaru 308, sept. 1997, 10158 слов
  • Kibaru 310, nov. 1997, 10143 слов
  • Kibaru 311, dec. 1997, 9658 слов
  • Kibaru 312, janv. 1998, 10165 слов
  • Kibaru 336, janv. 2000, 11148 слов
  • Kibaru 337, fevr. 2000, 7948 слов
  • Kibaru 338, mars 2000, 12658 слов
  • Kibaru 340, mai 2000, 10564 слов
  • Kibaru 341, juin 2000, 11577 слов
  • Kibaru 342, juillet 2000, 11663 слов
  • Kibaru 343, août 2000, 11088 слов
  • Kibaru 346, nov. 2000, 11452 слов
  • Kibaru 347, dec. 2000, 11737 слов
  • Kibaru 348, janv. 2001, 12580 слов
  • Kibaru 349, fevr. 2001, 11713 слов
  • Kibaru 350, mars 2001, 10608 слов
  • Kibaru 351, avr. 2001, 10830 слов
  • Kibaru 352, mai 2001, 11128 слов
  • Kibaru 353, juin 2001, 11460 слов
  • Kibaru 354, juillet 2001, 11266 слов
  • Kibaru 355, août 2001, 10785 слов
  • Kibaru 357, oct. 2001, 9174 слов
  • Kibaru 358, nov. 2001, 10153 слов
  • Kibaru 359, dec. 2001, 10351 слов
  • Kibaru 360, janv. 2002, 11757 слов
  • Kibaru 361, fevr. 2002, 7414 слов
  • Kibaru 362, mars 2002, 9127 слов
  • Kibaru 363, avril 2002, 8868 слов
  • Kibaru 367, août 2002, 9652 слов
  • Kibaru 369, oct. 2002, 8053 слов
  • Kibaru 370, nov. 2002, 9416 слов
  • Kibaru 371, dec. 2002, 8972 слов
  • Kibaru 372, janv. 2003, 7996 слов
  • Kibaru 373, fevr. 2003, 10182 слов

Выпуск 17 февраля 2018

Общий объем корпуса: 4 788 302 слова

  • Подкорпус со снятой омонимией: 974 346 слов
  • Подкорпус с неснятой омонимией: 3 813 956 слов

Инновации в Корпусе:

  1. К подкорпусу с неснятой омонимией (в полном объёме) была впервые применена автоматическая процедура частичного снятия омонимии на основе списка устойчивых выражений и синтаксических правил, разработанная Жан Жаком Мериком. Благодаря этому доля омонимии в этом подкорпусе (т.е. доля слов, для которых предлагается более одного варианта анализа) была снижена с 60-70% до примерно 31%, при этом доля привнесённых ошибочных разборов не превышает 5%.
  2. Тонально-рецессивные служебные слова (предикативные показатели, посессивная связка ka, сочинительный союз ni, и т.д., которым на глубинном уровне не приписан тон; их поверхностный тон меняется в зависимости от контекста) теперь представлены без тональной диакритики.
  3. Одновременно публикуется новая версия словаря Bamadaba. Исправлены некоторые ошибки, добавлены новые словарные статьи; некоторые лексемы снабжены аудиофайлами и иллюстрациями.

Новые тексты в подкорпусе со снятой омонимией

  • Kulubali, Baabilen (Charles Bailleul). Ta-tɛ-Ɲa: Ta-Tè_Nya ou Monsieur Réussit-pas. Editions Donniya, Bamako, 2016, 12 p. 1994 слов.

Периодика:

  • Jɛkabaara 171, janvier 2000, 6470 слов
  • Jɛkabaara 273, juillet 2008, 9069 слов
  • Kibaru 540, janvier 2017, 10319 слов
  • Kibaru 544, mai 2017, 11309 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Dumestre, Gérard & Touré, Seydou. Chroniques amoureuses.
  • Juin 1995: 18433 слов
  • Juillet 1995: 16312 слов
  • Août 1995: 16955 слов
  • Septembre 1995: 15113 слов
  • Octobre 1995: 14204 слов
  • Novembre 1995: 13 767 слов
  • Décembre 1995: 8521 слов
  • Janvier 1995: 326 слов

Периодика:

  • Jɛkabaara 172, février 2000, 8120 слов
  • Jɛkabaara 175, mai 2000, 8446 слов
  • Jɛkabaara 176, juin 2000, 7247 слов
  • Jɛkabaara 177, juillet 2000, 7188 слов
  • Jɛkabaara 179, septembre 2000, 7408 слов
  • Jɛkabaara 232, février 2005, 8117 слов
  • Jɛkabaara 234, avril 2005, 7679 слов
  • Jɛkabaara 235, mai 2005, 6912 слов
  • Jɛkabaara 237, juillet 2005, 7687 слов
  • Jɛkabaara 239, septembre 2005, 8955 слов
  • Jɛkabaara 297, juillet 2010, 5901 слов
  • Jɛkabaara 298, août 2010, 8082 слов
  • Jɛkabaara 299, sept. 2010, 5933 слов
  • Jɛkabaara 300, oct. 2010, 6111 слов
  • Jɛkabaara 301, nov. 2010, 5749 слов
  • Jɛkabaara 302, dec. 2010, 6201 слов
  • Jɛkabaara 303, janv. 2011, 5633 слов
  • Jɛkabaara 304, fevr. 2011, 5835 слов
  • Jɛkabaara 305, mars 2011, 5807 слов
  • Jɛkabaara 306, avril 2011, 6905 слов
  • Jɛkabaara 307, mai 2011, 6775 слов
  • Kibaru 51, mai 1976, 2293 слов
  • Kibaru 53, juillet 1976, 2459 слов
  • Kibaru 59, janvier 1977, 2092 слов
  • Kibaru 61, mars 1977, 1139 слов
  • Kibaru 77, juillet 1978, 2640 слов
  • Kibaru 78, août 1978, 2089 слов
  • Kibaru 79, septembre 1978, 4191 слов
  • Kibaru 83, janvier 1979, 3075 слов
  • Kibaru 84, février 1979, 2158 слов
  • Kibaru 86, avril 1979, 2668 слов
  • Kibaru 88, juin 1979, 3124 слов
  • Kibaru 90, août 1979, 2671 слов
  • Kibaru 91, sept. 1979, 3131 слов
  • Kibaru 92, oct. 1979, 2465 слов
  • Kibaru 93, nov. 1979, 3502 слов
  • Kibaru 94, dec. 1979, 2629 слов
  • Kibaru 95, janv. 1980, 3390 слов
  • Kibaru 98, avril 1980, 3536 слов
  • Kibaru 102, août 1980, 3816 слов
  • Kibaru 103, septembre 1980, 3606 слов
  • Kibaru 107, janvier 1981, 4931 слов
  • Kibaru 108, fevrier 1981, 5630 слов
  • Kibaru 109, mars 1981, 4236 слов
  • Kibaru 110, avril 1981, 5181 слов
  • Kibaru 111, mai 1981, 3868 слов
  • Kibaru 112, juin 1981, 4985 слов
  • Kibaru 114, août 1981, 3711 слов
  • Kibaru 115, sept. 1981, 4332 слов
  • Kibaru 116, oct. 1981, 4788 слов
  • Kibaru 117, nov. 1981, 4313 слов
  • Kibaru 118, dec. 1981, 4016 слов
  • Kibaru 119, janvier 1982, 4514 слов
  • Kibaru 120, février 1982, 4708 слов
  • Kibaru 122, avril 1982, 5195 слов
  • Kibaru 129, nov. 1982, 5276 слов
  • Kibaru 131, janvier 1983, 4469 слов
  • Kibaru 132, fevrier 1983, 4767 слов
  • Kibaru 133, mars 1983, 4275 слов
  • Kibaru 134, avril 1983, 5317 слов
  • Kibaru 135, mai 1983, 4332 слов
  • Kibaru 136, juin 1983, 4017 слов
  • Kibaru 137, juillet 1983, 4879 слов
  • Kibaru 138, août 1983, 4596 слов
  • Kibaru 139, sept. 1983, 4749 слов
  • Kibaru 140, oct. 1983, 4326 слов
  • Kibaru 182, mars 1987, 3082 слов
  • Kibaru 184, mai 1987, 3882 слов
  • Kibaru 254, mars 1993, 2860 слов
  • Kibaru 255, avril 1993, 2629 слов
  • Kibaru 256, mai 1993, 2020 слов
  • Kibaru 262, nov. 1993, 3839 слов
  • Kibaru 264, janvier 1994, 3361 слов
  • Kibaru 265, février 1994, 3056 слов
  • Kibaru 266, mars 1994, 3655 слов
  • Kibaru 267, avril 1994, 3717 слов
  • Kibaru 268, mai 1994, 3286 слов
  • Kibaru 269, juin 1994, 5339 слов
  • Kibaru 270, juillet 1994, 6740 слов
  • Kibaru 271, août 1994, 5860 слов
  • Kibaru 272, septembre 1994, 6886 слов
  • Kibaru 274, novembre 1994, 5861 слов
  • Kibaru 275, décembre 1994, 6154 слов
  • Kibaru 276, janvier 1995, 6931 слов
  • Kibaru 277, fevrier 1995, 6909 слов
  • Kibaru 278, mars 1995, 6094 слов
  • Kibaru 279, avril 1995, 6220 слов
  • Kibaru 280, mai 1995, 6453 слов
  • Kibaru 281, juin 1995, 6728 слов
  • Kibaru 282, juillet 1995, 6419 слов
  • Kibaru 283, août 1995, 7047 слов
  • Kibaru 284, septembre 1995, 6178 слов
  • Kibaru 286, novembre 1995, 7010 слов
  • Kibaru 287, décembre 1995, 7434 слов
  • Kibaru 288, janvier 1996, 9513 слов
  • Kibaru 289, février 1996, 10508 слов
  • Kibaru 292, mai 1996, 9405 слов
  • Kibaru 293, juin 1996, 9506 слов
  • Kibaru 294, juillet 1996, 9975 слов
  • Kibaru 295, août 1996, 9335 слов
  • Kibaru 296, sept. 1996, 10701 слов
  • Kibaru 298, nov. 1996, 10468 слов

Выпуск 13 марта 2017

Общий объем корпуса: 3,846 094 слов

  • Подкорпус со снятой омонимией: 700 034 слов
  • Подкорпус с неснятой омонимией: 3 146 060 слов

Изменения в морфологической разметке:

  • Был усовершенствован морфологический анализатор, что позволило снизить число неправильно порождаемых аннотаций. Проведена большая работа по выявлению неаннотированных слов, в результате число таких слов в Корпусе уменьшилось с 10,6% до 0,5% от общего числа. Число слов, аннотированных однозначно, впервые превысило половину и составило 50,85% от общего числа слов в Корпусе (в прежней версии Корпуса они эта цифра достигала всего 37,34%). В подкорпусе с неснятой омонимией число однозначно аннотированых слов поднялось с 23% до 40%.
  • Исправлены многие систематические ошибки автоматического анализа слов с дефисами (в первую очередь речь идёт о редуплицированных словах).
  • Произведёна замена частеречной пометы посессивного показателя: ká:conj:POSS >> ká:pp:POSS.

Изменения в поисковом интерфейсе:

  • Установлена версия манинка (в письменности нко) интерфейса поисковика NoSketchEngine. Для перехода на неё нужно кликнуть «шестерёнку» в правом верхнем углу экрана и выбрать ߒߞߏ из списка языков.

Новые тексты в подкорпусе со снятой омонимией

  • Musokònòma ka banaw. Bamakɔ, 495 слов.
  • Musow ka baaraw Kaarata mara kɔnɔ. Bamakɔ: DNAFLA-ODIK, 1992, 919 слов.

Kuranɛ * Suran 6, 7498 слов

Периодика:

  • Jɛkabaara 1, janv. 1986, 3485 слов
  • Jɛkabaara 329, janv. 2014, 6335 слов
  • Jɛkabaara 332, avril 2014, 6501 слов
  • Kibaru 466, novembre 2010, 11382 слов
  • Kibaru 528, janvier 2016, 10731 слов
  • Kibaru 533, juin 2016, 12297 слов
  • Kibaru 534, juillet 2016, 10247 слов
  • Kibaru 535, août 2016, 11484 слов
  • Kibaru 536, septembre 2016, 9711 слов
  • Kibaru 537, octobre 2016, 9702 слов
  • Kibaru 538, novembre 2016, 11391 слов
  • Kibaru 539, décembre 2016, 10911 слов

Новые тексты в подкорпусе с неснятой омонимией:

Kuranɛ

  • Suran 8, 3069 слов
  • Suran 9, 5910 слов

Периодика:

  • Jɛkabaara 1, janv. 1986, 3485 слов
  • Jɛkabaara 4, avril 1986, 3698 слов
  • Jɛkabaara 5, mai 1986, 2873 слов
  • Jɛkabaara 7, juillet 1986, 3617 слов
  • Jɛkabaara 8, août 1986, 4593 слов
  • Jɛkabaara 9, septembre 1986, 3909 слов
  • Jɛkabaara 16, avril 1987, 3421 слов
  • Jɛkabaara 17, mai 1987, 3936 слов
  • Jɛkabaara 18, juin 1987, 3766 слов
  • Jɛkabaara 19, juillet 1987, 4534 слов
  • Jɛkabaara 20, août 1987, 5558 слов
  • Jɛkabaara 21, septembre 1987, 5209 слов
  • Jɛkabaara 22, octobre 1987, 5041 слов
  • Jɛkabaara 44, août 1989, 4619 слов
  • Jɛkabaara 45, septembre 1989, 6655 слов
  • Jɛkabaara 46, octobre 1989, 6684 слов
  • Jɛkabaara 47, novembre 1989, 8052 слов
  • Jɛkabaara 48, decembre 1989, 5637 слов
  • Jɛkabaara 51, mars 1990, 5650 слов
  • Jɛkabaara 53, mai 1990, 5056 слов
  • Jɛkabaara 54, juin 1990, 5799 слов
  • Jɛkabaara 56, août 1990, 6663 слов
  • Jɛkabaara 57, septembre 1990, 7469 слов
  • Jɛkabaara 58, octobre 1990, 7715 слов
  • Jɛkabaara 59, novembre 1990, 6913 слов
  • Jɛkabaara 61, janvier 1991, 5571 слов
  • Jɛkabaara 63, mars 1991, 5475 слов
  • Jɛkabaara 65, mai 1991, 6685 слов
  • Jɛkabaara 66, juin 1991, 6944 слов
  • Jɛkabaara 68, août 1991, 5533 слов
  • Jɛkabaara 69, septembre 1991, 6116 слов
  • Jɛkabaara 70, octobre 1991, 5912 слов
  • Jɛkabaara 71, novembre 1991, 5836 слов
  • Jɛkabaara 72, decembre 1991, 7118 слов
  • Jɛkabaara 73, janvier 1992, 7402 слов
  • Jɛkabaara 74, février 1992, 6791 слов
  • Jɛkabaara 75, mars 1992, 6921 слов
  • Jɛkabaara 76, avril 1992, 7364 слов
  • Jɛkabaara 77, mai 1992, 4897 слов
  • Jɛkabaara 78, juin 1992, 5395 слов
  • Jɛkabaara 79, juillet 1992, 9645 слов
  • Jɛkabaara 80, août 1992, 7272 слов
  • Jɛkabaara 81, septembre 1992, 7921 слов
  • Jɛkabaara 82, octobre 1992, 6966 слов
  • Jɛkabaara 83, novembre 1992, 7330 слов
  • Jɛkabaara 84, décembre 1992, 8299 слов
  • Jɛkabaara 85, janvier 1993, 7732 слов
  • Jɛkabaara 86, février 1993, 7716 слов
  • Jɛkabaara 87, mars 1993, 7053 слов
  • Jɛkabaara 88, avril 1993, 5251 слов
  • Jɛkabaara 90, juin 1993, 6863 слов
  • Jɛkabaara 91, juillet 1993, 6094 слов
  • Jɛkabaara 92, août 1993, 10691 слов
  • Jɛkabaara 93, septembre 1993, 9120 слов
  • Jɛkabaara 94, octobre 1993, 7298 слов
  • Jɛkabaara 95, novembre 1993, 7048 слов
  • Jɛkabaara 97, janvier 1994, 9002 слов
  • Jɛkabaara 99, mars 1994, 8274 слов
  • Jɛkabaara 102, mai 1994, 9075 слов
  • Jɛkabaara 103, juin 1994, 9054 слов
  • Jɛkabaara 104, juillet 1994, 8451 слов
  • Jɛkabaara 105, août 1994, 7465 слов
  • Jɛkabaara 106, septembre 1994, 8774 слов
  • Jɛkabaara 108, novembre 1994, 9079 слов
  • Jɛkabaara 110, janvier 1995, 8077 слов
  • Jɛkabaara 111, février 1995, 7925 слов
  • Jɛkabaara 112, mars 1995, 8414 слов
  • Jɛkabaara 113, avril 1995, 6904 слов
  • Jɛkabaara 114, mai 1995, 8925 слов
  • Jɛkabaara 116, juillet 1995, 8707 слов
  • Jɛkabaara 117, août 1995, 8397 слов
  • Jɛkabaara 118, septembre 1995, 7694 слов
  • Jɛkabaara 119, octobre 1995, 7598 слов
  • Jɛkabaara 120, novembre 1995, 9131 слов
  • Kibaru 320, sept. 1998, 8487 слов
  • Kibaru 321, oct. 1998, 9427 слов
  • Kibaru 322, nov. 1998, 8077 слов
  • Kibaru 323, dec. 1998, 9745 слов
  • Kibaru 324, janv. 1999, 10294 слов
  • Kibaru 331, août 1999, 9931 слов
  • Kibaru 334, nov. 1999, 10193 слов
  • Kibaru 365, juin 2002, 8137 слов
  • Kibaru 366, juillet 2002, 8503 слов
  • Kibaru 378, juillet 2003, 10066 слов
  • Kibaru 417, octobre 2006, 10237 слов
  • Kibaru 429, octobre 2007, 9114 слов
  • Kibaru 433, fevrier 2008, 9885
  • Kibaru 434, mars 2008, 9373 слов
  • Kibaru 452, sept. 2009, 11659 слов
  • Kibaru 453, oct. 2009, 10139 слов
  • Kibaru 541, février 20017, 9361 слов

Выпуск 23 сентября 2016

Общий объем корпуса: 3 139 361 слов

  • Подкорпус со снятой омонимией: 575 488 слов
  • Подкорпус с неснятой омонимией: 2 563 873 слов

Новые тексты в подкорпусе со снятой омонимией:

Периодика:

Kibaru 532, mai 2016, 12297 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Kuranɛ, Suran 70: 736 слов
  • Kuranɛ, Suran 71: 655 слов
  • Kuranɛ, Suran 72: 905 слов
  • Kuranɛ, Suran 73: 654 слов
  • Kuranɛ, Suran 74: 791 слов
  • Kuranɛ, Suran 75: 537 слов
  • Kuranɛ, Suran 76: 694 слов
  • Kuranɛ, Suran 77: 653 слов
  • Kuranɛ, Suran 78: 513 слов
  • Kuranɛ, Suran 79: 637 слов
  • Kuranɛ, Suran 80: 480 слов
  • Kuranɛ, Suran 81: 354 слов
  • Kuranɛ, Suran 82: 228 слов
  • Kuranɛ, Suran 83: 559 слов
  • Kuranɛ, Suran 84: 343 слов

Периодика:

Kibaru

  • № 30, août 1974, 2739 слов
  • № 213, octobre 1989, 5261 слов
  • № 214, novembre 1989, 3874 слов
  • № 216, janvier 1990, 3323 слов
  • № 222, juillet 1990, 3803 слов
  • № 223, août 1990, 4094 слов
  • № 225, octobre 1990, 5819 слов
  • № 226, novembre 1990, 4245 слов
  • № 227, décembre 1990, 5202 слов
  • № 228, janvier 1991, 4753 слов
  • № 244, mai 1992, 3022 слов
  • № 253, février 1993, 3359 слов
  • № 257, juin 1993, 3886 слов
  • № 273, oct. 1994, 6278 слов
  • № 285, oct. 1995, 6718 слов
  • № 290, mars 1996, 9937 слов
  • № 291, avril 1996, 10512 слов
  • № 297, octobre 1996, 10331 слов
  • № 304, mai 1997, 11046 слов
  • № 314, mars 1998, 10062 слов
  • № 315, avril 1998, 9012 слов
  • № 316, mai 1998, 9571 слов
  • № 317, juin 1998, 8452 слов
  • № 318, juillet 1998, 1054 слов
  • № 319, août 1998, 10920 слов
  • № 454, novembre 2009, 10935 слов
  • № 533, juin 2016, 10062 слов
  • № 534, jillet 2016, 9938 слов

Jɛkabaara №№ 275-277, 279-283 разбиты на статьи, добавлены метаданные.

Выпуск 25 июня 2016

Общий объем корпуса: 2 941 508 слов

  • Подкорпус со снятой омонимией:  563 190 слов
  • Подкорпус с неснятой омонимией: 2 378 318 слов

Проведена чистка подкорпуса со снятой омонимией, устранены многочисленные ошибки в аннотации.

Новые тексты в подкорпусе со снятой омонимией:

  • Bailleul Ch. Sagesse bambara : proverbes et sentences. Bamako : Editions Donniya, 2005, 463 p. Chapitres 1 (4435 слов), 2a (4559 слов), 2b (6120 слов), 2c (10925 слов).
  • Jara, Usumani; Jara, Yakuba. Baganw ka minnɔgɔlaminɛ taamajan. Bamakɔ: Le figuier, 1996, 762 слов.
  • Kamara, Idirisa. Donon kasira (Poyi). Bamakɔ: Sahelienne, 1996. 3527 слов.
  • Kuranɛ, Suran 5, 6942 слов

Сказки бамана:

  • Jara, Umaru Ɲanankɔrɔ. Juguya sara. 650 слов.
  • Jara, Umaru Ɲanankɔrɔ. Ntalen. 1725 слов.
  • Jara, Umaru Ɲanankɔrɔ. Sigidankelen ka labanko juguya. 978 слов.
  • Jara, Umaru Ɲanankɔrɔ. Warabilenkɔrɔ ka walijuya. 1640 слов.

Периодика:

  • Kibaru 160-179, dec. 1986, 3592 слов
  • Kibaru 258, juillet 1993, 10084 слов
  • Kibaru 526, nov. 2015, p. 1-3, 3856 слов
  • Kibaru 530, mars 2016, 9450 слов
  • Kibaru 531, avril 2016, 10756 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Ebola poster, 527 слов
  • Tarawele, Daramani. Masala gafe. Bamakɔ: Kalan diya, 6967, слов.
  • Tarawele, Daramani. Masalabolo. Bamakɔ: Kalan diya, 16515, слов.
  • Tarawele, Daramani. Siginikalan n’a kɔfɛkalanw waleyacogo. Bamakɔ: Kalan diya, 2013 слов.
  • Werner, David. Dɔgɔtɔrɔ tɛ sigida min na: Wulakɔnɔmɔgɔw ka yɛrɛfurakɛgafe (Là où il n’y a pas de docteur: Un manuel de soins de santé). Trad. par Bengali, Salifou; Bouaré, Fatoumata; Coulibaly, Abdoulaye; Dembélé, Diatrou. Bamako, 2016. Ɲɛbila, Sigida 1, 2, 3, 20, Ebola, 26351 слов

Периодика:

Kibaru

  • No. 3, mai 1972, 2029 слов
  • No. 4, juin 1972, 2712 слов
  • No. 5, juillet 1972, 2196 слов
  • No. 6, août 1972, 2367 слов
  • No. 7, septembre 1972, 708 слов
  • No. 8, octobre 1972, 2043 слов
  • No. 9, novembre 1972, 2275 слов
  • No. 10, décembre 1972, 2485 слов
  • No. 11, janvier 1973, 2005 слов
  • No. 104, octobre 1980, 2639 слов
  • No. 123, mai 1982, 4344 слов
  • No. 130, decembre 1982, 4000 слов
  • No. 142-150, septembre 1986, 3553 слов
  • No. 180, février 1987, 3493 слов
  • No. 181, mars 1987, 3544 слов
  • No. 183, avril 1987, 4283 слов
  • No. 185, juin 1987, 4225 слов
  • No. 186-188, septembre 1987, 4090 слов
  • No. 189, octobre 1987, 6252 слов
  • No. 194, mars 1988, 4744 слов
  • No. 203-203, decembre 1988, 6155 слов
  • No. 211, août 1989, 4364 слов
  • No. 218, mars 1990, 2190 слов
  • No. 219, avril 1990, 3176 слов
  • No. 220, mai 1990, 3389 слов
  • No. 221, juin 1990, 3716 слов
  • No. 224, septembre 1990, 4253 слов
  • No. 229, janvier 1991, 4483 слов
  • No. 230, février 1991, 3403 слов
  • No. 231, mars 1991, 4518 слов
  • No. 232, avril 1991, 3290 слов
  • No. 233, mai 1991, 3854 слов
  • No. 234, juin 1991, 6027 слов
  • No. 235, juillet 1991, 4180 слов
  • No. 236, août 1991, 3884 слов
  • No. 237, septembre 1991,4066 слов
  • No. 238, octobre 1991, 1622 слов
  • No. 241, février 1992, 3954 слов
  • No. 242, mars 1992, 3931 слов
  • No. 243, avril 1992, 2410 слов
  • No. 245, juin 1992, 2948 слов
  • No. 246, juillet 1992, 4242 слов
  • No. 247, août 1992, 3812 слов
  • No. 248, septembre 1992, 3349 слов
  • No. 249, octobre 1992, 2499 слов
  • No. 250, novembre 1992, 2746 слов
  • No. 259,, août 1993, 4579 слов
  • No. 260, septembre 1993, 5216 слов
  • No. 261, octobre 1993, 4761 слов
  • No. 263, decembre 1993, 3671 слов
  • No. 529, février 2016, 11358 слов

Выпуск 2016.02

Общий объем корпуса: 2,823,480 слов

  • Подкорпус со снятой омонимией: 492,296 слов
  • Подкорпус с неснятой омонимией: 2,331,184 слов

Новые тексты в подкорпусе со снятой омонимией:

Тексты песен:

  • Bagayogo, Amadou & Doumbia, Mariam. Báara, Ámàdu ní Máriyamu. 593 слов.

Периодика:

Kibaru

  • № 13, Mars 1973, 3286 слов
  • № 527, декабрь 2015, 10900 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Bɛnkansɛbɛn min bɔra Alize sigikafɔw la ka ɲɛsin basigi ni bɛnɲinini ma Mali kɔnɔ (accord d’Alger). 2015, 9707 слов.
  • Kuranɛ, Suran 5, 6764 слов; Suran 6, 7225 слов; 90-114, 3657 слов

Тексты песен:

  • Bagayogo, Amadou & Doumbia, Mariam. Tubalakɔnɔ. 553 слов.
  • Diawara, Fatoumata. Boloko. 430 слов.
  • Diawara, Fatoumata. KANU. 341 слов.
  • Diawara, Fatoumata. Timbuktu Faso. 200 слов.
  • Doucouré, Ismaïla, dit Master Soumy. Explique ton Islam. 955 слов.
  • Keïta, Salif. Folon. 138 слов.
  • Keïta, Salif. Papa. 413 слов.
  • Koïté, Habib. Maliba. 226 слов.
  • Koïté, Habib. Masakɛ. 296 слов.
  • Sangaré, Oumou. JARABI NƐNƐ. 354 слов.
  • Sissoko, Baba. A BOLILA. 240 слов.
  • Traoré, Rokia. DUƝA. 316 слов.
  • Traoré, Rokia. Wanita. 321 слов.

Kibaru

  • № 2, avril 1972, 1992 слов
  • № 14, avril 1973, 1583 слов
  • № 15, mai 1973, 2576 слов
  • № 16, juin 1973, 1979 слов
  • № 18, août 1973, 2639 слов
  • № 19, septembre 1973, 2617 слов
  • № 20, octobre 1973, 2831 слов
  • № 21, novembre 1973, 2819 слов
  • № 22, décembre 1973, 1447 слов
  • № 23, janvier 1974, 2912 слов
  • № 24, février 1974, 2810 слов
  • № 25, mars 1974, 1894 слов
  • № 26, avril 1974, 2305 слов
  • № 27, mai 1974, 2609 слов
  • № 28, juin 1974, 2309 слов
  • № 31, sept. 1974, 2331 слов
  • № 32, octobre 1974, 2823 слов
  • № 33, novembre 1974, 2345 слов
  • № 34, décembre 1974, 1233 слов
  • № 35, janvier 1975, 3103 слов
  • № 36, février 1975, 2006 слов
  • № 37, mars 1975, 2484 слов
  • № 38, avril 1975, 2679 слов
  • № 39, mai 1975, 2918 слов
  • № 40, juin 1975, 2495 слов
  • № 42, août 1975, 2450 слов
  • № 43, septembre 1975, 2417 слов
  • № 44, octobre 1975, 2508 слов
  • № 45, novembre 1975, 1772 слов
  • № 46, décembre 1975, 1174 слов
  • № 47, janvier 1976, 2789 слов
  • № 48, février 1976, 2275 слов
  • № 49, mars 1976, 2622 слов
  • № 50, avril 1976, 1548 слов
  • № 54, août 1976, 1319 слов
  • № 55, septembre 1976, 2536 слов
  • № 56, octobre 1976, 1313 слов
  • № 57, novembre 1976, 1274 слов
  • № 58, décembre 1976, 431 слов
  • № 60, février 1977, 1277 слов
  • № 63, mai 1977, 1261 слов
  • № 64, juin 1977, 1834 слов
  • № 66, août 1977, 1719 слов
  • № 67, septembre 1977, 4496 слов
  • № 68, octobre 1977, 3894 слов
  • № 69, novembre 1977, 4269 слов
  • № 70, décembre 1977, 2969 слов
  • № 71, janvier 1978, 4319 слов
  • № 72, février 1978, 4291 слов
  • № 73, mars 1978, 2257 слов
  • № 74, avril 1978, 2599 слов
  • № 75, mai1978, 2550 слов
  • № 76, juin 1978, 2228 слов
  • № 80, octobre 1978, 4094 слов
  • № 82, décembre 1978, 1928 слов
  • № 85, mars 1979, 4152 слов
  • № 87, mai 1979, 3223 слов
  • № 96, fevrier 1980, 3532 слов
  • № 97, mars 1980, 3902 слов
  • № 99, mai 1980, 4370 слов
  • № 100, juin 1980, 4998 слов
  • № 105, novembre 1980, 2055 слов
  • № 106, décembre 1980, 1814 слов
  • № 121, mars 1982, 4081 слов
  • № 124, juin 1982, 3450 слов
  • № 126, août 1982, 3631 слов
  • № 127, septembre 1982, 4227 слов
  • № 128, octobre 1982, 5192 слов
  • № 192-193, janvier-février 1988, 7380 слов
  • № 205, février 1989, 5698 слов
  • № 206, mars 1989, 4903 слов
  • № 207, avr. 1989, 4153 слов
  • № 208, mai 1989, 3892 слов
  • № 210, juillet 1989, 4517 слов
  • № 212, sept. 1989, 2517 слов
  • № 258, juillet 1993, 4209 слов

Выпуск 2015.10

Общий объем корпуса: 2,819,474 слов

  • Подкорпус со снятой омонимией: 426,813 слов
  • Подкорпус с неснятой омонимией: 2,392,661 слов

Изменения в аннотации:

  • глосса суффикса -tɔ PTCP.PROG (прогрессивное причастие) заменена на CONV.PROG (прогрессивное деепричастие)
  • глосса послелога bólo POSS заменена на CNTRL

Новые тексты в подкорпусе со снятой омонимией:

  • Konatɛ, Musa. Aladɛn ni jinɛmori lanpan. Bamako: Le figuier, [1996], 12 p., 1180 mots.
  • Sisoko, Jeli Baba. Daa ka Kòrè kèlè. Bamako: EDIM, 1977, 19452 слов.
  • Dumestre, Gérard; Maïga, Ismaël. Baabu ni baabu. Paris: Editions du MRAP/Différences 1993.
    • Ja bè se ka kèlè cogo di ? 221 слов.
    • Daga ni kolon. 204 слова.
    • Tulogeren saba. 735 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Baganmisen lamaracogo (Sagaw ni baw). Bamakɔ, Inades-Formation, 1991, 12054 слов.
  • Bagayogo, Cemogo; Coulibaly, Daniel. Dugukolonɔn kɛlɛli cogo. Inades-Formation. 7608 слов.
  • Baro nafamaw: Afɛmu musow ka gafe filanan. Bamakɔ: Association des Femmes Educatrices du Mali - UNICEF/Mali, 1593 слов.
  • Diarra, Justin. Etapes de la vie de l’homme Bambara dans la societe traditionnelle (Cɛ sigidamaw). Falajɛ: C.E.L. (1989), 6752 слов.
  • Duguyiriwa tɔn tɛmɛsiraw. Bamakɔ, ODIK, 1990, 15 p., 775 слов.
  • Dunbiya, Siyaka. Waleɲumandɔnbaliya. Bamakɔ: Jamana, 1997, 742 слов.
  • Hayidara-Maha, Mahamadu. Jɛgɛnin. Traduit par Jara, Yala. Bamako: Imprimérie Mali-Offset, 1997, 5566 слов.
  • Jakite, Mamadu. Dɔlɔminbana. Bamakɔ: DNAFLA - LHVN – USAID, 1993, 38 p., 6425 слов.
  • Jara, Usumani; Jara, Yakuba. Baganw ka minnɔgɔlaminɛ taamajan. Bamakɔ: Le figuier, 1996, 762 слов.
  • Jarasuba, Caka. Diden lakalilen denmisɛnninw ye. Bamakɔ: Fayida, 1441 слов.
  • Kamara, Bakari; Tera, Jɔb; Traore, Abdul Karim; Jalo, Famori. Baganlafa. Bamakɔ: Sahélienne, 2249 слов.
  • Kamara, Idirisa. Donon kasira (Poyi). Bamakɔ: Sahelienne, 1996. 3527 слов.
  • Kamisɔkɔ, Fajala Sanfin. Balikukalan man kɛnɛ (ɲɔgɔlɔn). Bamakɔ: Sahelienne, 1996. 5942 слов.
  • Kènèya sabatili walew. Kolokani, DNAFLA-AFVP, 9251 слов.
  • Musokònòma ka banaw. Bamakɔ, 495 слов.
  • Musow ka baaraw Kaarata mara kɔnɔ. Bamakɔ: DNAFLA-ODIK, 1992, 919 слов.
  • Tarawele, Daramani. Baganlatɔlɔla: Misi ni saga. Bamakɔ: Kalan Diya, 2006, 6445 слов.
  • Tarawele, Daramani. Batigɛmisi. Bamakɔ: EDIM S.A., 1996, 13745 слов.
  • Tɔn ɲɛmɔgɔw ka baaraw. Bamakɔ: DNAFLA – ODIK, 1993, 1004 слов.

Периодика:

Jɛkabaara

  • № 43, июль 1989, 6287 слов

Kibaru

  • № 62, апрель 1977, 1318 слов

Выпуск 2015.04

Общий объем корпуса: 2,678,048

  • Подкорпус со снятой омонимией: 401,099 слов
  • Подкорпус с неснятой омонимией: 2,276,949 слов

Проведена большая работа по выявлению и исправлению ошибок в аннотации в подкорпусе со снятой омонимией; всего выправлено более 4000 ошибок. Обновлена интернет-версия словаря Bamadaba.

Новые тексты в подкорпусе со снятой омонимией:

  • Bani ɲɛnɛma. Bamako, 1989, 40 p., 6570 слов
  • Kuranɛ, Suran 1 (100 слов), 2 (16011 слов)

Görög, Veronika. Contes bambara du Mali. Paris : Publications orientalistes de France, 1979. Следующие сказки введены в Корпус:

  • Fa ni a ka taman, p. 12-14, 691 слово
  • Kunatòkè ni faama denmuso, p. 19-23, 1655 слов
  • Muso nyininaw ni sanu daga, p. 25-32, 2482 слов
  • Dennin ni mògò yèlèma, p. 34-37, 1363 слов
  • Nanyuman ni cè min yèlèmana ka a a kè sebe ye, p. 39-41, 1139 слов
  • Sinamuso fila: wulu ni shè, p. 43-46, 988 слов
  • Sinamuso fila:jugunin ni nkuman, p. 47-48, 474 слов
  • Sinamuso tagara jinèdugu la, p. 49-51, 1165 слов
  • Falatònin ni toro sun, p. 56-57, 612 слов
  • Nin kèra dennin fila ye, p. 58-61, 1519 слов
  • Dugutigi ye falatònin gwèn, p. 69-71, 791 слов
  • Kungo sogow ye cènin min dèmè, p. 72-77, 2100 слов
  • Ku yèlèmanen ka a kè den ye, p. 89-91, 859 слов
  • Den nyuman ni bòrò saba, p. 93-94, 868 слов
  • Mamadi hòròn ni Mamadi jòn, p. 95-96, 700 слов
  • Waraden min bè fèn bèe faga, p. 102-103, 469 слов
  • Donsokè Siriman, p. 104-108, 1591 слов
  • Sènèkèla ni jinèw, p. 110-111, 565 слов

Периодика:

  • Jɛkabaara 273, статьи со снятием омонимии: 5371 слов
  • Kalankisɛ, No. 10, февраль 1998, статьи со снятием омонимии: 1663 слов

Новые тексты в подкорпусе с неснятой омонимией:

  • Bailleul, Charles. Sagesse bambara : Proverbes et sentences. Bamako : Donniya, 2005, 50215 слов
  • Kuranɛ, Ɲɛbila 1, 1478 слов; Suran 3, 8399 слов; Ɲɛbila 2; 934 слов; Suran 7, 8204 слов

Периодика:

  • Jɛkabaara - № 3, март 1986, 4121 слов - № 25, январь 1988, 5617 слов - № 35-36, nov.-dec. 1988, 5617 слов - № 273, июль 2998, статьи без снятия омонимии: 3698 слов
  • Kibaru - № 125, июль 1982, 4035 слов - № 141, ноябрь 1983, 4286 слов - № 204, январь 1989, 4953 слов - № 215, декабрь 1989, 2485 слов - № 239, декабрь 1991, 2598 слов - № 309, октябрь 1997, 9349 слов - № 344, сентябрь 2000, 10625 слов - № 356, сентябрь 2001, 9564 слов - № 368, сентябрь 2002, 9464 слов - № 380, сентябрь 2003, 9410 слов - № 384, январь 2004, 10521 слов - № 405, октябрь 2005, 9464 слов

Выпуск 2015.02

Общий объем корпуса: 2,129,180

  • Подкорпус со снятой омонимией: 365,357 слов
  • Подкорпус с неснятой омонимией: 1,763,823 слов

Этот выпуск в основном посвящен исправлению технических ошибок в корпусе и целого ряда содержательных ошибок в аннотации. Объем подкорпуса с неснятой омонимией немного уменьшился по сравнению с предыдущим выпуском, т.к. из корпуса удалены случайно попавшие туда посторонние материалы.

Новые тексты в подкорпусе со снятой омонимией:

Книги:

  • Dumestre, Gérard. Geste de Ségou. Paris : Armand Colin, 1979. (3) Duga de Koré, pp. 183-263, 8650 слов; (4) Avenement de Da, pp. 265-357, 9241 слов; (5) Biton et les génies, pp. 359-399, 3855 слов

Периодика:

  • Kibaru № 29, июль 1974, 2329 слов

Выпуск 2015.01

Общий объем корпуса: 2,165,534 слов

  • Подкорпус со снятой омонимией: 339,699 слов
  • Подкорпус с неснятой омонимией: 1,825,835 слов

Изменения в аннотации:

  • Поле word (поле для поиска по умолчанию) теперь всегда содержит орфографически нормализованную форму (приведенную к новой орфографии). При необходимости поиска по исходному написанию следует использовать поле original.
  • Поле gloss теперь содержит только глоссу леммы и не включает глоссы морфем.
  • Удалено поле form, содержавшее поморфемное глоссирование словоформы.
  • Произведена замена глосс служебных слов и морфем:
    • ká:mrph:OPT >> ká:mrph:SBJV
    • mà:mrph:DES >> mà:mrph:OPT
    • màa:mrph:DES >> màa:mrph:OPT

Новые тексты в подкорпусе со снятой омонимией:

Книги:

  • Denw ka balo. DNAFLA, 455 слов
  • Dukure, Mamadu. Ni san cyɛnna jate tɛ kalo la. Bamako: Cauris Éditions - Makdas sɛbɛnca, 2009, 58 p. 7752 слов.
  • Sisɔkɔ, Jeli Baba. Lamidu Soma Ɲakate. Ed. par Tera, Kalilu. Bamakɔ, EDIM,1986, 112 p., 15888 слов (предисловие Kalilu Tera, 139 слов)

Тексты сказок и песен:

  • Sonsannin, Surukuba ani Tonkun Bonbosima, 493 слов
  • Diɲɛ Yaalala, 317 слов
  • Dɔnkɛsunguru, 280 слов
  • Danba, Fanta. Miniyanba. 315 слов

Новые тексты в подкорпусе с неснятой омонимией:

Добавлена периодика:

Jɛkabaara

  • № 180, октябрь 2000, 7263 слов
  • № 325, ноябрь 2012, 6263 слов
  • № 326, декабрь 2012, 5592 слов
  • № 327, январь 2013, 5094 слов
  • № 329, март 2013, 6335 слов
  • № 332, апрель 2014, 6501 слов

Добавлены интернет-материалы:

  • Kunnafoni ka ɲɛsin kɛnɛya baarakɛlaw ma, minnu bɛka Ebola kɛlɛ (сайт dokotoro.org), 527 слов
  • Fasokan - 2011, декабрь, 533 слов - 2012 - февраль, 768 слов - март, 591 слов - апрель, 577 слов - май, 1306 слов - июнь, 334 слов - сентябрь, 1475 слов - октябрь, 325 слов - 2013 - май, 764 слов - октябрь, 2069 слов - декабрь, 871 слов - 2014 - январь, 1509 слов - февраль, 121 слов - апрель, 506 слов - май, 59 слов

Выпуск 2014.09

Общий объем корпуса: 1,994,479 слов

  • Подкорпус со снятой омонимией: 313,922 слов
  • Подкорпус с неснятой омонимией: 1,680,557 слов

Новые тексты в подкорпусе со снятой омонимией:

  • Bailleul, Ch.; Dumestre, G.; Vydrine, V. Npogotigiw ni bilisiw. St. Petersbourg, 1992, 1957 слов.
  • Trahison de Bakari Dian (par Diéli Baba Sissoko). In : Dumestre, Gérard. Geste de Ségou. Paris : Armand Colin, 1979, pp. 61-109. 4771 слов.
  • Bakaridjan ni Bilissi. In : Dumestre, Gérard. Geste de Ségou. Paris : Armand Colin, 1979, pp. 111-181, 7156 слов.
  • Keyita, Gabukɔrɔ. Sunjata Keyita ka maana. Bamakò: EDIM, 1979, 32 p. 3558 слов.
  • Mariko, Samu. Masunkulu. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 6207 слов.

Новые тексты в подкорпусе с неснятой омонимией:

  • Jabatɛ, Jeli Jafe. Genkurunin (Cɛfarinmaana). Bamakɔ: EDIS, 2007, 127 p., 19827 слов.
  • Jabatɛ, Jeli Jafe. Ŋɛɲɛkɔrɔ ka Tonnkan (Cɛfarinmaana). EDIS, 2007, 267 p., 47469 слов + Samaseku, Adama. Ɲɛbila, 512 слов.
  • Kulubali, Adama Jɔkolon. Ɲakurunin. Bamakɔ: EDIS, 2007, 66 p., 9024 слов.
  • Kuyatɛ, Worokiya. Nsiirin. Bamakɔ: EDIS, 2010, 6255 слов.
  • Ɲare, Sanba. Kanuya wale. 1. Dajuru. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010. 14716 слов.
  • Ɲare, Sanba. Kanuya wale. 2. Parantikɛ. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 15813 слов.
  • Ɲare, Sanba. Kanuya wale. 3. Firiyatɔw. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 13688 слов.
  • Ɲare, Sanba. Masasi. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 11670 слов.
  • Ɲare, Sanba. Ntomokun. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 10733 слов.
  • Tarawele, Daramani. Tabusire 1. Bamakɔ, EDIS, 2010, 7220 слов.
  • Tarawele, Daramani. Tabusire 2. Bamakɔ, EDIS, 2010, 12 592 слов.
  • Tɛra, Jɔbu. Donso Mamari. Bamakɔ, EDIS, 2010, 7331 слов.

Периодика:

  • Jɛkabaara 328, Feb. 2013, 8137 слов
  • Kibaru 81, Nov. 1978, 3888 слов
  • Kibaru 89, Juillet 1979, 2817 слов
  • Kibaru 101, Juillet 1980, 4038 слов
  • Kibaru 113, Juillet 1981, 3720 слов

Выпуск 2014.05

Состав корпусов:

Общий объем корпуса составил 1770378 слов, в том числе:

Подкорпус со снятой омонимией достиг объёма 290263 слова. Добавлены тексты книг:

  • Audibert, Andrée. Ji ni kɛnɛya. Bamakɔ: EDIM, 1976, 30 p., 2717 слов.
  • Bird, Charles; Hutchison, John; Kanté, Mamadou. An ka bamanankan kalan : Beginning Bambara. Indiana University Linguistic Club, 1977 & Bird, Charles; Kanté, Mamadou. An ka bamanankan kalan : Intermediate Bambara. Indiana University Linguistic Club, 1976. 6456 слов.
  • Hadamaden josiraw dantigɛkan, 1948 [Declaration universelle des droits de l’homme], 1696 слов.
  • Konate, Musa. Ali Baba ni nsonkɛ binaani ka kɛlɛ. Bamako: Le figuier, 1996, 12 p., 1224 слов.
  • Konatɛ, Musa. Baru n’a basinamuso jugu. Bamako: Le Figuier, 1996, 13 p., 1123 слов.
  • Sise, Mamadu Yusufu. Basikililabaara. Bamakɔ : EDIM [1978], 24 p., 2651 слов.

Сказки:

  • Bambéra, Taïrou. Faamanjè ni Faantannjè. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. 11-89. 13041 слов.
  • Fane, Baba. Cikèla ni bara. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. 123-132. 8856 слов.
  • Diarra, Ousamane. Sama ni jugunin. (une conte transcrite par Monika Zeutschel). 816 слов.
  • Sangare, Cèman. Suruku ni kònyòmusow. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. ?? 4330 слов.

Периодика:

  • Kibaru 1, Mar. 1972, 1940 слов
  • Kibaru 12, Feb. 1973, 2486 слов
  • Kibaru 17, Juillet 1973, 2771 слов
  • Kibaru 41, Juillet 1975, 2870 слов
  • Kibaru 52, Juin 1976, 2508 слов
  • Kibaru 65, Juillet 1977, 1765 слов

Подкорпус с неснятой омонимией достиг объёма 1480115 слов.

Добавлены тексты книг:

  • Jabi, Musa. Ngɔninkɔrɔ bama. (Yɔrɔ Kulibali bolo). Bamakɔ: Jamana, 2000, 36 p. 4274 слов.
  • Keyita, Gabukɔrɔ. Sunjata Keyita ka maana. Bamakò: EDIM, 1979, 32 p. 3558 слов.
  • Sar, Mamadu. Poyi ko di sa? 1977, 62 p., 8369 слов.
  • Jara, Alihaji Modibo. Kuranɛ kɔrɔ bayɛlɛmanen bamanankan na. Naaniye fɔlɔ. 2011, 307 p. Suran 1, 2, 4, 5, 6. 38 741 слов.

Периодические издания:

  • Kibaru 151, Oct. 1986, 4985 слов
  • Kibaru 313, Feb. 1998, 9099 слов
  • Kolonkisɛ 10, Feb. 1998, 3770 слов
  • Saheli 00, nov. 1993, 6903 слов
  • Saheli 01, janv. 1994, 8186 слов
  • Saheli 03, mars 1994, 7703 слов
  • Saheli 05, mai 1994, 7964 слов
  • Saheli 07, juillet 1994, 7149 слов
  • Saheli 08, août 1994, 6708 слов

Аннотация:

  • Сделаны многочисленные исправления в глоссировании.
  • Исправлен алгоритм добавления вариантов к леммам. В предыдущих версиях добавление не срабатывало для измененных (неначальных) словоформ.
  • Внесены уточнения в Инструкцию по поиску в корпусе (типы поиска, соотношение типов поиска и уровней аннотации).

Выпуск 2013.12

Состав корпусов:

Общий объём Корпуса составил 1681154 слов, в том числе:

Подкорпус со снятой омонимией достиг объёма 228831 слов. Добавлены тексты книги:

  • Görög-Karady, Veronika; Meyer, Gérard. Contes bambara. Mali et Sénégal Oriental. Paris, Fleuve et Flamme, 1985, 174 p., 11733 слов.

Подкорпус с неснятой омонимией достиг обёма 1452323 слов. Добавлены тексты книг:

  • Denw ka balo. DNAFLA, 455 слов.
  • Sar, Mamadu. Poyi ko di sa? [Bamakɔ,] 1977, 8369 слов.

Периодические издания:

  • Kolonkisɛ 10, 1998, 3770 слов.
  • Saheli 4, 1994, 6719 слов.

Аннотация:

Добавлено новое поле в аннотации — polysemy, которое содержит варианты французских глосс для данной лексемы, отражающие полисемию слова. Источником сведений о полисемии (вариантов глосс) является лексическая база bamadaba. Снятие полисемии не производится — всегда выводятся все возможные варианты глосс.

Выпуск 2013.10

Состав корпусов:

Общий объём Корпуса составил 1648942 слов, в том числе:

Подкорпус со снятой омонимией достиг объёма 217474 слов. Добавлены тексты:

  • Jara, Umaru Ɲanankɔrɔ. Dununba kumata. Paris: Donniyakadi, 2011, 2152 слов.
  • Jara, Umaru Ɲanankɔrɔ. Juman nɔrɔla. 4905 слов.

Подкорпус с неснятой омонимией достиг обёма 1431468 слов. Добавлены тексты:

  • Sisɔkɔ, Jeli Baba. Lamidu Soma Nyakate. Bamako: Éditions-Impriméries du Mali, 1986, 16042 слов.
  • Susɔkɔ, Jeli Baba. Maraka Madi ni Bamanan Madi. Bamako : DNAFLA, 1992, 7973 слов.

Аннотация:

Добавлены поля:

  • form — нормализованная словоформа: в новой орфографии, тонированная, с поморфемной разбивкой (дефисами);
  • parts — поле, содержащее все знаменательные основы, входящие в состав словоформы (актуально для композитов и дериватов).

Изменено содержание полей:

  • tag — помимо частей речи в поле указываются глоссы всех словоизменительных и деривативных морфем, входящих в состав словоформы, например n|DIM|PL;
  • gloss — для неодноморфемных словоформ поле формируется из глосс каждой морфемы (разделены дефисами).

Поисковый интерфейс:

  • Изменен формат представления аннотации в конкордансе. В результатах поиска по корпусу выбранные для отображения строки аннотации выводятся друг под другом, согласно общепринятому формату глоссирования примеров.
  • При сохранении конкорданса (результатов поиска) в текстовом формате выбранные строки аннотации выводятся друг под другом для каждого токена, так же, как и при отображении конкорданса в браузере. Если при сохранении отметить опцию «Align KWIC», слова в конкордансе будут выровнены пробелами (вместо символов табуляции).
  • Для типа поиска Simple добавлена опция «Include derivatives and composites». Если она отмечена, в результаты поиска будут включены все словоформы, в которых искомое слово присутствует в качестве одной из знаменательных основ (т.е. содержится в поле parts).
  • Обновлена используемая в корпусе версия ПО noSketchEngine: bonito2-open 2.91.13, manatee-open 2.59.1.

Выпуск 2013.07

Состав корпусов:

Общий объём Корпуса составил 1609187 слов, в том числе:

Подкорпус со снятой омонимией достиг объёма 209875 слов. Добавлены тексты:

  • Berete, Hamidu. Faba janjo. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 4225 mots.
  • Dukure, Mamadu. Fatɔya ni jigiya. Dakar: UNESCO-Regional Office for Education in Africa, 1988, 43 p., 13666 mots.
  • Kamara, Mamadu. Weleli. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 1354 mots.
  • Sous l’orage. Pièce de théatre, lycée Askiya Muhamed, adapté du livre de S.B.Kouyaté (Transcrit par G.Dumestre). 6187 mots.
  • Tarawele, Dramane. Faciyɛn. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 7479 mots.
  • Периодика:
    • блог Fasokan 2013_05, 338 mots
    • ежемесячник Kibaru № 467, 11079 mots
  • Радиопередачи:
    • Radio Mali, visite de Gescard d’Estaing, fév. 1977, 1657 mots.
    • Radio Mali, bulletin de soir, 15.01.1993, 4027 mots.
    • Radio Mali, bulletin de soir, 27.01.1993, 3543 mots.

Подкорпус с неснятой омонимией составил 1399312 слов.

Добавлены тексты:

  • Mariko, Samu. Masunkulu. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 6207 mots.
  • Sidibe, Tumani Yalam. Cɛ jalamugufintigi. (Oroman tila 2 kɔnɔ). Bamako: CMDT/Imprimérie Kibaru, 1991, 7900 mots.
  • Периодика: Kibaru No. 385—396.

Исправления:

  • В подкорпусе со снятой омонимией исправлены многочисленные ошибки глоссирования служебного слова ka (INF, OPT, QOUT, POSS).

Выпуск 2013.04

Состав корпусов:

Общий объём Справочного корпуса бамана составил 1498243 слов, в том числе:

  • Подкорпус со снятой омонимией - 151149 слов. Добавлены 4 текста « Entretiens sur le SIDA ».
  • Подкорпус с неснятой омонимией - 1347094 слов. Добавлены тексты:
    • Dukure, Mamadu. Fatòya ni jigiya. Dakar, 1988
    • Sous l’orage. Adapté du livre de Seydou Badian Kouyaté. Pièce de théâtre jouée en bambara par des élèves du Lycée Askia Mohamed.
    • Kibaru No. 439, 461, 462, 464, 466, 467.

Исправления:

  • Исправлены некоторые ошибки в аннотации в текстах со снятой омонимией.
  • Обновлен интерфейс сайта корпуса.

Выпуск 2013.02

Состав корпусов:

Исправления:

  • Исправлены множество ошибок в аннотации в текстах со снятой омонимией.
  • Переработана процедура автоматической разбивки текста на предложения.
  • Большая часть текстов снабжена метаданными.

Выпуск 2012.12

Состав корпусов:

  • Подкорпус с неснятой омонимией расширен новыми файлами и достиг 1 081 633 словоупотреблений.
  • Подкорпус со снятой омонимией расширен новыми файлами и достиг 118 015 словоупотреблений), исправлены многие ошибки в ранее обработанных текстах.
  • Общий объём корпуса составил 1 199 648 словоупотреблений.

Аннотация:

  • Проведена автозамена глосс в файлах со снятой омонимией для приведения их в соответствие с текущей версией лексической базы данных Bamadaba и правилами глоссирования.
  • Все тексты подкорпуса со снятой омонимией снабжены метатекстовой информацией. В подкорпусе с неснятой омонимией метатекстовая информация внесена во все новые тексты и в некоторые старые тексты, ранее её не имевшие.

Поисковый интерфейс:

  • Для корпусов со снятой омонимией (corbama-net-tonal, corbama-net-non-tonal) реализована возможность выбора подкорпуса по дополнительным полям метаданных:

    • год издания;
    • тип издания;
    • тип носителя (устный, письменный, интернет);
    • оригинал/перевод;
    • автор.

Выпуск 2012.10

Состав корпусов:

  • Добавлен корпус corbama-nul, в котором у всех лемм открытые гласные приведены к закрытым. Исходная форма (которая в тексте) при этом сохранена в неизменном виде. Позволяет искать, не зная точной гласной. Нетонированный. По объему соответствует corbama-brut.
  • Подкорпус со снятой омонимией включен в подкорпус с неснятой.
  • Подкорпус со снятой омонимией расширен новыми файлами (достиг ≈100000 слов), исправлены многие ошибки в текстах.

Аннотация:

  • Все варианты (va) теперь включаются на правах равноправной леммы, например форма ka получит в качестве леммы ka|k“, те же леммы получит форма k“.
  • Исправлены некоторые ошибки парсера, из-за которых в корпусе получались некорректные леммы, неправильные границы токенов, лишние частеречные метки и т.п.
  • Проведена автозамена глосс в файлах со снятой омонимией для приведения их в соответствие с текущей bamadaba и правилами глоссирования.