Африканская наука нуждается в терминологии

Африканцы регулярно сталкиваются с проблемой нехватки слов при обсуждении целого ряда тем, выходящих за рамки быта.

Накануне в ООН отметили День языка Суахили – одного из самых распространенных языков африканской семьи и наиболее используемого в странах Африки к югу от Сахары. По этому случаю предлагаем Вашему вниманию материал наших коллег из «Курьера ЮНЕСКО» о том, как ученые помогают обогатить лексику африканских языков научными терминами.

Для южноафриканского научного журналиста Сибусисо Биелы написать статью об обнаружении нового динозавра на его родном зулусском языке не должно было составить труда. Однако, приступив к работе, он быстро впал в уныние: как рассказывает Сибусисо в своем подкасте для британского научного журнала Nature, он не находил подходящих слов для таких относительно простых научных понятий, как «окаменелость» и даже «динозавр».

Любой другой журналист, вероятно, пошел бы по легкому пути и «зулуссифицировал» английские термины посредством добавления к ним приставки «i», однако Биелу такой подход не устраивал. В итоге он перевел слово «динозавр» словосочетанием isilwane sasemandulo, что дословно значит «древнее животное». В отношении «окаменелостей» он предпочел еще более буквальный перевод: amathambo amadala atholakala emhlabathini – «древние кости, найденные в земле».

Этот случай – далеко не единственный в своем роде: африканцы регулярно сталкиваются с проблемой нехватки слов при обсуждении целого ряда тем, выходящих за рамки быта. В Африке насчитывается около двух тысяч местных языков, однако терминология в области науки и многих других сфер деятельности в них практически полностью отсутствует.

Строим вместе

В 2019 году группа ученых со всего континента основала некоммерческое объединение Masakhane, что с языка зулу переводится как «Строим вместе». По словам одной из его учредительниц и специалиста по обработке естественного языка Джейд Эббот, цель этой организации заключается в «развитии лингвистических технологий в интересах африканских языков».

Изначально в группу входили преимущественно специалисты по машинному обучению, но со временем к ней присоединились также лингвисты, инженеры, политологи и специалисты в области коммуникации, такие как Сибусисо Биела. Учитывая, что в объединение входят эксперты из более чем 40 стран, а взаимодействие между ними осуществляется по интернету, даже пандемия COVID-19 не стала препятствием для их работы.

Первой задачей, которую поставила перед собой организация Masakhane, стала разработка систем машинного перевода для максимального числа африканских языков. Ведь если многие из нас уже привыкли, что в любой момент могут понять смысл иностранного текста благодаря таким программам, как Google Translate, и перевести любую веб-страницу на родной язык с помощью функции автоматического перевода, то для носителей большинства из двух тысяч африканских языков это недоступная роскошь.

Необходимы данные

Для таких специалистов, как Эббот, создание системы автоматического перевода особых трудностей не представляет – однако для этого необходимы данные, а их по основной массе африканских языков катастрофически не хватает. Именно поэтому, поясняет Джейд Эббот, команда Masakhane решила доказать, что «работа с участием широкого круга мужчин и женщин, разбирающихся в информатике и языках, позволяет получить более качественные данные».

Читать также:
Многие продукты с использованием ртути должны остаться в прошлом

Научная статья, опубликованная в 2020 году специалистами Masakhane из нескольких десятков африканских стран, была удостоена премии фонда «Викимедиа» за научно-исследовательские проекты. В статье проводится анализ состояния 48 самых распространенных африканских языков и предлагается план действий по тестированию и оценке результатов машинного перевода для более чем 30 языков. При этом, как уточняется в статье, внести вклад в проект могут и «лица без специальной подготовки».

Экспериментальная версия

Когда исследовательская фаза проекта была завершена, специалисты Masakhane приступили к его практической реализации. На данный момент на их платформе для автоматического перевода уже действует экспериментальная версия программы для шести африканских языков (игбо, лингала, шона, суахили, луба и йоруба), но Джейд Эббот утверждает, что это только начало. В дальнейшем команда Masakhane планирует заняться вопросом о том, как лучше всего обеспечить доступность платформы для широкой публики: все участники проекта хотят, чтобы их детище «служило на благо африканских общин, а не увеличивало прибыль технологических гигантов».

Специалисты Masakhane уже написали более 200 научных публикаций и утвердили семь других масштабных проектов. Один из них, носящий название Decolonise Science («Деколонизировать науку»), осуществляется совместно с африканским порталом бесплатных онлайн-ресурсов AfricaArXiv и нидерландской платформой ScienceLink, предоставляющей научные ресурсы в открытом доступе. Сибусисо Биела принимает в нем самое активное участие.

Реалистичные цели

В 2021 году, когда работа над этим проектом только началась, команда Masakhane намеревалась перевести на шесть африканских языков около 200 научных статей, однако впоследствии им пришлось признать, что это практически неосуществимо – для каждой статьи потребовалось бы выработать сотни новых терминов, таких как «динозавр» и «окаменелости». Тогда они поставили перед собой более реалистичную цель: перевести на шесть языков только тезисы 180 научных статей (уже отобранных с учетом области знания, потенциальной пользы, географического и гендерного разнообразия) и предложить для каждой статьи пять новых терминов.

Если понятие «деколонизации» предполагает разрушение старого, то для Masakhane речь идет скорее о построении нового. «Сегодня, – объясняет Биела, – многие африканцы могут говорить о спорте, политике и других вещах на своем родном языке, но как только речь заходит о науке или технологиях, нам приходится переключаться на другую знаковую систему, из-за чего наука начинает выглядеть “вмешивающимся в разговор чужаком”».

Это особенно проблематично, когда дело касается здравоохранения. К примеру, если люди отказываются прививаться, медики не могут объяснить им на их родном языке, в чем суть РНК-вакцины и иммунологии. Таким образом, нет никаких сомнений в том, что значение работы Masakhane выходит далеко за рамки лингвистики.

Новости ООН

Похожие истории