«ЯНДЕКС»: ТАТАРСКИЙ ЯЗЫК — ОДИН ИЗ САМЫХ ТРУДНЫХ

Пресс-релиз о запуске сервиса online-переводов с татарского языка на 47 остальных и наоборот выпустила накануне компания «Яндекс».

Как отмечается в сообщении, переводчик «Яндекса» — статистический: система сопоставляет одни и те же тексты на разных языках и таким образом учится их переводить.

«Татарский язык — один их самых трудных для машинного перевода, потому что у него сложная морфология и в интернете мало одинаковых текстов на татарском и других языках, — признаются создатели сервиса. — Перевод для этого языка «Яндекс» разрабатывал в сотрудничестве с учеными из Академии наук Республики Татарстан. Они помогли создать анализатор, позволяющий распознавать части речи и словоформы татарского языка».

Появление в «Яндекс.Переводчике» татарского «БИЗНЕС Online» прокомментировал региональный представитель компании (Юг и Поволжье) Дмитрий Горчаков. «Судя по запросам к поиску «Яндекса», сервис перевода на татарский язык очень востребован в республике, — пояснил Горчаков. — Каждый месяц пользователи «Яндекса» задают 50 - 60 тысяч запросов о татарско-русском переводчике. Больше всего запросов поступает из Татарстана». По его словам, повышенный интерес к русско-татарскому переводчику заметен также в Башкортостане, Ульяновской области и в Крыму. Кроме того, сервис необходим школьникам, поскольку татарский язык и литература обязательны в школах Татарстана. Добавление татарского языка в сервис заняло около полугода. При этом Академия наук РТ оказывала помощь по созданию анализатора, позволяющего распознавать части речи и словоформы татарского языка. В следующее плановое обновление приложения добавится версия online-переводчика для мобильных приложений.

Чтобы увеличить картинку, нажмите на нее

«Вообще, понимать татарский язык «Яндекс» научился в 2010 году, — сказал Горчаков. — Пользователи из Татарстана могут общаться с «Яндексом» на татарском языке, а главная страница портала, интерфейс поиска и интерфейс «Яндекс.Почты» доступны на любом из двух государственных языков — русском или татарском. «Яндекс» поможет узнать, например, про ЕГЭ (Бердәм дәүләт имтиханнары) или найти любимую татарскую песню. При этом поиск учитывает морфологию татарского языка. Общаться с «Яндексом» на татарском могут все, кто любит татарский язык. Где бы ни находился пользователь, он может задавать запросы по-татарски и выбрать татарский как язык интерфейса. Поддерживается также локализация основных сервисов для татарстанских пользователей. Поисковая машина использует региональную формулу ранжирования, то есть выдает результат по локальным запросам («пицца» или «такси»). «Яндекс» находит ответы, наиболее подходящие для жителей республики».

Данил Сафаров: «Пока это больше похоже на троллинг, а не на проект. Представители «Яндекса» должны обратиться к компетентным людям» (фото: twitter.com/dsafarov)

«Я УЖАСНУЛСЯ, ЧЕСТНО ГОВОРЯ!»

Все это хорошо, но своих первых пользователей сервис изрядно повеселил. Чалма по-русски оказывается будет «Набережные Челны Республики Татарстан», дәфтәр (тетрадь) — книга, тал (ива) — люди, сабын (мыло) — терпения не, алмагач (яблоня) — поскольку могут, кабымлык (закуска) — все кабым. И никаких гвоздей!

Все эти примеры привел на своем сайте matbugat.ru разработчик сайтов на татарском языке Данил Сафаров. «Пока это больше похоже на троллинг, а не на проект, поделился он своей оценкой сервиса с «БИЗНЕС Online». — Я посмотрел переводы некоторых слов и ужаснулся, честно говоря. Понимаю, что сервис пока работает в тестовом режиме. Однако там переводы элементарных, часто используемых слов даже близко по смыслу не подходят. О необходимости такого переводчика говорится давно, но сделать его нужно грамотно, а для этого представители «Яндекса» должны обратиться к компетентным людям. Если же проект действительно сделают рабочим, думаю, он будет востребован теми, кто не очень хорошо знает татарский язык. Однако не думаю, что они сделают проект настолько совершенным, что там можно будет найти перевод для литературного татарского языка».

Для наглядности «БИЗНЕС Online» попробовал перевести с помощью «Яндекс.Переводчика» отрывки классических стихов великого татарского поэта Габдуллы Тукая. Получилась полная белиберда! Скажем, вот первая строчка знаменитого стихотворения «Родной язык»: «И туган тел, и матур тел, әткәм-әнкәмнең теле!» В знаменитом переводе Равиля Бухараева она звучит так: «О язык родной, певучий, о родительская речь!» Вариант «Яндекса»: «Родной язык, язык бы красиво, моя әткә-әнкә моего языка!» Еще пример: «Җиктереп пар ат, Казанга туп-туры киттем карап...» Анна Ахматова перевела эту строчку так: «Лошадей в упряжке пара, на Казань лежит мой путь...» Перевод «Яндекса»: «Пара запряженных лошадей, создавая, Казань, мяч — в зависимости от тура ушел».

Понятно, что перевод стихов — задача сложная, но хотя бы общий смысл должен быть различим. Впрочем, и с совершенно простыми заданиями «Яндекс.Переводчик» также не может справиться. Например, он утверждает, что «Бүген музейга кил» («Приходи сегодня в музей») по-русски будет не иначе как «В том, что музей сегодня». Другой пример: «Балалар су коена» переводится как «Дети купаются», но «Яндекс» пишет: «Воды выпадают дети».

«НЕОБХОДИМО ОЧЕНЬ БЕРЕЖНО ОТНОСИТЬСЯ К ЯЗЫКУ НАШЕГО НАРОДА»

Несмотря на невысокое качество переводов, представители татарской общественности восприняли новость о появлении сервиса с энтузиазмом и одобрением — уж очень велика потребность.

«Азатлык» — татаро-башкирская редакция радио «Свобода», расквартированная в Праге и финансируемая, как известно, Конгрессом США, в статье, посвященной запуску бета-версии «Яндекс.Переводчика», подчеркивает, что компанию на реализацию данного проекта подвигла конкуренция с Google. В публикации отмечается, что в настоящее время группа активистов из числа татарской молодежи делает попытки ввести татарский язык в Google Translate и бесплатно готовит для этого переводы. Один из них, Ирек Хажиев, положительно оценил появление «Яндекс.Переводчика».

«Это очень важное событие для татарского языка, — сказал Хажиев. — Думаю, «Яндекс.Переводчик» станет хорошим помощником для многих людей. Благодаря переводу текстов с татарских сайтов о нашей жизни, о событиях, которые у нас происходят, смогут узнать и другие народы. То есть это событие показывает, что наш язык не только нашел свое место в интернете, но и развивается в его рамках. Сейчас «Яндекс» и Google конкурируют во многих областях, в том числе и по языкам. «Яндекс» запустил переводчик на татарский язык, чтобы не потерять рынок в России, поскольку в нашей стране люди разговаривают не только на русском». Эти слова Хажиева косвенно подтверждает и сам «Яндекс», ведь в новости о запуске экспериментальной версии перевода на татарский, распространенной компанией, подчеркивается, что «это первый проект для языков народов РФ, не считая русского».

Бывший руководитель казанского бюро радио «Азатлык», блогер «БИЗНЕС Online» Римзиль Валиев тоже рад появлению данного проекта. «Запуск «Яндексом» online-переводчика для татарского языка только приветствую! Что касается вопроса качества переводов, то, когда будет предложение, тогда появится и спрос. И наоборот. Надеюсь, что реклама поможет подтянуть публику. Пока она слаба и далека от интернета, очень мало продвинутых татар. Призываю всех подтянуться к новым технологиям!»

А вот вице-президент Академии наук РТ Рафаэль Хакимов в разговоре с корреспондентом «БИЗНЕС Online» отметил, что в настоящее время татары очень активно входят в интернет и отсутствие татарского online-переводчика очень мешало. «Если переводчик позволит татарам интегрироваться в общее интернет-пространство, то я могу это только приветствовать, — сказал Хакимов. — Да, конечно, информация на татарском языке в интернете есть, но существует общий недостаток татарского языка, который долгое время был запрещен, да и сегодня в других регионах России он не очень приветствуется. Кроме того, многие татары пишут кириллицей, однако на латинице это было бы делать гораздо проще. Устный татарский язык, конечно, широко используется. Я в жизни, например, полдня говорю по-татарски, но когда мы пишем, то переходим на русский язык. Получается, ограниченный ресурс для татарского языка как такового».

Без-имени-4.jpg
Чтобы увеличить картинку, нажмите на нее

Хакимов считает, что важно понимать и экономическую составляющую данного проекта, а не столько национальную принадлежность или симпатию к языку и культуре. «Татарстану надо продавать свои товары куда-то. Куда? — вопрошает Хакимов и тут же отвечает. — В Азию. А там все больше переходят на свои родные тюркские языки, а татарский язык ключевой среди них. Таким образом, он дает шанс для свободной торговли на рынке — это ключевой вопрос. Вот это основная перспектива, не говоря уже о том, что знание любого второго языка — это плюс в карьере, как показывает мировая социология».

Экс-министр образования и науки РТ Наиль Валеев считает online-переводчик «полезным делом». «У нас сейчас язык мало кто толком знает — что татарский, что русский. Поэтому любой шаг в этом направлении очень важный и нужный. Однако подчеркну, что online-переводчик должен быть максимально отработанным, потому что необходимо очень бережно относиться к языку нашего народа. Раньше специалисты переводили книги с татарского на русский и наоборот, было много переводной литературы. Таким образом, обогащались оба языка. Сейчас люди стали меньше читать бумажных книг, а в электронном варианте татарских книг намного меньше, чем каких-то других. Мы сейчас серьезно этим не занимаемся, это большая проблема. Поэтому, на мой взгляд, сегодня важно отладить перевод большого количества книг на татарском языке в электронный вариант, чтобы они стали доступны для всех желающих, поэтому я считаю, что переводчик сможет стать еще одним шагом на этом пути».

Джавдет Сулейманов
Джавдет Сулейманов: «Если язык не станет языком мобильных разработок и не будет использоваться на iPad и iPhonе или других мобильных устройствах, он, каким бы красивым ни был, обречен»

«ЭТО ПОКА ТОЛЬКО ПЕРВЫЙ ШАГ»

Качественный машинный перевод — задача, которая за полгода, потраченные «Яндексом», не решается. «БИЗНЕС Online» уже писал, что в Татарстане работа в этом направлении ведется давно. Над проектом работают резидент казанского IT-парка ABBYY Language Services и НИИ «Прикладная семиотика» Академии наук РТ. В январе сообщалось, что на программу только в 2015 году будет выделено 7 млн. рублей и над ней в течение 5 лет будут работать 40 лингвистов, а в результате производительность работы переводчиков должна повыситься в 2 - 2,5 раза. Согласно идее проекта до 2020 года будет собираться необходимая для запуска грамотного машинного перевода словарная база из 100 млн. словоформ. Пополнять базу будут переводчики министерств и ведомств путем «общего накапливания материала». Директор НИИ Джавдет Сулейманов подчеркивал тогда, что программа включает в себя также внедрение татарско-английских словарей, увеличение количества поддерживающих татарский язык платформ, разработку мобильных приложений и др. «Если язык не станет языком мобильных разработок и не будет использоваться на iPad и iPhonе или других мобильных устройствах, он, каким бы красивым ни был, обречен», — заявлял Сулейманов.

Комментируя для «БИЗНЕС Online» запуск «Яндекс.Переводчика», ученый отметил, что пока сделан лишь первый шаг и со временем качество переводов будет улучшаться. «Это только начало. У «Яндекс.Переводчика» есть много языков, и все они делаются на статистических методах. До смысла, до семантики они «не влезают». Они подключают параллельные тексты, и чем больше параллельных текстов мы им будем давать, тем точнее и лучше будет перевод. Чтобы получить хорошее качество, нужны миллионы параллельных текстов. И мы им будем в этом помогать. Уверен, что «Яндекс» доведет «Переводчик» до определенного уровня, когда можно будет в целом понять контекст. Например, я как человек, не знающий китайский язык, если пойму примерно, о чем идет речь, то буду только благодарен. Вот на таком уровне и будет работать переводчик. К этой цели мы идем двумя путями параллельно, и для ее достижения нужны миллионы рублей. Это сложный процесс, который шлифуется годами. Сейчас сделан первый шаг. Если учесть, например, что в средней школе 11 классов обучения, то это пока только первый класс. Машинный перевод никогда не заменит человека, который никогда не уступит электронному переводу. Но наша программа призвана оптимизировать работу и сделать ее более качественной. Впереди большая работа. К 2020 году мы планируем получить довольно хороший «Переводчик», который основан на правилах, на учете контекста».

Что ж, остается надеться, что республика, претендующая на лидерство в IT-отрасли и открывающая сегодня Иннополис, окажется способна решить эту важную для татарского народа задачу.