Популярное приложение для смартфонов SwiftKey Keyboard, которое обновляет клавиатуру устройства, обзавелось якутским языком. Инициатор разработки — не профессиональный программист или лингвист, а врач-невролог Артём Семёнов.
«SwiftKey на английском и русском я пользуюсь с 2012 года. В мае прошлого года попросил разработать якутскую клавиатуру для программы. В августе программист компании Джулиен Бэйли попросил помочь. Моя роль заключалась в проверке списка слов на наличие орфографических и других ошибок. Я предоставил Джулиену список сайтов на якутском языке, он запустил специальный скрипт, который извлекает из них слова, сопоставляет их со словами на русском и удаляет совпадения. Из оставшихся слов составляется модель языка, в которой, помимо прочего, прописано, какие из них чаще используются. Всего было извлечено 75 тысяч слов», — рассказал ЯСИА Артём Семёнов.
В течение трех месяцев якутянин проверял эти слова, в конце остались около 55 тысяч. Как оказалось, это довольно сложная задача. На проверку одной тысячи слов уходило около 20 минут, и с каждой тысячей становилось всё сложнее — чем дальше, тем больше ошибок и неякутских слов.
«Там ещё полно ошибок, которые будут исправлены в ближайшее время. В будущем планируем улучшить и расширить словарь. В этом нам могут помочь пользователи — им нужно авторизоваться и включить синхронизацию. После того, как наберется достаточное количество пользователей, из их словарей будут отобраны наиболее часто встречающиеся слова», — отметил разработчик.
Первая и главная особенность SwiftKey заключается в предиктивном вводе. Клавиатура на основе созданной модели языка с большой долей вероятности может предсказать следующее слово, которое вы хотели написать. Например, даже не вводя ничего, она первым словом предлагает «Дорообо». Далее может предложить что-то вроде «Туох», затем «сонун». Более того, запоминаются слова, которые вводит пользователь, то, как он их использует. При первом использовании клавиатуры ей можно разрешить прочитать СМС и электронные письма для того, чтобы начать процесс индивидуализации словаря.
Другой особенностью клавиатуры является функция Flow, которая позволяет легко набирать текст пальцем одной руки, не отрывая его от экрана. Для этого, конечно, надо хорошо знать расположение букв.
В настоящее время для английского и других популярных языков для прогнозирования используется нейронная сеть, которая позволяет добиться более «человеческого», точного прогноза. В скором будущем это станет возможно и для русского языка. «Есть надежда, что если наберется большое количество пользователей, предиктивный ввод на основе машинного обучения станет доступен и для якутского языка», — подчеркнул Артём Семёнов.
К сожалению, версия для iOS не появится в скором будущем, так как у отдела, который занимается разработкой клавиатуры для этой операционной системы, сейчас другие приоритеты.