Первый нейросетевой переводчик для эрзянского языка

Semantics
Data Mining
Machine learning
Artificial Intelligence
Natural Language Processing
mashinnyj perevod
machine translation
perevodchik
cezon data mining
nlp
ml
machine learning
natural language processing
lower-resource language
maloresursnyj yazyk
Semantics
Data Mining
Machine learning
Artificial Intelligence
Natural Language Processing
машинный перевод
machine translation
переводчик
cезон data mining
nlp
ml
machine learning
natural language processing
lower-resource language
малоресурсный язык

Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей.
Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.

Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.

Читать далее
Show backup