Articles
| Open Access |
https://doi.org/10.37547/ajps/Volume06Issue03-03
Fine Tuning Strategies for Uzbek And Russian Neural Machine Translation
Abstract
The article examines which fine tuning strategy is most rational for Uzbek and Russian neural machine translation under low resource conditions and domain variation. The analysis compares six model lines, MarianMT, mBART 50, M2M100, NLLB 200, uzT5, and SeamlessM4T, through a structured set of linguistic diagnostics that includes agglutination, analytic verb forms, terminology, named entities, script variation, and discourse dependent ambiguity. The study is not presented as a large scale benchmark with new numerical scores. Instead, it offers an evidence based analytical comparison grounded in Russian language scholarship, open academic reports, and an author designed stress test for Uzbek and Russian. The main result is that no single architecture is optimal for every scenario. NLLB 200 and mBART 50 appear most promising as core backbones for supervised adaptation, MarianMT remains useful in narrow institutional domains, uzT5 is valuable as an Uzbek aware auxiliary model, and SeamlessM4T is strategically relevant for future speech to speech pipelines rather than as the default pure text solution.
Keywords
Uzbek language, Russian language, neural machine translation
References
Dyomochkina V. V., Gruzdev D. Y., Lukyanova E. V. Machine translation in hindsight //Научный результат. Вопросы теоретической и прикладной лингвистики. – 2024. – Т. 10. – №. 2. – С. 21-45.
Камшилова О. Н., Беляева Л. Н. Машинный перевод в эпоху цифровизации: новые практики, процедуры и ресурсы //Terra Linguistica. – 2023. – Т. 14. – №. 1. – С. 41-56.
Абдурахманова М. Т., Абжалова М. А. Параллельные корпуса на примере узбекского, русского и английского языков //Конвергентные технологии ХХI: вариативность, комбинаторика, коммуникация. – 2022. – С. 74-81.
Эргашева Г., Хаиткулов З., Кучимова Н. Параллельный корпус в автоматизированном переводе (на примере коллокаций) // O‘zbekistonda xorijiy tillar. – 2023. № 5 (52). – С. 162-173.
Митренина О. В., Мухамбеткалиева А. Г. Как и какой перевод (не) оценивают компьютеры //Journal of applied linguistics and lexicography. – 2021. – Т. 3. – №. 2. – С. 77-84.
Nigmatova L., Avezov S. ПРИМЕНЕНИЕ МЕТОДОВ NLP В КОРПУСНЫХ ИССЛЕДОВАНИЯХ: ОСОБЕННОСТИ И ОГРАНИЧЕНИЯ //«УЗБЕКСКИЕ НАЦИОНАЛЬНЫЕ ОБРАЗОВАТЕЛЬНЫЕ ЗДАНИЯ ТЕОРЕТИЧЕСКОЕ И ПРАКТИЧЕСКОЕ СОЗДАНИЕ ВОПРОСЫ" Международная научно-практическая конференция. – 2023. – Т. 2. – №. 2.
Авезов С. Корпусная лингвистика: новые подходы к анализу языка и их приложения в обучении иностранным языкам //International Bulletin of Applied Science and Technology. – 2023. – Т. 3. – №. 7. – С. 177-181.
Article Statistics
Copyright License
Copyright (c) 2026 Avezov Sukhrob Sobirovich

This work is licensed under a Creative Commons Attribution 4.0 International License.