enrutat
Баш бит / Тулы кыйммәтле татар-рус тәрҗемә системасы булдыру өчен, кимендә 100 млн. сүз формасы туплау зарур
Тулы кыйммәтле татар-рус тәрҗемә системасы булдыру өчен, кимендә 100 млн. сүз формасы туплау зарур

Тулы кыйммәтле татар-рус тәрҗемә системасы булдыру өчен, кимендә 100 млн. сүз формасы туплау зарур

Татарстан Фәннәр академиясендә узган “2014-2020 елларга Татарстан Республикасында ТР дәүләт телләрен һәм башка телләрне саклау, өйрәнү һәм үстерү буенча дәүләт программасы”н тормышка ашыруның презентациясе кысаларында “Заманча лингвистик технологияләр” түгәрәк өстәле оештырылды. Анда лингвистик технологияләр, мәдәниятара багланышлар өлкәсе белгечләре, дәүләт хакимияте органнарында тәрҗемәче булып эшләүчеләр катнашты.

2014-2020 елларга каралган телләр сакланышы буенча дәүләт программасы кысаларындагы бурычларның бер блогы – татар-рус һәм рус-татар машина тәрҗемәсе системасын булдыру. Система киләчәктә республиканың дәүләт органнарында документлар әйләнешендә кулланылачак.

Әлеге фәнни-технологик проектны ТР Фәннәр академиясе, “ABBYY Language Services” лингвистик технологияләр фирмасы белән берлектә, гамәлгә ашыра. Проектның төп асылы һәм эш этаплары турында “ABBYY Language Services” фирмасының технологияләр бүлеге җитәчесе Алсу Бикбаева тәфсилләбрәк сөйләде.

Аның сүзләренчә, машина тәрҗемәсе гомуми тематика һәм терминологиягә берләшкән зур күләмдәге мәгълүмат белән эш йөрткәндә уңайлы һәм нәтиҗәле. “Иң беренче этапта лингвистик фонд тупларга кирәк. Бу иң төп һәм мөһим этап булып санала. Тәрҗемә базасына моңа кадәр тәрҗемә ителгән сүзләр, сүзтезмәләр җыелмасы кертеләчәк. Хәзерге вакытта татар-рус машина тәрҗемә системасының лингвистик фондында 10 млн.нан артык сүз формасы тупланган. Әмма бу бик аз. Ник дигәндә, тулы кыйммәтле тәрҗемәсе системасын булдыру өчен кимендә 100 млн. сүз формасы туплау зарур”, – диде Алсу Бикбаева үзенең чыгышында. Мондый күләмдәге база туплау өчен “SmartCAT” тәрҗемәләрне автоматлаштыру системасы кулланылачак. Әлеге система тәрҗемә эшен җиңеләйтә һәм гадиләштерә, күп вакытны янга калдыра. “SmartCAT” платформасына берничә технология урнаштырылган. Мисалга, аның терминология белән эш итә торганы бар. Аның ярдәмендә икътисади, юридик һ.б рәсми өлкәгә караган терминнар уртак тәрҗемәгә ия булачак.

Алсу Бикбаева әйткәнчә, автоматлаштырылган тәрҗемә системасына телнең морфологик үзенчәлекләрен кертү дә мөһим. Бу күп көч һәм вакыт таләп итә торган хезмәт. Әлеге эшкә һөнәри лингвистлар һәм тәрҗемәчеләр генә түгел, волонтерлар – укытучылар, студентлар да тартылыр, дип ышана системаны барлыкка китерүчеләр.

Системаны булдыруның соңгы этабы: аны эшләү, файдалану өчен уңайлы итү, программага интерфейс булдыру.

Машина тәрҗемәсенең төп сыйфат күрсәткече булып тизлек һәм җитештерүчәнлек тора, диде Алсу Бикбаева чыгышына йомгак ясап.

«Татар-информ» МА

Безгә Telegram'да язылыгыз.

Фикер калдырырга

Обязательные поля отмечены *

*