IX Бөтендөнья татар яшьләре форумына әзерлек уңаеннан, гыйнвар-февраль айларында «Акыл фабрикасы» проекты кысаларында 6 түгәрәк өстәл оештырылды: алар медиа, яңа мәдәният, тарих, мәгариф һәм тәрбия, цифрлаштыру, бизнес юнәлешләренә багышланган иде. Безнең максат – актуаль темаларны тикшереп, яңа идеяләр формалаштыру, әлеге юнәлешләрне Татарстанда, Россия Федерациясе төбәкләрендә һәм чит илләрдә үстерү юлларын табу.
13 февраль көнне Бөтендөнья татар конгрессы бинасында татар телен, мәдәниятен һәм фәнни тикшеренүләрне цифрлаштыру мәсьәләләренә багышланган түгәрәк өстәл узды.
Чарада галимнәр, IT-белгечләр, мәдәният эшлеклеләре катнашты. Алар татар телен санлы киңлеккә яраклаштыру, аны киләчәк буыннар өчен саклау һәм үстерү юлларын тикшерде. Катнашучылар төрле юнәлешләрдәге проблемаларны күтәрде һәм аларны чишү юлларын тәкъдим итте.
ТР ФА Гамәли семиотика институты директоры Гыйльмуллин Ринат Абрек улы үз чыгышында татар телен цифрлаштыруның мөһимлеген ассызыклады. Ул телнең санлы мохиттә актив кулланылмаса, киләчәге булмаячагын билгеләп үтте.
– Без 90-нчы еллардан бирле бу юнәлештә эшлибез. Башлангыч этапта компьютерлаштыру гына булса, хәзер исә бөтен нәрсәне цифрлаштыру бара. Мәсәлән, без «Татсофт» тәрҗемә программасы, сөйләмне тану, яңгырату программалары кебек мөһим проектларны тормышка ашырабыз. Моннан тыш, «Татарика» онлайн-энциклопедиясен булдырдык, ул 26 меңнән артык сүзне үз эченә ала. Ләкин безгә бу ресурсларны кулланучылар өчен уңайлы форматка китерү бурычы тора. Цифрлаштыру – татар телен киләчәккә алып баруның төп ысулы, – дип ассызыклады ул.
Ринат Абрек улы ясалма фәһем үсеше турында да фикерен белдерде:
– Әгәр дә яңа модельләр төземәсәк, алга китеш булмаячак. Татар теленә нигезләнгән ясалма фәһем модельләрен булдыру өчен зур корпуслар, лингвистик анализ системалары һәм көчле серверлар кирәк. Әмма хәзерге вакытта бу ресурслар җитми. Безгә ясалма фәһемне татар теленә тулысынча яраклаштырырга кирәк, – диде ул.
Татарстан Республикасы Фәннәр Академиясенең Галимҗан Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты бүлек җитәкчесе Сәфәров Ринат Таһир улы дәүләт телләрен саклау программасы кысаларында алып барылган эшләр турында сөйләде. Ул татар теленең санлы мохиттә тотрыклы үсеше өчен дәүләт программалары һәм академик тикшеренүләрнең мөһимлеген ассызыклады.
– Дәүләт телләрен саклау программасы нигезендә, безнең институтта татар телен үстерүгә юнәлтелгән электрон проектлар эшләп килә. Аларның кайберләре тар даирәдәге фәнни хезмәтләр өчен кулланыла, ә кайберләре киң җәмәгатьчелеккә адреслана, мәсәлән, сүзлекләр. Элек радио һәм телевидение киң таралган булса, бүгенге көндә ясалма интеллект һәм цифрлы платформалар телне өйрәнү һәм куллану өчен мөһим инструментлар булып тора. Безнең институт, бу үзгәрешләрне исәпкә алып, үз эшчәнлеген дүрт төп юнәлештә алып бара:
- Тел – татар телен өйрәнү һәм үстерүгә юнәлтелгән ресурслар буенча проектлар.
- Әдәбият – татар матур әдәбиятын саклау һәм популярлаштыру.
- Сәнгать – милли сәнгатькә кагылышлы материалларны цифрлаштыру.
- Милли мәгариф – татар телендә белем бирү мөмкинлекләрен киңәйтү багышланган юнәлеш, – дип, институт эшчәнлеге белән таныштырды Ринат Таһир улы.
2014 елдан башлап, институт электрон китапханә булдыру буенча эшли. Барлык китаплар электрон форматта сайтта урнаштырыла, әмма аларны сату мөмкинлеге юк, чөнки оешма коммерциягә нигезләнмәгән. Фәнни продукция дә электрон китапханәдә урын ала, әмма күптомлык сүзлекләр, шул исәптән татарча-русча, орфографик сүзлекләр коммерцияле нәшриятлар тарафыннан чыгарылганга күрә, аларны сайтка урнаштыру мөмкин түгел.
Программа нигезендә, институт ел саен 4-5 сүзлек чыгара. Бүгенге көндә 56 сүзлек әзер, алар биш тематик зонага бүленгән. Барлык позицияләрне исәпкә алганда, 76 сүзлек тупланган. Әмма системаның кайбер җитешсезлекләре дә бар:
- Уртак логотип булмау: бу кулланучылар өчен платформаны бик примитив итә.
- Бер үк термин төрле сүзлекләрдә төрле вариантта бирелә, бу мәгънә ягыннан каршылыклар тудыра.
- Система камилләштерүгә мохтаҗ, әмма ресурслар җитеп бетми.
- Фондның мобиль версиясен эшләү зарур, әмма белгечләр һәм мөмкинлекләр чикле. Компьютердан караганда, платформа уңайлы, ә телефоннан ачсак, “кырмыска дөньясы” диярсең, текст бик вак, – дип, проблемалар белән бүлеште Г. Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты бүлек җитәкчесе Сәфәров Ринат Таһир улы.
Аның сөйләвенчә, хәзерге вакытта ике зур проект тормышка ашырыла:
- Татар матур әдәбиятының электрон архивы. Биредә 15 миллион сүзлек материал тупланган.
- Русча-татарча параллель корпус. Ул үз эченә 400 мең сүзне ала.
Хәзерге вакытта русча-татарча параллель ресурслар булдыру эше норматив законнар аркасында туктатылган. Әмма бу юнәлешне үстерү дәвам ителсә, тәрҗемә сыйфаты яхшырыр, сүзлекләр камилләшер һәм куллану мөмкинлекләре артыр иде дип саный Ринат Таһир улы.
Гомумән алганда, татар теленең цифрлы үсеше зур мөмкинлекләргә ия, әмма аны камилләштерү өчен финанслар һәм белгечләр җитми. Бу юнәлештә киләчәктә дә актив эш алып бару мөһим.
Түгәрәк өстәлдә татар телендәге топонимнарны туплауның мөһимлеге дә ассызыкланды.
– Авыллар, кырлар, таулар, елгаларның тарихи исемнәре югала бара. Без күбесен беләбез, туплап барабыз, ләкин без белмәгән, аерым бер авыл халкы өчен генә мәгълүм булган, бәлки, алар үзләре кушкан атамалар бар. Бу мәгълүматларны туплау – киләчәк буыннар өчен зур мирас. Татарстандагы гына түгел, татарлар яшәгән барлык төбәкләрнең дә географик атамаларын өйрәнәсе килә, – дип белдерде Ринат Таһир улы.
ML разработчик, «Ясалма» (Нейротатарлар) берләшмәсе вәкиле, хәзерге вакытта Франциядә яшәүче Дмитрий Гайнуллин утырышта онлайн форматта катнашты. Ул зур корпуслар туплау һәм модельләр өйрәтү белән шөгыльләнә. Дмитрий билгеләп үткәнчә, нейрон модельләрнең үсеше өчен зур күләмле, сыйфатлы текстлар кирәк. Әмма бу эш авторлык хокуклары, ресурсларның чикле булуы сәбәпле катлаулана. Бу проблема корпуска сыйфатлы әдәби әсәрләрне кертүдә аеруча сизелә.
– Ресурслар җитмәү мәсьәләсен хәл итү өчен, төрле оешмалар белән хезмәттәшлек итү мөһим. Дөрес аргументация булса, Google Cloud кебек платформалар техник ярдәм күрсәтә ала,– дип билгеләп үтте Дмитрий.
Автоном коммерциягә карамаган «Татнефть-Наследие» оешмасы җитәкчесе Мария Минеева цифрлаштыру өлкәсендә башкарылган эшләр турында сөйләде.
– Без КФУ китапханәсе белән хезмәттәшлек итәбез, 21 елдан бирле китапларны цифрлаштырабыз. Хәзерге вакытта шәхси коллекцияләрне өйрәнү, аларны сайтка урнаштыру эшен алып барабыз. Әмма иске имләдә язылган материалларны тулысынча цифрлаштыру әлегә планлаштырылмаган. Бу юнәлештә дәүләт дәрәҗәсендә ярдәм кирәк. Цифрлаштыру – татар мәдәниятен саклауның бер ысулы ул – диде Мария.
Татарстан Республикасы Фәннәр Академиясенең Галимҗан Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институтында да бу юнәлештә эш алып барыла.
– Текстларның 70-80% цифрлаштырылган, ләкин аларны ачык чыганакларга табып булмый. Бу процесс камилләштерелсә, казах һәм кыргыз телләрендә эшләнелгән проектлар өчен дә бик файдалы булыр иде, – дип өстәде Ринат Таһир улы.
Бу мәсьәләгә карата Бөтендөнья татар яшьләре форумы рәисе Райнур Хәсәнов «Акыл фабрикасы» проекты кысаларында ясалма фәһем турында дәресләр үткәрүе турында сөйләде. Дәресләрдә ясалма интеллектка татар имләсендә текст биреп караганнар. Башта ул текстны укый алмаган, әмма язылыш кагыйдәләрен аңлаткач, эчтәлеген кыскача аннотация рәвешендә язып бирә алган. Шулай да бу технология әле тулысынча камилләштерелмәгән.
Алга таба сүз галим һәм режиссер Илшат Сәетовка бирелде. Ул госманлы текстлары белән эшләү тәҗрибәсе турында сөйләде.
– API буенча фикер алышу барышында, Илшат серверларның артык йөкләнешкә чыдый алмавын ассызыклады: «APIга керү өчен аерым логин-пароль системасы булдырылса, бу проблема чишелер иде», – дип белдерде ул.
«Ясалма» берләшмәсе вәкиле Дмитрий исә, татар телен саклау һәм үстерү өчен, күбрәк дата-сетларның ачык булырга тиешлеген ассызыклады. Аларның яңартылмавына да игътибар итте: «Назарбаев университеты тиздән материаллар чыгачак дип белдергән иде, ләкин әле дә берни юк».
ТР ФА Гамәли семиотика институты директоры Ринат Абрек улы Назарбаев университеты белән булган хезмәттәшлек кысаларында бу сорауны ачыкларга сүз бирде.
– Минем төп эшем – татар теле өчен антиплагиат булдыру, – дип сүзен башлады инженер Изидә Хәялиева. – Моның өчен без төрле текстларны җыябыз, эшкәртәбез. Әмма зур бер проблема бар: рәсемнәрдән текстны танып алу системасы җитми. Әгәр дә шундый модельләр булса, эшебез күпкә җиңеләер иде, – дип фикереп җиткерде ул.
«Ясалма» (Нейротатарлар) берләшмәсе вәкиле, Телеграмны тәрҗемә итү белән шөгыльләнүче Илгиз Җиһангиров терминнарны татарчага тәрҗемә итү мәсьәләсен күтәрде:
– Тәрҗемә иткәндә, зур кыенлык туа – бик күп терминнарның татарчага тәрҗемәсе юк. Аларны уйлап табу, кулланылышка кертү – мөһим бурыч.
Бу мәсьәләгә карата Ринат Таһир улы:
– Без сүзлекләргә 100гә якын яңа неологизм өстәүне планлаштырабыз. Үзебез табып, теркәлмәгән сүзләрне дә рәсмиләштерәбез. Бу аңлатмалы сүзлек булачак. Иң зур проблема – сүзләрнең татарча-русча вариантын булдыру. Ләкин бу – бик авыр мәсьәлә. Әгәр дә, мәсәлән, биологик терминны татарчага тәрҗемә итәргә телисең икән, 7-8 сыйныфлар өчен биология дәреслекләрен актарып утырырга кала. Ә безнең очракта нишләргә? Тарихи, технологик һәм көнкүреш терминнарны тәртипкә салу өчен, аерым проект кирәк.
«Теория» студиясе җитәкчесе Илдар Әюпов та кушылды:
– Кирәкле сүз булмаса, аны уйлап табарга була. Мәсәлән, без «монитор» сүзенең татарча вариантын кертергә тырыштык. Ләкин ул халык арасында популярлашмады. Татар телендә терминнар өчен яңа сүзләр уйлап табыла, ләкин аларны гамәлгә кертү кыен.
– Безгә «Ел сүзе» булдырырга кирәк. Ел саен татар теленә кертелгән яңа сүзләрне билгеләп, аларны популярлаштыру ысулларын эзләү мөһим, – дип тәкъдим иттеләр.
Алга таба сүз Telegramны татар теленә тәрҗемә иткән Рәсим Хөсәеновка бирелде. Ул «Безнең тәҗрибә» проекты турында сөйләде:
– Бу эш 2015 елда Газиз Фәттах тарафыннан башланды. Ләкин ул хәзер күбрәк YouTube-каналын үстерү белән мәшгуль, тик безнең проект һаман да дәвам итә. Без чит телле видеоларны татарчага тәрҗемә итү белән шөгыльләнәбез. Һәркем үзен сынап карый ала. Ләкин «эшлисе килә» дип язучылар күп булса да, «килә»дән алга китми. Быел профессиональ актерлар белән эшли башладык. Мәсәлән, «Берсерк» аниме сериалының 2 сериясен тәрҗемә иттек. Татарча дубляж ясау энтузиазм һәм шәхси финансларга бәйле. Без бу эшне үз акчабызга эшләгәнебезне кешеләр белсен иде. Безнең актерлар башка проектларга караганда азрак акча ала, ләкин шул бәягә дә ризалашып, татар телендә контент булдырырга ярдәм итәләр. Бер серияне тәрҗемә итү якынча 10-12 мең сумга төшә. Бу 20 минутлык эпизод өчен, – дип аңлатты ул.
11нче сыйныф укучысы Нурислам Денисов командасы белән бергә исем сайларга ярдәм итә торган «Ләйлек» кушымтасын булдырган. Бу платформа аша кулланучылар матур һәм мәгънәле татар исемнәрен таба ала. Кушымта исемнәрне мәгънәсе буенча эзләү мөмкинлеге белән аерылып тора: мәсәлән, бай мәгънәле, затлы яңгырашлы яки сирәк очрый торган исемнәрне билгеле бер категорияләр аша табарга мөмкин. Проект маркетплейска чыгарылган булса да, Rustore платформасы аны татар телендә кабул итмәгән. Сәбәбе – татар телле кушымталарны рус телле аудиториягә туры килми дип санап, платформага кертмәү. Рус телендә яисә хәтта инглизчә булса, аларны урнаштыру мөмкинлеге бар, әмма татар телле версиягә чикләүләр куела. Бу – татар телендәге санлы продуктлар өчен зур киртә.
Ахырда катнашучылар, татар телен цифрлаштыруны тизләтү өчен, дәүләт ярдәме кирәклеген ассызыклады. «Безгә зур проектлар өчен грантлар, көчле серверлар, программистлар кирәк. Татар теле цифрлашмаса, ул көннән-көн кысылачак» – дигән фикер яңгырады.
Татар теле өчен XXI гасырда иң зур сынау – аның санлы мохиттә тулы хокуклы кулланылышын тәэмин итү. Телне саклау аны музей экспонаты итеп калдыру түгел, ә көндәлек тормышта, технологияләр дөньясында актив куллану дигән сүз.
Түгәрәк өстәл нәтиҗәләре күрсәткәнчә, бүген татар теленең санлы үсеше өчен зур мөмкинлекләр бар, әмма аларны гамәлгә ашыру өчен дәүләт ярдәме, белгечләр һәм финанслар кирәк. Татар теле цифрлашуга йөз тотканда гына, ул киләчәк буыннар өчен табигый аралашу мохите булып кала ала.
Нияз Гатауллин фотолары
Айзилә АБДРАХМАНОВА
БӨТЕНДӨНЬЯ ТАТАР ЯШЬЛӘРЕ ФОРУМЫ