
۲۷ سال تلاش برای زنده کردن زبان تبتی در دنیای دیجیتال
در آزمایشگاه دانشگاه شیزانگ در منطقه خودمختار شیزانگ (تبت) در جنوب غربی چین، یونگ تسو و تیمش جان تازهای به یک نسخه خطی باستانی تبتی بخشیدهاند.
اسکنهای دیجیتال با کیفیت بالا، تمام جزئیات «چهار رساله پزشکی تبتی» را در این نسخه دستنویس از آثار کلاسیک پزشکی مشهور سلسله مینگ (۱۳۶۸ تا ۱۶۴۴) حفظ کردهاند؛ از لکههای آب کمرنگشده و یادداشتهای علمی در حاشیه صفحات گرفته تا حروف باستانی تبتی.
یونگ تسو، استاد دانشکده علوم و فناوری اطلاعات این دانشگاه، با استفاده از الگوریتمهای پیشرفته هوش مصنوعی، اسناد قدیمی را صفحه به صفحه تحلیل و دیجیتالی میکند و امکان دسترسی پایدار و گسترده به دانش پزشکی کهن تبتی را فراهم میسازد.
او امسال موفق به دریافت مدال ملی کار ۱ مه شد که یکی از بالاترین افتخارات چین برای کارگران به شمار میرود.
امروزه خدمات دیجیتال زبان تبتی در شیزانگ به بخشی از زندگی روزمره تبدیل شده است. سالمندان از طریق سامانههای خدمات درمانی تبتی برای ویزیت پزشکی وقت میگیرند، راهبان با تلفن همراه پیامک تبتی ارسال میکنند و دامداران از قابلیت تبدیل گفتار به نوشتار برای گفتوگو با خانواده خود در ویچت استفاده میکنند.
این امکانات که امروز کاملاً عادی و در دسترس به نظر میرسند، نتیجه روندی هستند که تنها در سه دهه گذشته شکل گرفته است. دیجیتالی شدن زبان تبتی با قدمتی ۱۳۰۰ ساله، با حمایت دولت و تلاش پژوهشگرانی مانند یونگ تسو به تدریج محقق شده است.
یونگ تسو که در لهاسا، مرکز منطقهای شیزانگ، بزرگ شده بود، در سال ۱۹۹۴ و در دورانی که رایانهها هنوز چندان رایج نبودند، برای تحصیل در رشته علوم و فناوری رایانه وارد دانشگاه تربیت معلم شانشی در استان شانشی در شمال غربی چین شد.
او به یاد میآورد: «فقط در کلاس کامپیوتر میتوانستم از رایانه استفاده کنم و راهاندازی آن نیازمند وارد کردن یک دستور طولانی و پیچیده بود.» او میگوید روزی هنگام نگاه کردن به مکاننمای چشمکزن روی صفحه نمایش این فکر به ذهنش رسید: «سیستم عامل انگلیسی به خوبی کار میکند. اگر زبان تبتی هم میتوانست روی رایانه اجرا شود چه؟ آیا متون مقدس باستانی موجود در صومعهها و کتابخانهها نمیتوانستند روی صفحه نمایش جان بگیرند؟»
این رؤیا در سال ۱۹۹۸ شکل جدیتری به خود گرفت؛ زمانی که یونگ تسو به عنوان یکی از نخستین اعضای هیئت علمی دانشکده علوم و فناوری اطلاعات دانشگاه شیزانگ به این دانشگاه پیوست. او به تیم پژوهشی تحت هدایت نییما تاشی، از چهرههای برجسته فناوری اطلاعات تبتی و عضو آکادمی مهندسی چین، ملحق شد.
این گروه یک سال پیش از آن، استاندارد رسمی رمزگذاری بینالمللی زبان تبتی را منتشر کرده بود و زمینه را برای دیجیتالیسازی گسترده متون باستانی تبتی فراهم کرده بود. با این حال، چالشهای بزرگی همچنان وجود داشت؛ از ناسازگاری سامانههای رایج با نویسههای باستانی تبتی و نمادهای ویژه گرفته تا محدودیتهای سختافزاری و خرابیهای مکرر سیستمها که روند تحقیقات را کند میکرد. یونگ تسو خود را وقف کارهای فنی کرد و به طور مداوم فناوریهای تشخیص زبان تبتی را در سناریوهای مختلف بهبود داد. آنها گام به گام مسیر فنی لازم را برای دیده شدن و شناخته شدن زبان تبتی در دنیای دیجیتال ایجاد کردند.
همزمان با پیشرفت فناوریهای اینترنت و هوش مصنوعی، یونگ تسو چندین بار برای ادامه تحصیل و پژوهش از فلات شیزانگ خارج شد. او در سال ۲۰۰۳ برای آموزشهای تکمیلی به نروژ رفت و بعدها در پروژههای پژوهشی و برنامههای تبادل علمی در آمریکا و کانادا نیز حضور یافت.

او در سال ۲۰۱۷ به طور جدی وارد حوزه دیجیتالی کردن نسخههای خطی باستانی تبتی شد؛ زمانی که هدایت نخستین پروژه کلیدی ملی تحقیق و توسعه دانشگاه را بر عهده گرفت.
بزرگترین چالش، فاصله میان رشتههای مختلف علمی بود. او میگوید: «افرادی که الگوریتمها را میشناختند، متون باستانی را نمیشناختند و کسانی که متون را میدانستند، با الگوریتمها آشنا نبودند.» این تیم که از متخصصان علوم رایانه، زبان و ادبیات تبتی و پزشکی تبتی تشکیل شده بود، با راهنمایی نییما تاشی یک چرخه کاری کامل برای دیجیتالی کردن متون باستانی تبتی ایجاد کرد و از طریق تجربه عملی مداوم بر چالشهای میانرشتهای غلبه یافت.
آنها با موفقیت سامانهای برای تحلیل ساختار اسناد تبتی و تشخیص متون چندفونتی توسعه دادند که دقت آن در متون چاپی استاندارد بیش از ۹۵ درصد و در متون دستنویس بیش از ۸۶ درصد است.
این فناوری اکنون در پروژه ملی حفاظت از متون باستانی کاخ پوتالا به کار گرفته شده و امکان حفظ دائمی نسخههای ارزشمند و در معرض خطر را به صورت دیجیتال فراهم کرده است. همچنین از استخراج دانش پزشکی و پیشبرد پژوهشهای پزشکی تبتی و مطالعات فرهنگی پشتیبانی میکند.
یونگ تسو طی ۲۷ سال فعالیت خود، راهنمایی بیش از ۴۰ دانشجوی کارشناسی ارشد و دکترا را بر عهده داشته است. همچنین بیش از هزار متخصص دوزبانه فناوری اطلاعات تبتی ـ چینی از این دانشگاه فارغالتحصیل شدهاند.
تیم تحت رهبری نییما تاشی به مجموعهای از دستاوردهای مهم و نظاممند دست یافته است؛ از نسخه تبتی سیستم عامل Kylin گرفته تا پروژههای کلیدی ملی تحقیق و توسعه و طرحهای بزرگ هوش مصنوعی در حوزههایی مانند هوش زبانی تبتی، تشخیص خودکار، تحلیل متون باستانی، دیجیتالیسازی پزشکی تبتی و توسعه مدل زبانی بزرگ تبتی.
دولت چین نیز از توسعه فناوریهای مرتبط با زبان تبتی حمایت کرده است. در پایان سال ۲۰۱۵، استاندارد ملی «فناوری اطلاعات ـ واژگان» به زبان تبتی به طور رسمی منتشر شد و به نخستین استاندارد ملی واژگان فناوری اطلاعات در میان زبانهای اقلیتهای قومی تبدیل شد. در سال ۲۰۲۳ نیز یک پلتفرم آنلاین برای پاسخگویی به پرسشهای مربوط به زبانهای تبتی و ماندارین راهاندازی شد که طبق گزارش رسمی منتشرشده در سال گذشته، دارای پایگاه دادهای شامل ۳۰۰ هزار اصطلاح استاندارد است.
یونگ تسو گفت: «با افزایش چشمگیر دقت فناوریهای نوین اطلاعاتی در تشخیص متن، دانش پزشکی نهفته در «چهار رساله پزشکی تبتی» به صورت دیجیتال احیا شده و بار دیگر در دسترس قرار گرفته است.»


