مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

31 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • إسرائيل تواصل غاراتها على لبنان
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • فيديوهات

    فيديوهات

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

تفاصيل جديدة عن قاعدة إسرائيل السرية في صحراء العراق وعلاقتها باستهداف الطيارين

"لا يهمنا إرضاء الرئيس الأمريكي".. مصدر إيراني يعلق على رفض ترامب لرد طهران بشأن إنهاء الحرب

"الوصايا العشر".. المرشد الإيراني يحدد ثوابت طهران في الخليج ومضيق هرمز

لبنان لحظة بلحظة.. نتنياهو يتمسك بالخيار العسكري وبيروت تطالب ببسط سلطة الدولة على كامل أراضيها

أول تعليق إيراني رسمي على الدعم العسكري المصري للإمارات

سوريا.. تجريد بشار وماهر الأسد من حقوقهما المدنية ووضع أملاكهما تحت إدارة الحكومة

خلال 24 ساعة هبوط اضطراري ثان لمقاتلة إف 35 أمريكية بقاعدة الظفرة في الإمارات (فيديو)

"تانكر تراكرز": التسرب النفطي في مضيق هرمز مصدره ناقلة إماراتية تعرضت لاستهداف إيراني (فيديو)

وزير الطاقة الأمريكي: اتفاق محتمل مع إيران قد لا يعالج جميع مخاوف برنامجها النووي.. التحدي صعب

أعلى سلطة قضائية سورية تلاحق جنرالا أمنيا وثلاثة وزراء سابقين

نتنياهو يعترف بانهيار صورة إسرائيل لدى الشباب الأمريكي وارتفاع تعاطفهم مع فلسطين

الحرس الثوري يحذر دول المنطقة من "ارتكاب أي خطأ"

لبنان لحظة بلحظة.. غارات مكثفة ترفع حصيلة الضحايا ومطالبة بانسحاب إسرائيلي كامل

"مهر": دوي انفجار جنوب شرق إيران ناجم عن تدمير ذخائر من مخلفات القصف الأمريكي

لأول مرة منذ بدء الحرب.. عبور ناقلة غاز قطرية مضيق هرمز بإذن إيراني

بريطانيا وفرنسا ترسلان قطعا بحرية إلى مضيق هرمز تزامنا مع قمة دفاعية دولية غدا

القناة 13 الإسرائيلية: حماس تعيد بناء قدراتها العسكرية وتكثف إنتاج الصواريخ والعبوات في غزة

عراقجي وعبد العاطي يبحثان التطورات الإقليمية ومسار المفاوضات الإيرانية الأمريكية