فناوری شبیه سازی صدا ظرف ۱۵ ثانیه از راه رسید

    •••••  ﺳﻪشنبه ۱۴ فروردین ۱۴۰۳ — ۰۸:۴۹ کد مطلب : 156563/a   

به گزارش تحلیل ایران به نقل از انگجت، این فناوری شبیه سازی صدا می‌تواند با تحلیل یک نمونه صوتی ۱۵ ثانیه‌ای از هر گوینده‌ای تقلید کند.

 

این شرکت اعلام کرد با صداهایی واقعی و احساسی صحبتی طبیعی را تولید می‌کند.

 

این فناوری براساس نوآوری فعلی text to speech API شرکت بنا شده و از سال ۲۰۲۲ میلادی در دست توسعه بوده است. اوپن ای آی قبلاً از نسخه‌ای از مجموعه ابزار برای تقویت صداهای از پیش تعیین شده موجود در API تبدیل متن به گفتار فعلی و ویژگی Read Aloud استفاده کرده است. مجموعه‌ای از نمونه‌ها در وبلاگ رسمی این شرکت وجود دارد و آنها به میزان بسیار زیادی به واقعیت نزدیک هستند.

 

اوپن ای آی اعلام کرده این فناوری را به عنوان دستیار خوانش، ترجمه زبان و کمک به افرادی با شرایط خاص کاربرد دارد. این شرکت همچنین یک برنامه پایلوت در دانشگاه براون نیز انجام داده که با ایجاد Voice Engine به بیمار دچار اختلالات حرف زدن، کمک کرد.

 

شرکت از ریسک‌های جدی این فناوری به خصوص با توجه به انتخابات ریاست جمهوری پیش رو در آمریکا نیز آگاه است. اوپن ای آی اعلام کرده بازخوردهای مربوط به شرکای بین المللی و آمریکایی از دولت‌های مختلف بخش‌های رسانه، سرگرمی، تحصیل، مدنی و غیره را نیز در نظر می‌گیرد تا عرضه محصول با کمترین ریسک تضمین شود.