صدا وسیله اصلی ارتباط ماست و تلفن بیش از یک قرن است که ما را قادر ساخته تا با استفاده از صدای خود به هم متصل شویم. تماس تلفنی همانطور که می شناسیم از آنالوگ به دیجیتال، از ثابت به موبایل و از کیفیت پایین گفتار به کیفیت گفتار طبیعی تبدیل شده است. با این حال، یک پیشرفت بزرگ هنوز وجود نداشت: چگونه می توان صدایی کاملاً معتبر و همهجانبه را به صورت زنده منتقل کرد.
معرفی کدک IVAS (خدمات صوتی و صوتی فراگیر) که توسط 3GPP در نسخه 18 در ژوئن سال جاری استاندارد شده است، یک پیشرفت بزرگ در فناوری صوتی است. برخلاف تماسهای صوتی مونوفونیک سنتی، IVAS انتقال صدای سهبعدی و همهجانبه را امکانپذیر میکند و تجربه ارتباطی غنیتر و واقعیتر را ارائه میدهد. این نوآوری با استفاده از فرمت های صوتی جدید بهینه شده برای تجربه صوتی فضایی مکالمه امکان پذیر شده است. یکی از این نمونهها، فرمت صوتی فضایی با کمک فراداده، MASA است که تنها از دو کانال صوتی و ابرداده برای توصیفات صوتی مکانی استفاده میکند. تماسهای صوتی فضایی به کاربران این امکان را میدهد تا صدا را طوری تجربه کنند که انگار در زندگی واقعی اتفاق میافتد، با آپشن های ی مانند ردیابی سر.
در زیر چالشهای برقراری تماس زنده سهبعدی به تلفنهای همراه، الزامات مربوط به ارتباطات فضایی و کدک جدید IVAS و تأثیر تغییر دهنده بازیهای صوتی سه بعدی زنده برای مردم، اپراتورهای تلفن همراه و تلفنهای هوشمند تجاری را تحلیل خواهیم کرد.
رئیس بخش مدیریت محصول، فناوری های نوکیا.
آوردن تماس سه بعدی به تلفن های همراه
آخرین نوآوری عمده در تماس صوتی، کدک EVS بود که در سال 2014 معرفی شد و توسط مصرف کنندگان به عنوان HD Voice+ شناخته شد. در حالی که کیفیت تماس را به طور قابل توجهی افزایش داد، مانند همه کدک های قبلی، تنها یک تجربه گوش دادن به صورت تک صدایی را ارائه داد.
با معرفی تماس صوتی سه بعدی - بزرگترین جهش در فناوری صوتی تماس صوتی در دهه ها - چالش ایجاد یک تجربه واقعی و همه جانبه در ارتباطات روزمره وجود دارد. در حالی که فناوری صدا به طور قابل توجهی تکامل یافته است - از آنالوگ به دیجیتال، ثابت به موبایل، و از کیفیت پایین به کیفیت گفتار طبیعی - انتقال صدای فضایی، جایی که صداها به طور طبیعی از اطراف دریافت میشوند، برای بازآفرینی در محیطهای موبایل بسیار پیچیدهتر است.
دستیابی به این سطح از تجربه صدای فراگیر در تنظیمات کنترل شده مانند سینماها و بازی های ویدیویی آسان تر بوده است، جایی که طراحی صدا یک عنصر اصلی است، اما بازتولید آن در تماس های روزمره تلفن همراه، طیفی از موانع فنی از جمله پردازش صدای فضایی در زمان واقعی، سخت افزار را معرفی می کند. محدودیت ها و اطمینان از سازگاری بین دستگاه ها.
کدک صوتی Immersive Voice and Audio Services (IVAS) مهمترین قدم رو به جلو در فناوری صوتی تماس صوتی برای چندین دهه است.
چگونه می توان با چالش های ارتباطات فضایی مقابله کرد و بر آن غلبه کرد
برای تبدیل شدن به یک راه حل صوتی فضایی قوی، چالش های متعددی برای غلبه بر Immersive Voice وجود داشته است. یک مسئله کلیدی کاهش نویز است که برای افزایش وضوح گفتار در تنظیماتی مانند کنسرت یا طبیعت بسیار مهم است. روشهای کاهش نویز سنتی اغلب فقط صداهای پیوسته، مانند صدای زمزمه تهویه مطبوع یا سر و صدای ترافیک را فیلتر میکنند، اما اغلب نویزهای دیگر پسزمینه را ترک میکنند. تداخل باد نیز با ایجاد نویزهای ناخواسته و ایجاد نوسانات در سطوح صدا، چالشی را ایجاد می کند.
با این حال، پیشرفتهای اخیر در یادگیری ماشینی و کاهش هوشمند نویز این مسائل را برطرف کرده است. به عنوان مثال، فناوری صوتی همه جانبه برای تنظیم هوشمندانه میزان کاهش نویز پسزمینه بسته به محیط اطراف و همچنین کنترل کاربران را فراهم میکند که به افراد امکان میدهد سطوح کاهش نویز را به صورت دستی تنظیم کنند. این تضمین می کند که صداهای ضروری منتقل می شوند و در عین حال صدای ناخواسته پس زمینه را به حداقل می رساند.
تنظیمات صوتی فراگیر با چندین میکروفون و بلندگو نیز با یک مانع بزرگ روبرو هستند - اکو آکوستیک. این زمانی اتفاق میافتد که میکروفون صدا را از بلندگوهای اطراف دریافت میکند و باعث بازخورد ناخواسته میشود. این مشکل در تنظیمات صوتی مکانی چالش برانگیزتر است، جایی که قرارگیری و تعداد بلندگوها بر کیفیت صدا و توانایی دستگاه برای ضبط صدای مکانی تأثیر می گذارد. روش های سنتی لغو اکو آکوستیک (AEC) اغلب در این محیط های پیچیده به خوبی کار نمی کنند. برای حل این مشکل، یک راه حل AEC فضایی مبتنی بر یادگیری ماشینی ایجاد شد که با استفاده از سیگنال مرجع، صدای بلندگو را از ورودی میکروفون حذف می کند. این امر کیفیت صدا را بهبود می بخشد، به ویژه برای صدای مکانی در برنامه های صوتی بلادرنگ.
معرفی کدک IVAS
برای آوردن صدای مکانی به تماس تلفن همراه، علاوه بر خدمات Over-the-Top (OTT)، پروژه مشارکت نسل سوم (3GPP) اخیراً یک استاندارد کدک صوتی جدید را پذیرفته است. استاندارد کدک IVAS که از طریق همکاری 13 شرکت توسعه یافت، در نسخه 18 3GPP گنجانده شد که بر اساس کدک خدمات صوتی پیشرفته (EVS) که به طور گسترده مورد استفاده قرار می گیرد، ساخته شده است. نکته مهم این است که کدک IVAS سازگاری کامل با عقب را حفظ می کند و از قابلیت همکاری یکپارچه با خدمات صوتی موجود اطمینان می دهد.
یکی از نوآوریهای کلیدی در طول استانداردسازی IVAS، ایجاد یک فرمت صوتی پارامتریک جدید به نام صوتی فضایی با کمک فراداده (MASA) بود که بهطور خاص برای دستگاههایی با فاکتورهای فرم محدود، مانند گوشیهای هوشمند طراحی شده بود. کدک IVAS یک رندر داخلی را ادغام میکند که از صدای دو گوش با ردیابی سر و پخش چند بلندگو با استفاده از فرمت MASA پشتیبانی میکند.
علاوه بر این، یک SDK کلاینت صوتی فراگیر میتواند بهعنوان بخش جلویی IVAS عمل کند و صدای فضایی را از میکروفونهای دستگاه گرفته و آن را به فرمت استاندارد MASA تبدیل کند. این فناوری تجربههای صوتی واقعی سه بعدی را برای انواع تماسهای صوتی امکانپذیر میکند.
قدرت صدای سه بعدی زنده: معنای آن برای افراد، اپراتورها و مشاغل
صدای سه بعدی همهجانبه جدید تجربه صوتی را برای مصرف کنندگان، شرکت ها و صنایع متحول می کند. برای مصرف کنندگان، تعامل با دوستان و خانواده را با به اشتراک گذاشتن صداهای محلی، خواه پخش زنده یا ضبط شده، عمیق تر می کند و غوطه ور شدن کامل در تجارب متاورس هماهنگ را ارائه می دهد. برای شرکتها، تماس صوتی صوتی سهبعدی قابلیتهای جدیدی را باز میکند، از تجربه مشتری بهبودیافته از طریق صدای جهتدار گرفته تا تغییر شکل همکاری تیمی و تصمیمگیری. در تنظیمات صنعتی، تجزیه و تحلیل صوتی میتواند فرآیندهای خودکار مانند تعمیر و نگهداری پیشبینی، سادهسازی عملیات و افزایش کارایی را هدایت کند.
به منظور فعال کردن این تجربیات در شرایط مختلف شبکه، ارائه دهندگان خدمات به راه حل های مقیاس پذیر نیاز دارند که عملکرد را بدون توجه به محدودیت های پهنای باند بهینه می کند. کدک استاندارد IVAS 3GPP نرخ بیت از 13.2 تا 512 کیلوبیت بر ثانیه را در خود جای می دهد و کیفیت صدای فراگیر را چه در شبکه های متراکم و چه در محیط های پخش با کیفیت بالا تضمین می کند. این مقیاسپذیری به ارائهدهندگان خدمات این امکان را میدهد تا از کاربران بیشتری در حین ارائه تجربیات صوتی غنی پشتیبانی کنند.
با نگاهی به آینده، پیش بینی می شود که رفتار کاربر مبتنی بر صدا به تکامل خود ادامه دهد. فراتر از تماسهای سنتی، ارتباطات صوتی فضایی گسترش مییابد تا پیامرسانی نیمه همگام از طریق برنامههای محبوب، افرادی که کلیپهای صوتی را برای یکدیگر ارسال میکنند و استفاده گستردهتر از تماسهای گروهی را شامل شود. با ظهور دستگاه ها و خدمات واقعیت گسترده در سراسر صنایع، دامنه ارتباطات صوتی حتی گسترده تر می شود و غوطه وری به عنوان یک ویژگی تعیین کننده است. یک عامل کلیدی در این تکامل، استانداردسازی و ادغام کدک IVAS در آخرین استاندارد پیشرفته 5G خواهد بود، که برای اطمینان از قابلیت همکاری لازم برای برقراری تماس سه بعدی با هر تلفن با فشار یک دکمه ضروری است.
ما بهترین سیستم های تلفن تجاری را رتبه بندی کرده ایم .
این مقاله به عنوان بخشی از کانال Expert Insights TechRadarPro تهیه شده است که در آن بهترین و باهوش ترین ذهن ها در صنعت فناوری امروز را معرفی می کنیم. نظرات بیان شده در اینجا نظرات نویسنده است و لزوماً نظرات TechRadarPro یا Future plc نیست. اگر علاقه مند به مشارکت هستید، اطلاعات بیشتری را در اینجا بیابید: https://www.techradar.com/news/submit-your-story-to-techradar-pro
ارسال نظر