من هیچ تصویری از تجربه پروژه Starline خود ندارم . گوگل یک خط مشی سختگیرانه «بدون عکس، بدون ویدیو» در نظر گرفته بود. بدون همکار. فقط من در یک اتاق جلسه تاریک در محوطه آمفی تئاتر Shoreline در Mountain View. وارد می شوی و جلوی یک میز می نشینی. در مقابل شما چیزی است که شبیه یک تلویزیون صفحه تخت و بزرگ است.
لبی زیر صفحه نمایش به صورت یک قوس به بیرون کشیده شده است که در یک بلندگو قرار دارد. سه ماژول دوربین در لبه های صفحه نمایش وجود دارد - در بالا و دو طرف. آنها کمی شبیه Kinects به نظر می رسند به طوری که به نظر می رسد همه دوربین های استریوسکوپی مدرن هستند.
جلسه هفت دقیقه ای بسیار کوتاه در واقع یک مصاحبه است. هنگامی که فوکوس تصویر واضحتر میشود، یک شکل نرم و تار وارد کادر میشود و مینشیند. به نظر می رسد که هم یک تنظیم حریم خصوصی است و هم فرصتی برای سیستم برای کالیبره کردن موضوع خود. یکی از تفاوت های کلیدی بین این نمونه اولیه پروژه استارلاین و نمونه ای که گوگل در اواخر سال گذشته به نمایش گذاشت، کاهش چشمگیر سخت افزار است.
این تیم تعداد دوربینها را از «چند» به چند دوربین کاهش داده و اندازه کلی سیستم را از چیزی شبیه به یکی از آن غرفههای غذاخوری بهطور چشمگیری کاهش داده است. ترفند در اینجا ایجاد یک مدل سه بعدی بلادرنگ از یک فرد با زاویه دوربین بسیار کمتر است. اینجاست که هوش مصنوعی و ML وارد عمل میشوند و شکافهای داده را پر میکنند، نه کاملاً متفاوت با روشی که پیکسل با ابزارهایی مانند Magic Erase به پسزمینهها تقریب میکند - البته با رندر سهبعدی.
بعد از اینکه موضوع مصاحبه من - یکی از اعضای تیم پروژه استارلاین - ظاهر شد، کمی زمان می برد تا چشم و مغز خود را تنظیم کنند. این یک هولوگرام متقاعدکننده است - مخصوصاً برای رندرهایی که در زمان واقعی ارائه میشوند، تقریباً با همان تأخیری که در یک تماس ساده زوم دو بعدی قدیمی تجربه میکنید.
شما متوجه چیزی خواهید شد که کمی… خاموش است. انسان ها معمولاً سخت ترین هستند. ما طی هزاران سال تکامل یافته ایم تا کوچکترین انحراف از هنجار را شناسایی کنیم. من اصطلاح "انقباض" را برای توصیف حرکت ظریف روی بخشهایی از پوست سوژه کنار میگذارم. او - دقیق تر - آنها را "مصنوعات" می نامد. اینها نمونههای کوچکی هستند که سیستم به احتمال زیاد به دلیل محدودیتهایی که در دادههای جمعآوریشده توسط حسگرهای درونبرد وجود دارد، کاملاً ثابت نشده است. این شامل بخشهایی با فقدان اطلاعات بصری میشود، که به نظر میرسد هنرمند از رنگ کوتاهی برخوردار است.
بسیاری از سطح راحتی شخصی شما به تطبیق با این ارائه جدید اطلاعات دیجیتالی بستگی دارد. به طور کلی، زمانی که بیشتر ما با شخص دیگری صحبت می کنیم، کل مکالمه را صرف شکل فیزیکی او نمی کنیم. شما روی کلمات تمرکز میکنید و اگر با چنین چیزهایی هماهنگ هستید، نشانههای فیزیکی ظریفی که در طول راه از بین میبریم. احتمالاً هر چه بیشتر از سیستم استفاده کنید، مغز شما به کالیبراسیون کمتری نیاز دارد.
به نقل از یک نشریه تحقیقاتی گوگل در مورد این فناوری:
سیستم ما به نشانههای سه بعدی سمعی و بصری کلیدی (استریوپسیس، اختلاف منظر حرکتی و صدای فضایی) دست مییابد و طیف کاملی از نشانههای ارتباطی (تماس چشمی، حرکات دست و زبان بدن) را فعال میکند، اما نیازی به عینک یا میکروفون/هدفون مخصوص بدن ندارد. . این سیستم متشکل از یک نمایشگر اتوسترئوسکوپی با ردیابی سر، زیرسیستمهای تصویربرداری و رندر سه بعدی با وضوح بالا و انتقال شبکه با استفاده از رنگهای فشرده و جریانهای ویدئویی عمقی است. کمکهای دیگر عبارتند از الگوریتم ترکیبی هندسه مبتنی بر تصویر، قطع صدا در فضای آزاد، و محلیسازی سخنگو.
در واقع، پروژه استارلاین با استفاده از دو دوربین بیولوژیکی با فاصله در جمجمه، اطلاعات را جمعآوری میکند و به گونهای ارائه میکند که درک عمق (stereopsis) ایجاد کند. در همین حال، صدای فضایی عملکرد مشابهی را برای صدا انجام می دهد و بلندگوها را کالیبره می کند تا این تصور را ایجاد کند که صدای گوینده از دهان مجازی آنها خارج می شود.
گوگل مدتی است که این نسخه اولیه خاص را با WeWork، T-Mobile و Salesforce آزمایش میکند - احتمالاً مشتریان شرکتهای بزرگی که به چنین چیزی علاقه دارند. این شرکت او میگوید بسیاری از بازخوردها حول این موضوع است که چقدر این تجربه نسبت به چیزهایی مانند Google Meet، Zoom و Webex صحت دارد - پلتفرمهایی که در طول همهگیری همهگیر تهوع ما را نجات دادند، اما همچنان محدودیتهای زیادی دارند.
احتمالاً شنیدهاید که مردم شکایت میکنند - یا خودتان شکایت کردهاید - در مورد چیزهایی که وقتی از جلسه حضوری به فضای مجازی رفتیم از دست دادیم. این یک احساس عینی واقعی است. بدیهی است که Project Starline هنوز یک تجربه مجازی است، اما احتمالاً می تواند مغز شما را فریب دهد تا خلاف آن را باور کند. به خاطر یک جلسه در محل کار، رک و پوست کنده احتمالاً بیش از اندازه کافی است.
اینجا هیچ جدول زمانی و قیمتی وجود ندارد. گوگل در جلسه ما از آن به عنوان "پروژه فناوری" یاد کرد. احتمالاً نتیجه ایده آل برای تمام زمان و هزینه ای که برای چنین پروژه ای صرف می شود، یک محصول قابل فروش است. اندازه نهایی و قیمت احتمالی تقریباً مطمئناً برای بسیاری از ما دور از دسترس خواهد بود. من میتوانم نسخه ماژولارتری از سیستم دوربین را ببینم که به کنار تلویزیون یا رایانه متصل میشود و عملکرد خوبی دارد.
برای اکثر افراد در بیشتر موقعیتها، در شکل فعلیاش بیش از حد است، اما به راحتی میتوان فهمید که چگونه گوگل میتواند به آینده کنفرانس از راه دور اشاره کند. مطمئناً کارفرمایان شما را شکست می دهد و باعث می شود که در یک متاورس ناتمام تماس بگیرید.