چگونه یک نسخه نمایشی رباتیک را برای سرگرمی و سود جعل کنیم

شناسهٔ خبر: 449459 - تاریخ: فوریه 10, 2024

در مارس 2008 ، یک روباتیک در لباس زمستانی به بیگ داگ ضربه بزرگی به دوربین داد. ربات پرهیاهو با بودجه دارپا تصادف کرد، اما به سرعت جای خود را در میان پارکینگ برفی باز کرد. در نظر برتر ویدیو آمده است: «لطفاً به پیش‌نواز متحرک در حال حرکت لگد نزنید.» "به یاد خواهد آورد."

دیگری اشاره می کند: «مثل جهنم وحشتناک است». "تصور کنید روزی در جنگل قدم می زنید و می بینید که آن چیزی به سمت شما می آید." وبلاگ‌های ابزارک و حساب‌های رسانه‌های اجتماعی در آن روزها قبل از اینکه بلک میرر به جهان کوتاه‌نویسی مستقیم‌تری بدهد، کلماتی مانند «وحشتناک» و «روبوکالیپس» را به‌طور متفاوتی به زبان می‌آوردند. بوستون داینامیکس موفق شد. این ویدیو در حال حاضر 17 میلیون بازدید دارد. این اولین مورد از بازدیدهای ویروسی بی شماری بود که تا به امروز ادامه دارد.

دیگر اخبار

اپل Vision Pro را عرضه می کند، طرفداران تیلور سویفت پاسخ می دهند و Palworld مورد انتقاد قرار می گیرد

اغراق کردن نقشی که چنین ویروسی در توسعه بعدی Boston Dynamics به یکی از قابل شناسایی ترین شرکت های رباتیک جهان ایفا کرده است، دشوار است. بیگ داگ و فرزندانش مانند اسپات و اطلس مورد تجلیل، شیطان پرستی، تقلید و حتی در یک تبلیغ آبجوی سام آدامز قرار گرفته اند. همراه با توسعه برخی از پیشرفته ترین مکاترونیک های جهان، تیم Boston Dynamics ثابت کرده اند که بازاریاب بسیار باهوشی هستند.

در مورد نقشی که چنین ویدئوهایی در گسترش انجیل روباتیک ایفا کرده اند، باید گفت.

به نظر می‌رسد ویدیوهایی از این دست الهام‌بخش حرفه رباتیک‌های بی‌شماری است که در حال حاضر در این زمینه در حال پیشرفت هستند. این مدلی است که استارت‌آپ‌های بعدی بی‌شماری برای طیف وسیعی از موفقیت‌ها اتخاذ کرده‌اند. Boston Dynamics مطمئناً نمی تواند در قبال هیچ یک از آن شرکت هایی که ممکن است چند میانبر در این مسیر انتخاب کرده باشند، پاسخگو باشد.

در دهه‌های اخیر، ویدیوهای روبات‌های ویروسی از موضوعات کنجکاوی در میان تکنوراتی‌ها به بازدیدهای جذابی که از طریق TikTok و YouTube فیلتر شده‌اند، تبدیل شده‌اند. همانطور که پاداش های بالقوه افزایش یافته است، میل به نرم کردن لبه ها نیز افزایش می یابد. مسائل پیچیده تر، وضعیت CGI است که برای بسیاری از بینندگان از واقعیت قابل تشخیص نیست. سوگیری تایید، جذابیت به تازگی و فقدان تخصص فنی، همه نقش کلیدی در گرایش ما به باور اخبار و ویدئوهای جعلی دارند.

برای مثال می‌توانید بیننده TikTok معمولی را به خاطر درک نکردن پیچیدگی‌های تعمیم ببخشید. بسیاری از روباتیک‌ها - شاید به طور ناخواسته - با بیان این نکته که سیستم‌هایی که در ویدیوها می‌بینیم «هدف عمومی» هستند، به آن آتش گفت ه‌اند. شاید چند منظوره باشد، اما ما هنوز از روبات‌هایی که می‌توانند هر کاری را انجام دهند که محدودیت‌های سخت‌افزاری مانعی ندارد، فاصله داریم.

بیشتر اوقات، ویدیوهایی که می بینید محصول ماه ها یا سال ها کار هستند. جایی روی یک هارد دیسک ساعت‌ها ویدیویی که به مرحله نهایی نرسیده است، نشان می‌دهد که رباتی در حال تلو تلو خوردن، کندوپاش کردن یا توقف کوتاه است. دقیقاً به همین دلیل است که من شرکت ها را تشویق کرده ام تا برخی از این ویدیوها را با مخاطبان TechCrunch به اشتراک بگذارند. شاید تعجب آور نباشد که تعداد کمی از من این پیشنهاد را پذیرفته اند. من گمان می کنم که بسیاری از این به نحوه درک مردم از چنین اطلاعاتی مربوط می شود. در بین رباتیک، ساعت ها و روزهای آزمایش و شکست نشان دهنده میزان سختی کار شما برای رسیدن به محصول نهایی است. با این حال، در میان عموم مردم، چنین خرابی های روباتی ممکن است به عنوان یک شکست از سوی خود متخصصان رباتیک تلقی شود.

در یک شماره 2023 از Actuator (RIP)، من Boston Dynamics را به خاطر "قرقره بلوپر" که اطلس را از دست می دهد و بین حرکات موفق پارکور منتشر کرده بود، تحسین کردم. طبق معمول، خیلی بیشتر از برش نهایی در کف اتاق برش قرار گرفت. حتی زمانی که با روبات‌ها سروکار ندارید، همه چیز به همین شکل پیش می‌رود.

چند هفته پیش، من در یک سخنرانی کارگردان کلی ریچارد بعد از نمایش فیلم جدید و فوق‌العاده‌اش ، «Showing Up» شرکت کردم. او تکرار کرد که WC Fields قدیمی در مورد کار کردن با کودکان یا حیوانات است. در بیشتر موارد، احتمالاً مکاترونیک پیشرفته را به آن فهرست اضافه می کنم.

در کنار CG/رندرها، ویرایش خلاق تنها یکی از راه‌های بالقوه برای شیرین کردن دموهای روباتیک است. در اغلب موارد، قصد بدی نیست. احساسی که نوازندگان اغلب در پادکست من با من به اشتراک می گذارند این است که وقتی آهنگی در جهان منتشر شد، دیگر کنترلی روی آن نخواهید داشت. تا حدی، من معتقدم که همین امر می تواند در مورد ویدیو نیز صادق باشد. انتخاب‌هایی برای سخت‌تر کردن کارها و شیرین کردن ارائه انجام می‌شود. اینها بخش مهمی از ساخت ویدیوهای مصرفی آنلاین هستند. با این حال، به خصوص در عصر TikTok، زمینه اولین قربانی است.

هیچ کتاب قانونی برای اطلاعاتی که باید در یک نسخه نمایشی روباتیک گنجانده شود وجود ندارد. با این حال، هرچه بیشتر به آن فکر می‌کنم، بیشتر معتقدم که باید - حداقل - برخی دستورالعمل‌های کاملاً تعریف‌شده وجود داشته باشد. من یک روباتیک نیستم. من فقط یک آدم نادان هستم که دارای مدرک کارشناسی در نویسندگی خلاق هستم. با این حال، من مرتباً با افرادی بسیار باهوش تر از خودم در مورد این موضوع صحبت می کنم.

درست قبل از CES، یک پست لینکدین توجه من را به خود جلب کرد (به نظر می رسد که چشمان بسیاری از جامعه روباتیک نیز دیده می شود). این توسط براد پورتر، بنیانگذار و مدیر عامل شرکت رباتیک مشارکتی که قبلاً تلاش های رباتیک صنعتی آمازون را رهبری می کرد، نوشته شده است. من به ندرت توصیه می کنم لینکدین را دنبال کند، اما اگر اصلاً به فضا اهمیت می دهید، او فضای خوبی است.

در این مقاله، پورتر اشاره می‌کند که CES احتمالاً با نمایش‌های روباتیک جالب بدی خواهد بود (اینطور بود)، اما اضافه می‌کند، «ویدئوهای شگفت‌انگیز زیادی نیز وجود دارد. جدا کردن واقعیت از صحنه‌سازی سخت است. » مدیر اجرایی هیچ یک از توشه های منفی را که ممکن است کلمه ای مانند "صحنه صحنه" در این زمینه داشته باشد، دلالت نمی کند. او در عوض فقط به بینندگان پیشنهاد می‌کرد که با دیدی آگاهانه و - شاید - مشکوک به چنین ویدئوهایی نگاه کنند.

من چند سالی است که این فضا را پوشش می‌دهم و برخی از مهارت‌ها را برای شناسایی ربات کایفابه توسعه داده‌ام. اما من هنوز هم اغلب به متخصصانی در این زمینه مانند پورتر تکیه می‌کنم که یک نسخه نمایشی از کار بیفتد. البته، هر بیننده ای تجربه یا دسترسی من به این افراد را ندارد. با این حال، آن‌ها می‌توانند خود را با آگاهی از نحوه شیرین‌سازی چنین ویدیوهایی - به صورت مخرب یا غیرقانونی - مجهز کنند.

پورتر پنج نقطه مختلف را مشخص می کند. اولین مورد "استاپ موشن" است. این به مجموعه ای از ویرایش های سریع اشاره دارد که به نظر می رسد ربات به گونه ای حرکت می کند که در زندگی واقعی قادر به انجام آن نیست.

او می‌نویسد: «اگر یک ویدیوی رباتیک با پرش‌های زیاد فریم یا برش‌های دوربین می‌بینید، مراقب باشید. "متوجه خواهید شد که ویدئوهای Boston Dynamics اغلب یک برش بدون بریدگی دوربین هستند، این قابل توجه است. "

دوم شبیه سازی است. این در عمل همان مثال CG است که در بالا آوردم. شبیه سازی به یک ابزار اساسی در استقرار رباتیک تبدیل شده است. این به افراد اجازه می دهد هزاران سناریو را به طور همزمان در چند ثانیه اجرا کنند. همراه با دیگر گرافیک های کامپیوتری، شبیه سازی رباتیک در سال های اخیر به طور فزاینده ای فتو واقع گرایانه رشد کرده است. ایجاد و به اشتراک گذاری یک شبیه سازی واقع گرایانه به خودی خود یک مشکل نیست. این مسئله، در عوض، زمانی به وجود می آید که چیزهایی مانند واقعیت را کنار بگذارید.

شماره سه نام جالبی دارد. دموهای جادوگر اوز به دلیل بلند کردن سنگینی که توسط [فرد] پشت پرده انجام می شود (توجه نکنید) چنین نامیده می شود. پورتر نسخه ی نمایشی موبایل ALOHA استانفورد را به عنوان مثال ذکر می کند. من قویاً معتقدم هیچ سوء نیتی در تصمیم برای اجرای نسخه ی نمایشی (هنوز بسیار چشمگیر) از طریق تلهوپ خارج از صفحه وجود نداشته است. در واقع، «اپراتور ربات»، تونی ژائو، هم در تیتراژ ویدیو و هم در تیتراژ پایانی ظاهر می شود.

بیشتر بخوانید

امکان افزایش ۳۸ درصدی قیمت پایه خودروها / شورای رقابت خودروسازان را بد عادت کرد

متأسفانه، ظاهر دو دقیقه و نیم به یک دمو سه و نیم دقیقه ای رخ می دهد. اما این روزها باید فرض کنیم که:

در واقع هیچ کس دیگر آنقدر توجه ندارد که در دو دقیقه و نیم فیلم باورنکردنی ربات بنشیند.

این چیز قرار است تکه تکه شود و از همه زمینه ها پاک شود.

متوسط بیننده TikTok X (توئیتر) شما منبع ویدیو را جستجو نمی کند.

برای مثال دیگری که اندکی پس از پست پورتر رسید، نگاهی به ویدیوی X ایلان ماسک از ربات انسان‌نما Optimus بیندازید. این ویدئو با متن "اپتیموس یک پیراهن را تا می کند" پخش شد. بینندگان چشم عقابی مانند من چیزی جالب را در گوشه پایین سمت راست مشاهده کردند: دستی با دستکش که گهگاه تا حدی به قاب می‌خورد که با حرکت ربات مطابقت داشت.

من در آن زمان متذکر شدم: «با قاب‌بندی ویدیوی لباس‌شویی Optimus فقط چند اینچ بیشتر به سمت چپ، چیزی را که شبیه یک دست تله‌اپ کنترل تسلا بات است، از دست می‌دادید. «تلاپ هیچ مشکلی ندارد، البته برنامه‌های کاربردی بسیار خوبی از جمله آموزش، عیب‌یابی و اجرای کارهای بسیار تخصصی مانند جراحی دارد. اما خوب است بدانیم که چه چیزی را می بینیم (و نمی بینیم). این به نظر من یک مورد واضح از پوستر اصلی است که اطلاعات کلیدی را حذف می‌کند و درک می‌کند که مخاطبان/طرفدارانش شکاف‌ها را با آنچه که فکر می‌کنند بر اساس احساساتشان درباره پیام‌رسان می‌بینند پر می‌کنند.»

ممکن است اشتباه باشد که ماسک را به پنهان کردن عمدی حقیقت در اینجا متهم کنیم. بیست و سه دقیقه پس از توییت اولیه، او اضافه کرد: «نکته مهم: Optimus هنوز نمی‌تواند این کار را به صورت مستقل انجام دهد، اما مطمئناً می‌تواند این کار را کاملاً مستقل و در یک محیط دلخواه انجام دهد (نیاز به جدول ثابت با جعبه ندارد. فقط یک پیراهن)

همانطور که مارک تواین به قول معروف، "دروغ می تواند نیمه راه را در سراسر جهان بپیماید در حالی که حقیقت هنوز کفش های خود را می پوشد." یک اصل مشابه را می توان برای ویدیوی آنلاین اعمال کرد. البته توییت اولیه دقیقاً دروغ نیست، اما مطمئناً می توان آن را به عنوان حذفی طبقه بندی کرد. پنهان کردن تصحیحات خود در صفحه A12، کار روزنامه قدیمی است. افراد بسیار بیشتری در معرض خطای اولیه قرار خواهند گرفت.

باز هم، من اینجا نیستم تا به شما بگویم که آیا حذف اولیه عمدی بوده است یا نه (اگر می خواهید از مزایای شک در اینجا استفاده کنید، می توانید مطلقاً توییت بعدی را به عنوان یک توضیح واقعی از زمینه ناقص ببینید). در این مثال خاص، من گمان می‌کنم که بیشتر نظرات در مورد این موضوع مستقیماً با احساسات شخصی فرد در مورد نویسنده آن ارتباط دارد.

مثال بعدی پورتر «یادگیری تقویتی تک وظیفه ای» است. در اینجا می‌توانید به تحلیل عمیق‌تر یادگیری تقویتی بپردازید، اما برای اختصار در مقاله‌ای نه چندان کوتاه، اجازه دهید بگوییم که این روشی است برای آموزش روبات‌ها برای انجام وظایف با آزمون و خطای تکراری در دنیای واقعی.

پورتر می نویسد: «دری را باز کنید، بلوک را روی هم بچینید، لنگ را بچرخانید. "یادگیری این کارها چشمگیر است و چشمگیر به نظر می رسند و چشمگیر هستند. اما یک مهندس خوب RL می تواند این کار را در چند ماه انجام دهد. یک قدم سخت‌تر این است که آن را در برابر تغییرات ظریف مختلف مقاوم کنید. اما تعمیم به چندین کار مشابه بسیار سخت است. برای اینکه بتوانید تشخیص دهید که آیا می تواند تعمیم دهد، به دنبال چندین کار آموزش دیده باشید.

مانند تلهوپ، هیچ مشکلی در یادگیری تقویتی وجود ندارد. اینها هر دو ابزار ارزشمندی برای آموزش و کار با روبات ها هستند. فقط باید آنها را تا حد امکان به وضوح افشا کنید.

نکته نهایی پورتر نظارت بر محیط و حذفیات احتمالی است. او به ویدئوی تازه‌ای که در آن زمان از انسان‌نمای فیگور قهوه درست می‌کند، استناد می‌کند. او می نویسد: «سیال، تک برش، استحکام در حالت های خرابی را نشان می دهد. "هنوز فقط یک کار است، پس ادعای لحظه ChatGPT رباتیک در اینجا شواهدی ندارد. کیفیت تولید عالیه اما متوجه خواهید شد که ربات چیزی سنگین تر از یک فنجان Keurig بلند نمی کند. برداشتن لیوان ها انجام شده است، اما آنها این را نشان نمی دهند. شاید ربات آن قدرت را نداشته باشد؟

وقتی امروز با پورتر در مورد پیچیدگی‌های پست صحبت کردم، او بار دیگر سریع اشاره کرد که این مشاهدات از فناوری واقعاً چشمگیر کم نمی‌کند. با این حال، مسئله این است که مغز ما تمایل به پر کردن شکاف ها را دارد. ما ربات‌ها را انسان‌سازی یا انسانی می‌کنیم و فرض می‌کنیم که آن‌ها روش ما را یاد می‌گیرند، در حالی که در واقعیت، تماشای یک ربات که یک در را باز می‌کند، مطلقاً تضمین نمی‌کند که می‌تواند در دیگری را باز کند - یا حتی همان در را تحت نور متفاوت. تلویزیون‌ها و فیلم‌ها همچنین انتظارات غیرواقعی از آنچه روبات‌ها می‌توانند - و نمی‌توانند - در سال 2024 انجام دهند، به ما داده‌اند.

آخرین نکته ای که به این پست وارد نشد سرعت است. این فناوری ممکن است گاهی به طرز دردناکی کند باشد، پس سرعت بخشیدن به کارها امری عادی است. در بیشتر موارد، دانشگاه ها و سایر مراکز تحقیقاتی با توجه به این موضوع از طریق پوشش متنی کار خوبی انجام می دهند. این راهشه. اطلاعات مربوطه را به گونه ای روی صفحه اضافه کنید که برای یک اینفلوئنسر تشنه کلیک به سختی بتوان آن را بیرون آورد. در واقع، این پدیده به این صورت است که 1X نام خود را گرفته است.

ویدئوی اخیر این شرکت که استفاده از شبکه های عصبی را به نمایش می گذارد، توجه را به این واقعیت جلب می کند. این شرکت توضیح می‌دهد: «این ویدیو فاقد عملیات از راه دور، بدون گرافیک رایانه‌ای، بدون برش، بدون افزایش سرعت ویدیو، بدون پخش مسیری اسکریپت شده است. "همه از طریق شبکه های عصبی کنترل می شود." نتیجه یک ویدیوی سه دقیقه‌ای است که در مقایسه با دیگر نمایش‌های انسان‌نما، تقریباً به طرز دردناکی کند است.

مانند ویدیوهای blooper، من این - و هر شکلی از شفافیت را تحسین می کنم. برای ربات‌هایی که واقعاً آهسته حرکت می‌کنند، سرعت بخشیدن به کارها هیچ اشکالی ندارد، تا زمانی که به سه قانون واردات پایبند باشید:

فاش کردن

مانند ترانه‌سرا، شرکت‌ها باید بپذیرند که وقتی ویدیو متعلق به دنیا باشد، نمی‌توانید کنترل کنید که چه اتفاقی برای یک ویدیو می‌افتد. اما از خود بپرسید: آیا من هر کاری که در حد توانم بود انجام دادم تا از گسترش جعل احتمالی جلوگیری کنم؟

این احتمالاً بیش از حد امیدوار است که چنین ویدیوهایی با همان حقیقتی که در قوانین تبلیغاتی حاکم بر تبلیغات تلویزیونی حاکم است کنترل شود. با این حال، من دوست دارم گروهی از روباتیک‌ها را ببینم که نیروهای خود را برای استاندارد کردن نحوه کارکرد چنین افشاگری‌ها – و باید – بپیوندند.

خبرکاو