رئیس هوش مصنوعی متا میگوید مدلهای جهانی برای «هوش مصنوعی در سطح انسانی» کلیدی هستند – اما ممکن است ۱۰ سال دیگر به پایان برسد.
آیا مدلهای هوش مصنوعی امروزی واقعاً مانند مغز انسان به یاد میآورند، فکر میکنند، برنامهریزی میکنند و استدلال میکنند؟ برخی از آزمایشگاههای هوش مصنوعی میخواهند باور کنید که هستند، اما به گفته یان لیکان، دانشمند ارشد هوش مصنوعی متا، پاسخ منفی است. او فکر میکند که ما میتوانیم در یک دهه یا بیشتر با دنبال کردن روش جدیدی به نام «مدل جهانی» به این هدف برسیم.
در اوایل سال جاری، OpenAI ویژگی جدیدی را منتشر کرد که آن را "حافظه" می نامد که به ChatGPT اجازه می دهد مکالمات شما را "به خاطر بسپارد". آخرین نسل مدلهای این استارتآپ، o1، کلمه «تفکر» را در حین تولید خروجی نمایش میدهد و OpenAI او میگوید که همین مدلها قادر به «استدلال پیچیده» هستند.
همه به نظر می رسد که ما به AGI بسیار نزدیک هستیم. با این حال، طی یک سخنرانی اخیر در انجمن هادسون، LeCun خوشبینهای هوش مصنوعی، مانند ایلان ماسک، بنیانگذار xAI و شین لگ، یکی از بنیانگذاران Google DeepMind، که نشان میدهند هوش مصنوعی در سطح انسانی تقریباً نزدیک است، تضعیف کرد.
ما به ماشین هایی نیاز داریم که دنیا را درک کنند. [ماشینهایی] که میتوانند چیزها را به خاطر بسپارند، شهود دارند، عقل سلیم دارند، چیزهایی که میتوانند در سطح انسانها استدلال و برنامهریزی کنند.» علیرغم آنچه ممکن است از برخی از مشتاقترین افراد شنیده باشید، سیستمهای هوش مصنوعی فعلی قادر به انجام هیچیک از این موارد نیستند.
LeCun او میگوید که مدلهای زبان بزرگ امروزی، مانند مدلهایی که ChatGPT و Meta AI را تقویت میکنند، از «هوش مصنوعی سطح انسانی» فاصله زیادی دارند. او بعداً بيان کرد که بشریت ممکن است «سالها تا دههها» از دستیابی به چنین چیزی فاصله داشته باشد. (البته این مانع از رئیس او، مارک زاکربرگ، نمی شود که از او بپرسد چه زمانی AGI اتفاق می افتد.)
دلیل این امر ساده است: آن LLM ها با پیش بینی نشانه بعدی (معمولاً چند حرف یا یک کلمه کوتاه) کار می کنند، و مدل های تصویر/ویدئوی امروزی پیکسل بعدی را پیش بینی می کنند. به عبارت دیگر، مدلهای زبان پیشبینیکنندههای یکبعدی هستند و مدلهای تصویر/فیلم هوش مصنوعی پیشبینیکنندههای دو بعدی هستند. این مدل ها در پیش بینی ابعاد مربوطه خود بسیار خوب شده اند، اما واقعاً دنیای سه بعدی را درک نمی کنند.
به همین دلیل، سیستمهای هوش مصنوعی مدرن نمیتوانند کارهای سادهای که بیشتر انسانها میتوانند انجام دهند. LeCun اشاره میکند که چگونه انسانها یاد میگیرند تا در سن 10 سالگی میز شام را تمیز کنند و در 17 سالگی ماشین را برانند - و هر دو را در عرض چند ساعت یاد میگیرند. اما حتی پیشرفتهترین سیستمهای هوش مصنوعی جهان که بر اساس هزاران یا میلیونها ساعت داده ساخته شدهاند، نمیتوانند به طور قابل اعتماد در دنیای فیزیکی کار کنند.
برای دستیابی به وظایف پیچیدهتر، LeCun پیشنهاد میکند که ما نیاز به ساخت مدلهای سه بعدی داریم که میتوانند دنیای اطراف شما را درک کنند و بر نوع جدیدی از معماری هوش مصنوعی متمرکز شوند: مدلهای جهانی.
او توضیح داد: «مدل جهانی مدل ذهنی شما از نحوه رفتار جهان است. "شما می توانید دنباله ای از اقداماتی را که ممکن است انجام دهید تصور کنید، و مدل دنیای شما به شما این امکان را می دهد تا پیش بینی کنید که دنباله اقدامات بر جهان چه خواهد بود."
"مدل جهانی" را در ذهن خود در نظر بگیرید. به عنوان مثال، تصور کنید به یک اتاق خواب نامرتب نگاه می کنید و می خواهید آن را تمیز کنید. میتوانید تصور کنید که برداشتن همه لباسها و کنار گذاشتن آنها چگونه کار خوبی میکند. نیازی نیست چندین روش را امتحان کنید، یا یاد بگیرید که چگونه ابتدا یک اتاق را تمیز کنید. مغز شما فضای سه بعدی را مشاهده می کند و یک برنامه عملی برای رسیدن به هدف خود در اولین تلاش ایجاد می کند. این برنامه اقدام، سس مخفی است که مدل های دنیای هوش مصنوعی وعده می دهند.
بخشی از مزیت در اینجا این است که مدل های جهانی می توانند به طور قابل توجهی داده های بیشتری نسبت به LLM ها دریافت کنند. این همچنین باعث میشود که آنها از نظر محاسباتی فشرده شوند، به همین دلیل است که ارائهدهندگان ابری برای مشارکت با شرکتهای هوش مصنوعی رقابت میکنند.
مدلهای جهانی ایده بزرگی هستند که چندین آزمایشگاه هوش مصنوعی در حال حاضر به دنبال آن هستند و این اصطلاح به سرعت تبدیل به کلید واژه بعدی برای جذب سرمایههای مخاطرهآمیز میشود. گروهی از محققان هوش مصنوعی بسیار مورد توجه، از جمله فی-فی لی و جاستین جانسون، به تازگی 230 میلیون دلار برای استارتاپ خود، World Labs، جمع آوری کرده اند. "مادرخوانده هوش مصنوعی" و تیم او همچنین متقاعد شده اند که مدل های جهانی سیستم های هوش مصنوعی بسیار هوشمندتری را باز می کنند. OpenAI همچنین ژنراتور ویدئویی Sora منتشر نشده خود را به عنوان یک مدل جهانی توصیف می کند، اما به جزئیات آن وارد نشده است.
LeCun ایده استفاده از مدلهای جهانی برای ایجاد هوش مصنوعی در سطح انسانی را در مقالهای در سال 2022 در مورد "هوش مصنوعی هدفمحور" بیان کرد، اگرچه او اشاره میکند که این مفهوم بیش از 60 سال قدمت دارد. به طور خلاصه، یک نمایش پایه از جهان (مثلاً ویدیوی یک اتاق کثیف) و حافظه به یک مدل جهانی وارد می شود. سپس، مدل جهان بر اساس آن اطلاعات، جهان را پیشبینی میکند. سپس اهداف مدل جهان را در نظر میگیرید، از جمله وضعیت تغییر یافتهای از جهان که میخواهید به آن برسید (مانند اتاق تمیز) و همچنین نردههای محافظ برای اطمینان از اینکه مدل برای رسیدن به یک هدف به انسانها آسیبی نمیرساند (نکشید). من در حال تمیز کردن اتاقم هستم، لطفا). سپس مدل جهانی دنباله ای از عمل برای دستیابی به این اهداف پیدا می کند.
به گفته LeCun، آزمایشگاه تحقیقاتی بلندمدت هوش مصنوعی متا، FAIR یا تحقیقات بنیادی هوش مصنوعی، به طور فعال در حال ساختن مدلهای هوش مصنوعی مبتنی بر هدف و جهانی است. FAIR قبلاً روی هوش مصنوعی برای محصولات آینده متا کار می کرد، اما LeCun می گوید که این آزمایشگاه در سال های اخیر صرفاً روی تحقیقات طولانی مدت هوش مصنوعی متمرکز شده است. LeCun می گوید که FAIR این روزها حتی از LLM استفاده نمی کند.
مدلهای جهانی ایده جالبی هستند، اما LeCun او میگوید که ما پیشرفت زیادی در تحقق این سیستمها نداشتهایم. مشکلات بسیار سختی وجود دارد که بتوانیم از جایی که امروز هستیم برسیم، و او می گوید که مطمئناً پیچیده تر از آن چیزی است که ما فکر می کنیم.
لکون گفت: «اگر نه یک دهه، سالها طول میکشد تا بتوانیم همه چیز را به اینجا برسانیم. مارک زاکربرگ مدام از من می پرسد که چقدر طول می کشد.
ارسال نظر