اولین برداشت ها از ChatGPT o1: یک هوش مصنوعی که برای فکر کردن به آن طراحی شده است
OpenAI مدلهای جدید o1 خود را روز پنجشنبه منتشر کرد و به کاربران ChatGPT اولین فرصت را داد تا مدلهای هوش مصنوعی را امتحان کنند که قبل از پاسخ دادن، مکث میکنند تا «فکر کنند». تبلیغات زیادی روی این مدلها ایجاد شده است که با اسم رمز «توت فرنگی» در OpenAI هستند. اما آیا توت فرنگی به تبلیغات تبلیغاتی پاسخ می دهد؟
به نوعی
در مقایسه با GPT-4o، مدل های o1 یک قدم به جلو و دو قدم به عقب احساس می کنند. ChatGPT o1 در استدلال و پاسخ دادن به سؤالات پیچیده عالی است، اما استفاده از این مدل تقریباً چهار برابر گرانتر از GPT-4o است. آخرین مدل OpenAI فاقد ابزار، قابلیتهای چندوجهی و سرعتی است که GPT-4o را بسیار چشمگیر کرده است. در واقع، OpenAI حتی اعتراف میکند که «GPT-4o هنوز بهترین گزینه برای اکثر درخواستها است» در صفحه راهنمای خود، و در جاهای دیگر اشاره میکند که GPT o1 در کارهای سادهتر مشکل دارد.
راوید شوارتز زیو، استاد دانشگاه نیویورک که بر روی مدلهای هوش مصنوعی مطالعه میکند، او میگوید : «این قابلتوجه است، اما من فکر میکنم این بهبود چندان چشمگیر نیست. "در مشکلات خاص بهتر است، اما شما این پیشرفت کلی را ندارید."
به همه این دلایل، مهم است که از GPT o1 فقط برای سؤالاتی استفاده کنید که واقعاً برای کمک به آنها طراحی شده است: سؤالات بزرگ. برای روشن بودن، اکثر مردم امروزه از هوش مصنوعی مولد برای پاسخ به این نوع سوالات استفاده نمی کنند، عمدتاً به این دلیل که مدل های هوش مصنوعی امروزی در آن خیلی خوب نیستند. با این حال، o1 یک گام آزمایشی در این جهت است.
فکر کردن از طریق ایده های بزرگ
ChatGPT o1 منحصر به فرد است زیرا قبل از پاسخ دادن "فکر می کند"، مشکلات بزرگ را به مراحل کوچک تقسیم می کند و تلاش می کند تشخیص دهد که چه زمانی یکی از آن مراحل را درست یا غلط انجام می دهد. این «استدلال چند مرحلهای» کاملاً جدید نیست (محققان سالها آن را پیشنهاد کردهاند و You.com از آن برای پرسشهای پیچیده استفاده میکند)، اما تا همین اواخر عملی نبوده است.
کیان کتان فروش، مدیر عامل و استاد دانشگاه استنفورد، که کلاسهای یادگیری ماشینی را تدریس میکند، در مصاحبهای گفت: «هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید یک الگوریتم یادگیری تقویتی همراه با برخی از تکنیکهای مدل زبانی که OpenAI دارد آموزش دهید، میتوانید از نظر فنی تفکر گام به گام ایجاد کنید و به مدل هوش مصنوعی اجازه دهید از ایدههای بزرگی که میخواهید روی آنها کار کنید به عقب برود. ”
ChatGPT o1 نیز منحصر به فرد گران است. در اکثر مدلها، شما برای توکنهای ورودی و توکنهای خروجی هزینه میکنید. با این حال، ChatGPT o1 یک فرآیند مخفی را اضافه می کند (مراحل کوچکی که مدل مشکلات بزرگ را در آنها شکست می دهد)، که مقدار زیادی از محاسبات را اضافه می کند که هرگز به طور کامل نمی بینید. OpenAI برخی از جزئیات این فرآیند را برای حفظ مزیت رقابتی خود پنهان می کند. با این اوصاف، شما همچنان برای این موارد به شکل «نشانههای استدلال» هزینه دریافت میکنید. این امر بیشتر بر این نکته تأکید میکند که چرا باید در استفاده از ChatGPT o1 مراقب باشید، پس اگر بپرسید پایتخت نوادا کجاست، هزینه زیادی از شما دریافت نمیشود.
ایده یک مدل هوش مصنوعی که به شما کمک می کند «از ایده های بزرگ به عقب برگردید» قدرتمند است. در عمل، مدل در آن بسیار خوب است.
در یک مثال، از پیشنمایش ChatGPT o1 خواستم تا به خانوادهام در برنامهریزی روز شکرگزاری کمک کند، وظیفهای که میتواند از منطق و استدلال کمی بیطرفانه بهره ببرد. به طور خاص، من کمک میخواستم بفهمم آیا دو فر برای پختن شام شکرگزاری برای ۱۱ نفر کافی است یا خیر و میخواستم درباره اینکه آیا باید برای دسترسی به فر سوم، یک Airbnb اجاره کنیم یا خیر صحبت کنم.
پس از 12 ثانیه "تفکر"، ChatGPT برای من یک پاسخ 750+ کلمه ای نوشت و در نهایت به من بيان کرد که دو اجاق گاز باید با یک استراتژی دقیق کافی باشد و به خانواده ام اجازه می دهد در هزینه ها صرفه جویی کنند و زمان بیشتری را با هم بگذرانند. اما در هر مرحله فکرش را برای من شکست و توضیح داد که چگونه همه این عوامل خارجی از جمله هزینه ها، زمان خانواده و مدیریت فر را در نظر گرفته است.
ChatGPT o1 به من بيان کرد که چگونه فضای فر را در خانه ای که میزبان رویداد است، اولویت بندی کنم، که هوشمندانه بود. به طور عجیبی، پیشنهاد کرد که یک اجاق گاز قابل حمل برای روز اجاره کنم. با این اوصاف، این مدل بسیار بهتر از GPT-4o عمل کرد، که به سؤالات بعدی در مورد اینکه دقیقاً چه ظروفی میآورم نیاز داشت، و سپس به من توصیههایی داد که به نظرم مفیدتر نبود.
پرسیدن در مورد شام شکرگزاری ممکن است احمقانه به نظر برسد، اما می توانید ببینید که چگونه این ابزار برای از بین بردن وظایف پیچیده مفید است.
من همچنین از ChatGPT o1 خواستم تا به من کمک کند تا یک روز شلوغ در محل کار خود را برنامه ریزی کنم، جایی که باید بین فرودگاه، جلسات متعدد حضوری در مکان های مختلف و دفترم سفر کنم. این به من یک طرح بسیار دقیق داد، اما شاید کمی زیاد بود. گاهی اوقات، تمام مراحل اضافه شده می تواند کمی طاقت فرسا باشد.
برای یک سوال سادهتر، ChatGPT o1 خیلی کار میکند – نمیداند چه زمانی باید از فکر کردن دست بردارد. من پرسیدم که کجا میتوانید درختان سرو را در آمریکا پیدا کنید، و پاسخی بیش از 800 کلمه ارائه داد، که همه گونههای درخت سرو در این کشور، از جمله نام علمی آنها را توضیح داد. حتی در مقطعی به دلایلی مجبور شد با سیاست های OpenAI مشورت کند. GPT-4o در پاسخ به این سوال کار بسیار بهتری انجام داد و حدود سه جمله را به من تحویل داد و توضیح داد که می توانید درختان را در سراسر کشور پیدا کنید.
تعدیل انتظارات
از برخی جهات، توت فرنگی هرگز قرار نبود به تبلیغات تبلیغاتی ادامه دهد. گزارشهای مربوط به مدلهای استدلال OpenAI به نوامبر 2023 برمیگردد، درست در زمانی که همه به دنبال پاسخی در مورد دلیل برکناری سام آلتمن توسط هیئت مدیره OpenAI بودند. این امر باعث ایجاد شایعات در دنیای هوش مصنوعی شد و برخی را وادار کرد تا حدس بزنند که Strawberry نوعی AGI است، نسخه روشنگرانه هوش مصنوعی که OpenAI در نهایت آرزوی ایجاد آن را دارد.
آلتمن تأیید کرد که o1 AGI نیست تا شک و تردیدی را برطرف کند، نه اینکه پس از استفاده از آن گیج شوید. مدیرعامل همچنین انتظارات پیرامون این راهاندازی را کاهش داد و در توییتی نوشت: «O1 هنوز معیوب است، هنوز محدود است، و همچنان در اولین استفاده نسبت به زمانی که زمان بیشتری را با آن میگذرانید، تأثیرگذارتر به نظر میرسد.»
بقیه دنیای هوش مصنوعی با یک راه اندازی کمتر هیجان انگیز از آنچه انتظار می رفت کنار می آیند.
روهان پاندی، مهندس محقق با استارتاپ هوش مصنوعی ReWorkd، که اسکراپرهای وب را با مدلهای OpenAI میسازد، گفت: «هیجانانگیز از کنترل OpenAI خارج شد.
او امیدوار است که توانایی استدلال o1 به اندازه کافی خوب باشد تا بتواند مجموعه ای از مشکلات پیچیده را که در آن GPT-4 کوتاه است، حل کند. به احتمال زیاد بیشتر افراد در صنعت ChatGPT o1 را به این شکل می بینند، اما نه کاملاً به عنوان گامی انقلابی به جلو که GPT-4 برای صنعت نشان می دهد.
"همه منتظر یک تغییر تابع مرحله برای قابلیت ها هستند، و مشخص نیست که این نشان دهنده آن باشد. مایک کانور، مدیر عامل Brightwave که قبلاً مدل هوش مصنوعی Databricks، Dolly را ساخته بود، در مصاحبه ای گفت: من فکر می کنم این کار به همین سادگی است.
اینجا چه ارزشی دارد؟
اصول اساسی مورد استفاده برای ایجاد o1 به سالها قبل برمی گردد. اندی هریسون، کارمند سابق گوگل و مدیر عامل شرکت سرمایه گذاری S32، اشاره می کند که گوگل در سال 2016 از تکنیک های مشابهی برای ایجاد AlphaGo استفاده کرد، اولین سیستم هوش مصنوعی برای شکست قهرمان جهانی بازی رومیزی Go. AlphaGo با بازی کردن در برابر خودش بارها تمرین کرد و اساساً خودآموز بود تا زمانی که به توانایی های مافوق بشری رسید.
او خاطرنشان می کند که این موضوع یک بحث قدیمی را در دنیای هوش مصنوعی مطرح می کند.
«کمپ وان فکر میکند که میتوانید گردشهای کاری را از طریق این فرآیند عاملی خودکار کنید. کمپ دو فکر میکند که اگر هوش و استدلال تعمیمیافته داشتید، نیازی به گردش کار ندارید و مانند یک انسان، هوش مصنوعی فقط قضاوت میکند.» هریسون در مصاحبهای گفت.
هریسون او میگوید او در کمپ یک است و کمپ دوم مستلزم آن است که برای تصمیمگیری درست به هوش مصنوعی اعتماد کنید. او فکر نمی کند ما هنوز آنجا نیستیم.
با این حال، دیگران O1 را کمتر تصمیم گیرنده و بیشتر ابزاری برای زیر سوال بردن تفکر شما در مورد تصمیمات بزرگ می دانند.
کتان فروش، مدیر عامل Workera، مثالی را شرح داد که در آن قصد داشت با یک دانشمند داده مصاحبه کند تا در شرکت خود کار کند. او به ChatGPT o1 می گوید که فقط 30 دقیقه فرصت دارد و می خواهد تعداد مشخصی از مهارت ها را ارزیابی کند. او می تواند با مدل هوش مصنوعی کار کند تا بفهمد آیا به درستی به این موضوع فکر می کند یا خیر، و ChatGPT o1 محدودیت های زمانی و غیره را درک خواهد کرد.
سوال این است که آیا این ابزار مفید ارزش قیمت بالای آن را دارد یا خیر. همانطور که مدلهای هوش مصنوعی همچنان ارزانتر میشوند، o1 یکی از اولین مدلهای هوش مصنوعی پس از مدتهاست که شاهد گرانتر شدن آن بودهایم.
ارسال نظر