اولین برداشت ها از ChatGPT o1: یک هوش مصنوعی که برای فکر کردن به آن طراحی شده است

شناسهٔ خبر: 748867 - تاریخ: سپتامبر 13, 2024

OpenAI مدل‌های جدید o1 خود را روز پنجشنبه منتشر کرد و به کاربران ChatGPT اولین فرصت را داد تا مدل‌های هوش مصنوعی را امتحان کنند که قبل از پاسخ دادن، مکث می‌کنند تا «فکر کنند». تبلیغات زیادی روی این مدل‌ها ایجاد شده است که با اسم رمز «توت فرنگی» در OpenAI هستند. اما آیا توت فرنگی به تبلیغات تبلیغاتی پاسخ می دهد؟

به نوعی

در مقایسه با GPT-4o، مدل های o1 یک قدم به جلو و دو قدم به عقب احساس می کنند. ChatGPT o1 در استدلال و پاسخ دادن به سؤالات پیچیده عالی است، اما استفاده از این مدل تقریباً چهار برابر گران‌تر از GPT-4o است. آخرین مدل OpenAI فاقد ابزار، قابلیت‌های چندوجهی و سرعتی است که GPT-4o را بسیار چشمگیر کرده است. در واقع، OpenAI حتی اعتراف می‌کند که «GPT-4o هنوز بهترین گزینه برای اکثر درخواست‌ها است» در صفحه راهنمای خود، و در جاهای دیگر اشاره می‌کند که GPT o1 در کارهای ساده‌تر مشکل دارد.

راوید شوارتز زیو، استاد دانشگاه نیویورک که بر روی مدل‌های هوش مصنوعی مطالعه می‌کند، او میگوید : «این قابل‌توجه است، اما من فکر می‌کنم این بهبود چندان چشمگیر نیست. "در مشکلات خاص بهتر است، اما شما این پیشرفت کلی را ندارید."

به همه این دلایل، مهم است که از GPT o1 فقط برای سؤالاتی استفاده کنید که واقعاً برای کمک به آنها طراحی شده است: سؤالات بزرگ. برای روشن بودن، اکثر مردم امروزه از هوش مصنوعی مولد برای پاسخ به این نوع سوالات استفاده نمی کنند، عمدتاً به این دلیل که مدل های هوش مصنوعی امروزی در آن خیلی خوب نیستند. با این حال، o1 یک گام آزمایشی در این جهت است.

فکر کردن از طریق ایده های بزرگ

ChatGPT o1 منحصر به فرد است زیرا قبل از پاسخ دادن "فکر می کند"، مشکلات بزرگ را به مراحل کوچک تقسیم می کند و تلاش می کند تشخیص دهد که چه زمانی یکی از آن مراحل را درست یا غلط انجام می دهد. این «استدلال چند مرحله‌ای» کاملاً جدید نیست (محققان سال‌ها آن را پیشنهاد کرده‌اند و You.com از آن برای پرسش‌های پیچیده استفاده می‌کند)، اما تا همین اواخر عملی نبوده است.

کیان کتان فروش، مدیر عامل و استاد دانشگاه استنفورد، که کلاس‌های یادگیری ماشینی را تدریس می‌کند، در مصاحبه‌ای گفت: «هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید یک الگوریتم یادگیری تقویتی همراه با برخی از تکنیک‌های مدل زبانی که OpenAI دارد آموزش دهید، می‌توانید از نظر فنی تفکر گام به گام ایجاد کنید و به مدل هوش مصنوعی اجازه دهید از ایده‌های بزرگی که می‌خواهید روی آن‌ها کار کنید به عقب برود. ”

ChatGPT o1 نیز منحصر به فرد گران است. در اکثر مدل‌ها، شما برای توکن‌های ورودی و توکن‌های خروجی هزینه می‌کنید. با این حال، ChatGPT o1 یک فرآیند مخفی را اضافه می کند (مراحل کوچکی که مدل مشکلات بزرگ را در آنها شکست می دهد)، که مقدار زیادی از محاسبات را اضافه می کند که هرگز به طور کامل نمی بینید. OpenAI برخی از جزئیات این فرآیند را برای حفظ مزیت رقابتی خود پنهان می کند. با این اوصاف، شما همچنان برای این موارد به شکل «نشانه‌های استدلال» هزینه دریافت می‌کنید. این امر بیشتر بر این نکته تأکید می‌کند که چرا باید در استفاده از ChatGPT o1 مراقب باشید، پس اگر بپرسید پایتخت نوادا کجاست، هزینه زیادی از شما دریافت نمی‌شود.

ایده یک مدل هوش مصنوعی که به شما کمک می کند «از ایده های بزرگ به عقب برگردید» قدرتمند است. در عمل، مدل در آن بسیار خوب است.

بیشتر بخوانید

Raspberry Pi 5 اینجاست و خوشمزه تر از همیشه به نظر می رسد

در یک مثال، از پیش‌نمایش ChatGPT o1 خواستم تا به خانواده‌ام در برنامه‌ریزی روز شکرگزاری کمک کند، وظیفه‌ای که می‌تواند از منطق و استدلال کمی بی‌طرفانه بهره ببرد. به طور خاص، من کمک می‌خواستم بفهمم آیا دو فر برای پختن شام شکرگزاری برای ۱۱ نفر کافی است یا خیر و می‌خواستم درباره اینکه آیا باید برای دسترسی به فر سوم، یک Airbnb اجاره کنیم یا خیر صحبت کنم.

پس از 12 ثانیه "تفکر"، ChatGPT برای من یک پاسخ 750+ کلمه ای نوشت و در نهایت به من بيان کرد که دو اجاق گاز باید با یک استراتژی دقیق کافی باشد و به خانواده ام اجازه می دهد در هزینه ها صرفه جویی کنند و زمان بیشتری را با هم بگذرانند. اما در هر مرحله فکرش را برای من شکست و توضیح داد که چگونه همه این عوامل خارجی از جمله هزینه ها، زمان خانواده و مدیریت فر را در نظر گرفته است.

ChatGPT o1 به من بيان کرد که چگونه فضای فر را در خانه ای که میزبان رویداد است، اولویت بندی کنم، که هوشمندانه بود. به طور عجیبی، پیشنهاد کرد که یک اجاق گاز قابل حمل برای روز اجاره کنم. با این اوصاف، این مدل بسیار بهتر از GPT-4o عمل کرد، که به سؤالات بعدی در مورد اینکه دقیقاً چه ظروفی می‌آورم نیاز داشت، و سپس به من توصیه‌هایی داد که به نظرم مفیدتر نبود.

پرسیدن در مورد شام شکرگزاری ممکن است احمقانه به نظر برسد، اما می توانید ببینید که چگونه این ابزار برای از بین بردن وظایف پیچیده مفید است.

من همچنین از ChatGPT o1 خواستم تا به من کمک کند تا یک روز شلوغ در محل کار خود را برنامه ریزی کنم، جایی که باید بین فرودگاه، جلسات متعدد حضوری در مکان های مختلف و دفترم سفر کنم. این به من یک طرح بسیار دقیق داد، اما شاید کمی زیاد بود. گاهی اوقات، تمام مراحل اضافه شده می تواند کمی طاقت فرسا باشد.

برای یک سوال ساده‌تر، ChatGPT o1 خیلی کار می‌کند – نمی‌داند چه زمانی باید از فکر کردن دست بردارد. من پرسیدم که کجا می‌توانید درختان سرو را در آمریکا پیدا کنید، و پاسخی بیش از 800 کلمه ارائه داد، که همه گونه‌های درخت سرو در این کشور، از جمله نام علمی آنها را توضیح داد. حتی در مقطعی به دلایلی مجبور شد با سیاست های OpenAI مشورت کند. GPT-4o در پاسخ به این سوال کار بسیار بهتری انجام داد و حدود سه جمله را به من تحویل داد و توضیح داد که می توانید درختان را در سراسر کشور پیدا کنید.

تعدیل انتظارات

از برخی جهات، توت فرنگی هرگز قرار نبود به تبلیغات تبلیغاتی ادامه دهد. گزارش‌های مربوط به مدل‌های استدلال OpenAI به نوامبر 2023 برمی‌گردد، درست در زمانی که همه به دنبال پاسخی در مورد دلیل برکناری سام آلتمن توسط هیئت مدیره OpenAI بودند. این امر باعث ایجاد شایعات در دنیای هوش مصنوعی شد و برخی را وادار کرد تا حدس بزنند که Strawberry نوعی AGI است، نسخه روشنگرانه هوش مصنوعی که OpenAI در نهایت آرزوی ایجاد آن را دارد.

دیگر اخبار

هشدار درباره آینده اقتصاد ایران/ بحران گاز در راه است؟

آلتمن تأیید کرد که o1 AGI نیست تا شک و تردیدی را برطرف کند، نه اینکه پس از استفاده از آن گیج شوید. مدیرعامل همچنین انتظارات پیرامون این راه‌اندازی را کاهش داد و در توییتی نوشت: «O1 هنوز معیوب است، هنوز محدود است، و همچنان در اولین استفاده نسبت به زمانی که زمان بیشتری را با آن می‌گذرانید، تأثیرگذارتر به نظر می‌رسد.»

بقیه دنیای هوش مصنوعی با یک راه اندازی کمتر هیجان انگیز از آنچه انتظار می رفت کنار می آیند.

روهان پاندی، مهندس محقق با استارتاپ هوش مصنوعی ReWorkd، که اسکراپرهای وب را با مدل‌های OpenAI می‌سازد، گفت: «هیجان‌انگیز از کنترل OpenAI خارج شد.

او امیدوار است که توانایی استدلال o1 به اندازه کافی خوب باشد تا بتواند مجموعه ای از مشکلات پیچیده را که در آن GPT-4 کوتاه است، حل کند. به احتمال زیاد بیشتر افراد در صنعت ChatGPT o1 را به این شکل می بینند، اما نه کاملاً به عنوان گامی انقلابی به جلو که GPT-4 برای صنعت نشان می دهد.

"همه منتظر یک تغییر تابع مرحله برای قابلیت ها هستند، و مشخص نیست که این نشان دهنده آن باشد. مایک کانور، مدیر عامل Brightwave که قبلاً مدل هوش مصنوعی Databricks، Dolly را ساخته بود، در مصاحبه ای گفت: من فکر می کنم این کار به همین سادگی است.

اینجا چه ارزشی دارد؟

اصول اساسی مورد استفاده برای ایجاد o1 به سالها قبل برمی گردد. اندی هریسون، کارمند سابق گوگل و مدیر عامل شرکت سرمایه گذاری S32، اشاره می کند که گوگل در سال 2016 از تکنیک های مشابهی برای ایجاد AlphaGo استفاده کرد، اولین سیستم هوش مصنوعی برای شکست قهرمان جهانی بازی رومیزی Go. AlphaGo با بازی کردن در برابر خودش بارها تمرین کرد و اساساً خودآموز بود تا زمانی که به توانایی های مافوق بشری رسید.

او خاطرنشان می کند که این موضوع یک بحث قدیمی را در دنیای هوش مصنوعی مطرح می کند.

«کمپ وان فکر می‌کند که می‌توانید گردش‌های کاری را از طریق این فرآیند عاملی خودکار کنید. کمپ دو فکر می‌کند که اگر هوش و استدلال تعمیم‌یافته داشتید، نیازی به گردش کار ندارید و مانند یک انسان، هوش مصنوعی فقط قضاوت می‌کند.» هریسون در مصاحبه‌ای گفت.

هریسون او میگوید او در کمپ یک است و کمپ دوم مستلزم آن است که برای تصمیم‌گیری درست به هوش مصنوعی اعتماد کنید. او فکر نمی کند ما هنوز آنجا نیستیم.

با این حال، دیگران O1 را کمتر تصمیم گیرنده و بیشتر ابزاری برای زیر سوال بردن تفکر شما در مورد تصمیمات بزرگ می دانند.

کتان فروش، مدیر عامل Workera، مثالی را شرح داد که در آن قصد داشت با یک دانشمند داده مصاحبه کند تا در شرکت خود کار کند. او به ChatGPT o1 می گوید که فقط 30 دقیقه فرصت دارد و می خواهد تعداد مشخصی از مهارت ها را ارزیابی کند. او می تواند با مدل هوش مصنوعی کار کند تا بفهمد آیا به درستی به این موضوع فکر می کند یا خیر، و ChatGPT o1 محدودیت های زمانی و غیره را درک خواهد کرد.

سوال این است که آیا این ابزار مفید ارزش قیمت بالای آن را دارد یا خیر. همانطور که مدل‌های هوش مصنوعی همچنان ارزان‌تر می‌شوند، o1 یکی از اولین مدل‌های هوش مصنوعی پس از مدت‌هاست که شاهد گران‌تر شدن آن بوده‌ایم.

خبرکاو