اکثر سایتهایی که ادعا میکنند متنهای نوشته شده با هوش مصنوعی را دریافت میکنند، به طرز شگفتانگیزی شکست میخورند

با افزایش شور و شوق در مورد هوش مصنوعی مولد، منتقدان از سازندگان این فناوری خواسته اند تا اقداماتی را برای کاهش اثرات بالقوه مضر آن انجام دهند. به طور خاص، به ویژه هوش مصنوعی تولید متن توجه زیادی را به خود جلب کرده است - و دلیل خوبی هم دارد. دانشآموزان میتوانند از آن برای سرقت ادبی، مزارع محتوا برای ارسال هرزنامه و بازیگران بد برای انتشار اطلاعات نادرست از آن استفاده کنند.
OpenAI چندین هفته پیش تحت فشار قرار گرفت و یک ابزار طبقه بندی را منتشر کرد که تلاش می کند بین متن نوشته شده توسط انسان و متن مصنوعی تمایز قائل شود. اما به خصوص دقیق نیست. OpenAI تخمین می زند که 74 درصد از متن های تولید شده توسط هوش مصنوعی را از دست می دهد.
در غیاب روشی قابل اعتماد برای شناسایی متنی که از هوش مصنوعی نشات می گیرد، صنعت کلبه خدمات آشکارساز شکل گرفته است. ChatZero که توسط یک دانشجوی دانشگاه پرینستون توسعه داده شده است، ادعا می کند که از معیارهایی از جمله "گیجی" برای تعیین اینکه آیا متن ممکن است با هوش مصنوعی نوشته شده باشد استفاده می کند. آشکارساز سرقت ادبی Turnitin آشکارساز متن هوش مصنوعی خود را توسعه داده است. فراتر از اینها، جستجوی گوگل حداقل 12 اپلیکیشن دیگر را به دست میدهد که ادعا میکنند میتوانند گندم تولید شده توسط انسان را از کاه تولید شده توسط هوش مصنوعی جدا کنند تا این استعاره را شکنجه دهند.
اما آیا این ابزارها واقعا دقیق هستند؟ مخاطرات بالا هستند. در یک محیط دانشگاهی، می توان سناریویی را تصور کرد که در آن تشخیص از دست رفته به معنای تفاوت بین نمره قبولی و رد شدن است. طبق یک نظرسنجی، تقریباً نیمی از دانشآموزان میگویند که از ChatGPT برای یک آزمون یا آزمون خانگی استفاده کردهاند، در حالی که بیش از نیمی از آنها اذعان دارند که از آن برای نوشتن مقاله استفاده کردهاند.
برای اینکه بفهمیم آیا ابزارهای تشخیص متن با هوش مصنوعی امروزی قابل استفاده هستند یا خیر، ما از یک سیستم ChatGPT مانند به نام Claude استفاده کردیم که توسط استارتاپ هوش مصنوعی Anthropic توسعه یافته است تا هشت نمونه از نوشتار در طیفی از سبک های مختلف ایجاد کنیم. ما به طور خاص کلود را تولید کردیم:
مدخل دایره المعارفی برای Mesoamerica
یک ایمیل بازاریابی برای پولیش کفش
مقاله دانشگاهی در مورد سقوط روم
مقاله ای درباره انتخابات ریاست جمهوری 2020 آمریکا
نامه پوششی برای یک موقعیت حقوقی
رزومه یک مهندس نرم افزار
طرح کلی مقاله ای در مورد شایستگی های کنترل اسلحه
اگرچه مسلماً دقیقترین رویکرد نیست، اما میخواستیم آن را ساده نگه داریم – هدف سنجش عملکرد آشکارسازهای متن هوش مصنوعی بر روی متنی بود که از یک سیستم هوش مصنوعی منشا میگیرد (کلود). ما چندین آشکارساز محبوبتر را آزمایش کردیم، یعنی طبقهبندی کننده OpenAI، AI Writing Check، GPTZero، Copyleaks، GPTRadar، CatchGPT و Originality.ai.
مدخل دایره المعارف
مدخل دایره المعارف کلود شبیه چیزی است که از دایره المعارف بریتانیکا خارج شده است، با جزئیات غنی درباره ظهور، سقوط و تأثیر ماندگار تمدن های باستانی آمریکای مرکزی. ایده ها به اندازه کافی از یک پاراگراف به پاراگراف دیگر جریان می یابند، البته با یک (یا دو) غیر متوالی، و سبک نوشتن با آنچه ممکن است از یک نشریه دانشگاهی انتظار داشته باشید، همسو است:
Mesoamerica منطقه ای است که جنوب مکزیک و آمریکای مرکزی را در بر می گیرد. این مکان خانه جوامع پیش از کلمبیایی بود که ویژگی های مشترک فرهنگی داشتند. اولین جوامع پیچیده در میان آمریکا حدود 3000 سال پیش پدید آمدند.
منطقه فرهنگی میانآمریکایی تحت سلطه کشت ذرت و ظهور تمدنهای پیچیده بود. تمدنهای میانآمریکایی معابد هرمی پلکانی نمادین و سایر معماریهای تاریخی را ساختند. بسیاری از این تمدن ها دارای سنت های اساطیری و مذهبی غنی و همچنین سیستم های تقویمی و ریاضیات پیچیده بودند.
تمدنهای اصلی میانآمریکایی شامل اولمک، تئوتیهواکان، مایا، زاپوتک، میکستک، هوآستک، ایالت تاراسکان و آزتک بود که فاتح اسپانیایی هرنان کورتس در اوایل قرن شانزدهم با آنها مواجه شد. این تمدن های پیش از کلمبیا به خاطر شاهکارهای معماری و همچنین پیشرفت در ریاضیات، نجوم و تقویم شناخته شده اند. آنها همچنین به دلیل توسعه شبکه های مبادله بازار پیچیده و مسیرهای تجاری که سواحل اقیانوس آرام و اقیانوس اطلس را به هم متصل می کنند، شناخته شده اند.
پس از فتح امپراتوری آزتک ها، اسپانیایی ها مکزیکو سیتی را بر روی ویرانه های پایتخت آزتک، تنوچتیتلان، ساختند. زبان آزتک ها، ناهواتل، امروزه پرکاربردترین زبان بومی مکزیک است. آپشن های فرهنگی میانآمریکایی مانند کشت ذرت، ساختمانهایی با اهرام پلکانی، و مجسمههای یادبود، در دوره پس از فتح ادامه داشته و هنوز در فرهنگ معاصر مکزیک وجود دارد.
به این دلایل، ما پیشبینی کردیم که متن به آشکارسازها دردسر ایجاد میکند - و اینطور هم شد. از بین آزمایششدهها، تنها دو مورد، GPTZero و Originality.ai، متن را بهدرستی بهعنوان تولیدشده توسط هوش مصنوعی طبقهبندی کردند. بقیه کوتاه آمدند. طبقهبندیکننده OpenAI در ابتدا برای رسیدن به پاسخ به اندازه کافی مطمئن نبود، در حالی که Originality.ai به متن تنها 4 درصد احتمال میداد که توسط هوش مصنوعی نوشته شده باشد. بهترین ظاهر نیست

CatchGPT توسط متن تولید شده توسط هوش مصنوعی فریب خورد.
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به درستی طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به اشتباه طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
ایمیل بازاریابی
کپی کلود در شبکه های اجتماعی ترکیبی طنز آمیز از جزئیات واقعی و دور از ذهن است، اما هیچ نکته آشکاری مبنی بر اینکه متن توسط هوش مصنوعی تولید شده است وجود ندارد. این شامل قیمت و دعوت به عمل است، حتی - چقدر تمیز! به کپیرایترهای تبلیغات هشدار داده میشود:
موضوع: درخششی که ماندگار باشد
آیا کفش های شما کسل کننده و فرسوده به نظر می رسند؟ با لاک کفش Super Shine، می توانید کفش های خود را براق و درخشش جدید بازگردانید و از آنها در برابر آسیب و سایش محافظت کنید.
سوپر شاین از با کیفیت ترین واکس ها و رنگ ها ساخته شده است و در طیف وسیعی از رنگ های خنثی و براق برای مطابقت با هر نوع کفش یا چرمی موجود است. پولیش ما به گونه ای منحصر به فرد برای تمیز کردن، جلا دادن و محافظت از کفش های شما با یک کاربرد واحد ساخته شده است. روغن های حالت دهنده به چرم نفوذ می کنند تا آن را از داخل تغذیه کنند، در حالی که رنگدانه ها خراش ها و خراش ها را می پوشانند و محافظ موم محافظ درخشندگی را برای دفع آب و سایر عناصر می پوشاند.
درخشندگی کامل هرگز آسانتر نبوده است - فقط کثیفیها را با یک پارچه مرطوب پاک کنید، Super Shine را با یک برس نرم اعمال کنید، و براقکنندهای درخشان کنید. جلای ما خشک می شود و به سختی می رسد، پس شما اثری روی دست ها یا لباس های خود باقی نمی گذارید. و از آنجایی که مقدار کمی به شما کمک می کند، یک قلع تا 100 جفت کفش را جلا می دهد.
دیگر هرگز به کفش های بی براق بسنده نکنید. برای درخششی که نیاز به تحسین دارد، Super Shine را انتخاب کنید — با قیمت 9.99 دلار در خرده فروش محلی شما موجود است.

نمایش ضعیفی از Originality.ai
این قطعه به طرز باورنکردنی تمام آشکارسازها را تحت تأثیر قرار داد. اما انصافاً، طول آن از مدخل دایره المعارف ما کوتاهتر بود. و آشکارسازها با نمونههای طولانیتر متن، که در آن الگوها واضحتر هستند، بهتر عمل میکنند.
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به اشتباه طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به اشتباه طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
انشا دانشگاه
کلود به دلیل محدودیتهای فنی نمیتوانست برای ما یک مقاله کالج طولانی بنویسد، اما انگار برای جبران آن، هوش مصنوعی تا آنجا که میتوانست جزئیات را در چند پاراگراف کوتاه جمعآوری کرد. نمونه دارای عناصری از یک مقاله معمولی در کلاس است، مطمئناً، از جمله بیانیه پایان نامه، نتیجه گیری (اگر نه به طور خاص دقیق) و ارجاعات پشتیبان به رویدادهای تاریخی:
امپراتوری قدرتمند روم: چه چیزی منجر به سقوط آن شد؟
امپراتوری روم یکی از بزرگترین و طولانی ترین امپراتوری های تاریخ بود. با این حال، در قرن پنجم میلادی، امپراتوری روم وارد دوره افول و سقوط شده بود. چندین دلیل عمده برای سقوط روم وجود داشت: بی ثباتی سیاسی و فساد، تهاجمات بربرها، زوال اقتصادی، و اتکای بیش از حد به بردگان و غنائم جنگی.
از نظر سیاسی، اواخر امپراتوری روم مملو از جنگ های داخلی، کودتا و مدعیان رقیب تاج و تخت بود. این جنگ دائمی قدرت، امپراتوری را از منابع خالی کرد و مقابله با تهدیدات دیگر را دشوار کرد. امپراتورها از گارد پراتورین برای به دست گرفتن قدرت استفاده می کردند، اما پس از آن ترور شدند و امپراطوران جدید برخاستند و این چرخه را ادامه دادند.
با تضعیف امپراتوری، قبایل بربر مهاجم فرصتی را دیدند. در سال 410 پس از میلاد، ویزیگوت ها خود رم را غارت کردند که ضربه تکان دهنده ای به اعتبار امپراتوری بود. بعدها، قبایل دیگری به امپراتوری حمله کردند و قلمروهایی را به دست آوردند و گاهی در ازای ارائه سربازان به ارتش روم، زمینی به آنها داده شد. این قبایل امپراتوری را تضعیف کردند، اما آداب و رسوم و فرهنگ های جدیدی را نیز معرفی کردند.
از نظر اقتصادی، رم سیستمی داشت که مبتنی بر تسخیر و غنائم بود، نه تولید. هزینه نگهداری یک امپراتوری بزرگ، لژیونهای سربازان و نمایشها و سرگرمیهای بزرگ بسیار بالا بود. هنگامی که توسعه کاهش یافت و فتوحات جدید ثروت کمتری به همراه آورد، سیستم اقتصادی ناپایدار دچار تزلزل شد. در همان زمان، بردگان بیشتر کار را انجام می دادند و انگیزه کمی برای بهبود فناوری کشاورزی یا شیوه های تجاری وجود داشت.
در نتیجه، امپراتوری روم به دلایل بسیاری از جمله بی ثباتی سیاسی، تهاجمات بربرها، افول اقتصادی و اتکای بیش از حد به برده داری سقوط کرد. در نهایت، نمی تواند اثرات ترکیبی این فشارهای عظیم داخلی و خارجی را تحمل کند. در حالی که امپراتوری روم در نهایت سقوط کرد، میراث آن در قوانین، فرهنگ، زبانها و موارد دیگر ما زنده است - یادآور عظمت پایدار آن.
طبیعی بودن متن کافی بود تا بار دیگر اکثر طبقه بندی کننده ها را شکست دهد، البته کمتر از نسخه بازاریابی. این نوید بدی برای مربیانی است که امیدوارند به این ابزارها تکیه کنند. بر خلاف تشخیص سرقت ادبی، تشخیص متن تولید شده توسط هوش مصنوعی کار بسیار ظریف تری است.

یک برد برای CatchGPT.
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به درستی طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به درستی طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
طرح کلی انشا
اکثر بچه های کلاس اول می توانند یک انشا را تشریح کنند. هوش مصنوعی هم همینطور است - کلود بدون اینکه عرق کند، طرح کلی مقالهای موافق و مخالف در مورد محاسن کنترل اسلحه را بیرون آورد. به کمک هر پاراگراف برچسب زد (مثلاً «پاراگراف بدن»، «تحلیل و بحث»)، با حفظ لحن بیعلاقهای درباره موضوع تفرقهانگیز:
I) مقدمه: موضوع کنترل اسلحه را معرفی کنید و توجه داشته باشید که در حالی که بسیاری از مردم استدلال می کنند که افراد باید حق حمل سلاح داشته باشند، دیگران معتقدند که قانون کنترل اسلحه می تواند به کاهش خشونت با اسلحه کمک کند.
II) پاراگراف 1 بدنه: استدلال طرفدار کنترل اسلحه: مدافعان استدلال می کنند که دسترسی آسان به سلاح گرم منجر به قتل، خودکشی و سایر مرگ های مرتبط با اسلحه می شود. آنها اشاره می کنند که ایالت هایی که قوانین محدودکننده اسلحه دارند، مرگ و میر کمتری در ارتباط با اسلحه دارند. اقدامات سختگیرانهتر مانند تحلیل پیشینه، دورههای انتظار، و محدودیتهای سلاحهای تهاجمی میتواند با دور نگه داشتن اسلحه از دست مجرمان، تروریستها و سایر افراد خطرناک به نجات جان انسانها کمک کند.
III) پاراگراف 2 بدنه: استدلال ضد کنترل اسلحه: مخالفان مخالفت می کنند که مردم حق دفاع از خود دارند و افراد "خوب" باید بتوانند برای محافظت در برابر افراد "بد" سلاح گرم داشته باشند. آنها معتقدند که مالکیت اسلحه یک آزادی مهم است و شهروندان مسئول و قانونمند باید بتوانند سلاح گرم داشته باشند. آنها استدلال می کنند که قانون کنترل اسلحه مجرمان را که همیشه راه هایی برای دسترسی به سلاح گرم پیدا می کنند، منصرف نمی کند. قوانین سختگیرانهتر فقط آزادیهای مردم عادی را محدود میکند و آنها را کمتر امن میکند.
IV) تجزیه و تحلیل و بحث: در مورد دیدگاه های هر دو طرف بحث کنید و شایستگی ها و مسائل را با هر استدلال تجزیه و تحلیل کنید. به عنوان مثال، آیا محدودیت های اسلحه خشونت با سلاح را کاهش می دهد یا فقط آزادی ها را محدود می کند؟ آیا محدودیت ها شهروندان خوب را خلع سلاح می کند و آنها را در معرض خطر قرار می دهد یا عمدتاً از افراد غیرمسئول یا مجرمان جلوگیری می کند؟ آیا برخی از اقدامات مانند تحلیل پیشینه می تواند به تعادل برسد؟ پیچیدگی های مربوط به مسائل و میزان خشونت با اسلحه را در مناطق مختلف با سطوح مختلف محدودیت توضیح دهید.
V) نتیجه گیری: مقاله را با بیان مجدد تحلیل و نتیجه گیری کلی خود در مورد شایستگی قانون کنترل اسلحه به پایان برسانید. به ماهیت چندوجهی مسائل توجه کنید و برای راهی به جلو که به طور بالقوه می تواند خشونت اسلحه را با رعایت حقوق کاهش دهد، استدلال کنید.
طرح کلی ممکن است من را فریب دهد، اما آشکارسازها کار آسان تری داشتند. سه - طبقه بندی کننده OpenAI، GPTZero و CatchGPT - مورد توجه قرار گرفتند.
طبقه بندی کننده OpenAI: به درستی طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به درستی طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به درستی طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
مقاله خبری
مانند نمونههای قبلی، هیچ چیز کاملاً مصنوعی در مورد مقاله خبری که با استفاده از کلود تولید کردیم وجود ندارد. به خوبی خوانده می شود، ساختاری کم و بیش به سبک هرم معکوس. و حاوی خطاهای واقعی واقعی یا تناقضات منطقی نیست:
بایدن ترامپ را در انتخابات 2020 آمریکا شکست داد و به کارزار تفرقه افکنی پایان داد
معاون رئیس جمهور سابق جو بایدن رئیس جمهور ترامپ را در انتخاباتی شکست داد که تعداد رای دهندگان بی سابقه ای را به خود اختصاص داد و به عنوان یک همه پرسی در مورد دوره پرتلاطم آقای ترامپ ظاهر شد.
پیروزی آقای بایدن به منزله انکار آقای ترامپ توسط میلیون ها رای دهنده پس از چهار سال عمیقاً آشفته بود که به بحث های داغ درباره ارزش ها و آینده کشور دامن زد. آقای بایدن در کمپین برنامههایی برای گسترش مراقبتهای بهداشتی، رسیدگی به نابرابری اقتصادی و مبارزه با تغییرات آبوهوایی، عهد کرد که «روح ملت را بازگرداند» و آمریکاییها را به یک هدف مشترک فرا بخواند.
آقای بایدن در یک بیانیه کوتاه صبح شنبه بيان کرد که از اعتمادی که مردم آمریکا به او کرده اند، «افتخار و متواضع» است. او از ویلمینگتون دل گفت: «نبرد تمام شده است، اما کمپین برای احیای روح ملت تازه آغاز شده است. وقت آن است که آمریکایی ها متحد شوند.
آقای ترامپ هیچ نشانه ای از تسلیم نشان نداد و بدون مدرک ادعا کرد که در انتخابات «تقلب» شده است و پیشتازی زودهنگام او در برخی ایالت ها در شب انتخابات نشان می دهد که او برنده واقعی بوده است. در انتخاباتی که مقامات انتخابات ایالتی و کارشناسان خارجی گفتند که در میانه یک بیماری همه گیر مرگبار بدون مشکل پیش رفت، هیچ بی نظمی عمده ای گزارش نشده است.
این نتیجه منجر به رد درخواستهای تفرقهانگیز آقای ترامپ برای نارضایتیهای نژادی و پاسخهای سختگیرانه به ویروس شد، ویروسی که جان بیش از ۲۳۲۰۰۰ نفر را در ایالات متحده گرفته و میلیونها نفر را بیکار کرده است.
پس جای تعجب نیست که آشکارسازها با مشکل مواجه شدند. به استثنای GPTZero، هیچ یک نتوانست مقاله را به درستی طبقه بندی کند. Originality.ai تا آنجا پیش رفت که به آن شانس 0% برای تولید هوش مصنوعی داد. یقه های بزرگ
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به درستی طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به اشتباه طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
جلد نامه
نامه پوششی که ما با کلود تهیه کردیم، تمام ویژگی های یک مکاتبات حرفه ای ساده و بی معنی را دارد. این مهارتهای یک کاندیدای شغلی پار حقوقی خیالی را برجسته میکند، نام یک شرکت حقوقی را اختراع میکند (تا حدی عجیب) و به ابزارهای کشف قانونی مانند Westlaw و LexisNexis اشاره میکند:
مدیر محترم امور استخدامی،
من می نویسم تا علاقه شدید خود را به نقش حقوقی در شرکت شما بیان کنم. من معتقدم که تجربه و تحصیلاتم در زمینه حقوقی، من را کاندیدای عالی برای این موقعیت کرده است.
در طول دو سال گذشته، من به عنوان وکیل حقوقی در موسسه حقوقی اسمیت و جونز کار کردهام، جایی که تجربه زیادی در حمایت از وکلا در تمام جنبههای پروندههای دعاوی مدنی کسب کردهام. من به طور مداوم هزاران صفحه از اسناد حقوقی، از جمله رونوشت ها، سوگندنامه ها، و مواد کشف را سازماندهی و نگهداری کرده ام. من همچنین سیستم مدیریت فایل شرکت را ساده کرده ام و در نتیجه صرفه جویی قابل توجهی در زمان کرده ام. علاوه بر این، من مکاتباتی با موکلان، وکیل مخالف و اشخاص ثالث تهیه کرده ام. کمک در آزمایشات؛ و پروژه های تحقیقاتی حقوقی را برای حمایت از درخواست های پیش از محاکمه و مذاکرات حل و فصل تکمیل کرد.
قبل از ایفای نقش به عنوان وکیل حقوقی، مدرک کاردانی در مطالعات حقوقی را از [نام دانشگاه] دریافت کردم. تجارب دوره آموزشی و کارآموزی من پایه ای قوی در زمینه های کلیدی مانند تحقیق و نگارش حقوقی و همچنین دانش نرم افزارها و پایگاه های داده مربوطه از جمله Westlaw و LexisNexis فراهم کرد. من مهارت ها و دانش خود را از طریق توسعه حرفه ای مداوم به روز نگه داشته ام.
خارج از تجربه کاری و تحصیلی، من فردی کوشا و جزئیات گرا هستم و دارای مهارت های سازمانی و ارتباطی عالی هستم. من در محیطی سریع پیشرفت می کنم و در ایجاد تعادل و اولویت بندی وظایف پیچیده و حساس به زمان برای رسیدن به ضرب الاجل های سخت ماهر هستم. من از فرصتی برای کمک به موفقیت مشتریان و موارد شرکت شما سپاسگزارم.
با تشکر از شما برای توجه شما. من مشتاقانه منتظر صحبت بیشتر با شما در مورد این فرصت هستم.
خالصانه،
[اسم شما]
دیگر اخبار
مزایای آب و هوای کشتن اجاق گازها آن چیزی نیست که شما فکر می کنید، اما فواید آن برای سلامتی است
این نامه طبقهبندی کننده OpenAI را تحت تأثیر قرار داد، که نمیتوانست با اطمینان بگوید که توسط هوش مصنوعی است یا توسط انسان. GPTZero و CatchGPT موفق شدند متن تولید شده توسط هوش مصنوعی را دقیقاً تشخیص دهند، اما بقیه آشکارسازها نتوانستند به همان اندازه دست یابند.
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به درستی طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به درستی طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
از سرگیری
جفت کردن نامه جلد جعلی با یک رزومه جعلی مناسب به نظر می رسید. ما به کلود گفتیم که یکی برای یک مهندس نرم افزار بنویسد و آن را ارائه کرد - بیشتر. کاندیدای خیالی ما ترکیبی التقاطی از مهارت های برنامه نویسی دارد، اما هیچ کدام به طور خاص غیرقابل قبول نیستند:
• جان دو
• مهندس نرم افزار 3 سال سابقه کار
• [email protected] • 123-456-7890
• مهارت های فنی: جاوا، جاوا اسکریپت، C++، SQL، MySQL، Git، روش شناسی چابک، طراحی نرم افزار، الگوریتم ها، ساختارهای داده
• تجربه حرفه ای:
› ACME Corp، مهندس نرم افزار، 2018-اکنون
› روی اجزای اصلی محصول شاخص شرکت، یک پلتفرم تجزیه و تحلیل کلان داده مبتنی بر SaaS کار کرده است.
› طراحی و توسعه ماژول انتقال داده با قابلیت هدایت حجم عظیمی از جریان داده ها. از جاوا و MySQL استفاده کرد.
› با اجرای الگوریتم های پیشرفته اعتبارسنجی و تصحیح داده ها، خطاهای داده های بالادستی را تا 42 درصد کاهش داد.
› شرکت XYZ Tech، کارآموز مهندس نرم افزار، تابستان ۱۳۹۶
› مولفه های Back-end را برای شرکت های تجارت الکترونیک با استفاده از جاوا اسکریپت و Node.js توسعه داده است.
› نمونه سازی و مقیاس بندی پایگاه داده های اصلی و API ها برای مدیریت رشد 5 برابری نشان داده شده است.
• تحصیلات:
› لیسانس علوم کامپیوتر، دانشگاه فناوری بزرگ، 2017
› دوره ها شامل الگوریتم ها، سیستم عامل ها، یادگیری ماشینی، معماری نرم افزار و تئوری محاسبات بود.
› 3.8 معدل
• مهارت ها: تحلیلی، ارتباطی، حل مسئله، جزئیات گرا
• علایق: دویدن، مطالعه، و پیاده روی
ظاهراً آشکارسازها موافق هستند. رزومه جعلی حتی GPTZero را که تا این لحظه قابل اعتمادترین از این دسته بود، تحت تأثیر قرار داد.

GPTZero نمی تواند همه آنها را برنده شود.
طبقه بندی کننده OpenAI: به اشتباه طبقه بندی شده است
تحلیل نوشتن هوش مصنوعی: به اشتباه طبقه بندی شده است
GPTZero: به اشتباه طبقه بندی شده است
کپی لیکس: به اشتباه طبقه بندی شده است
GPTRAadar: به اشتباه طبقه بندی شده است
CatchGPT: به درستی طبقه بندی شده است
Originality.ai: به اشتباه طبقه بندی شده است
مشکل با طبقه بندی کننده ها
بعد از این همه آزمایش، چه نتیجه ای می توانیم بگیریم؟ به طور کلی، آشکارسازهای متنی هوش مصنوعی کار ضعیفی در تشخیص انجام می دهند. GPTZero تنها اجراکننده ثابتی بود که متن های تولید شده با هوش مصنوعی را به درستی پنج از هفت بار طبقه بندی کرد. در مورد بقیه… نه چندان. CatchGPT از نظر دقت با چهار طبقهبندی از هفت طبقهبندی صحیح در رتبه دوم قرار گرفت، در حالی که طبقهبندی کننده OpenAI با یک طبقهبندی از هفت رتبه سوم را به دست آورد.
پس چرا آشکارسازهای متنی هوش مصنوعی اینقدر غیرقابل اعتماد هستند؟
آشکارسازها اساساً مدلهای زبان هوش مصنوعی هستند که بر روی نمونههای بسیار زیادی از متن در دسترس عموم از وب آموزش دیدهاند و برای پیشبینی اینکه چقدر احتمال دارد که یک قطعه متن توسط هوش مصنوعی تولید شده است، دقیق تنظیم شوند. در طول آموزش، آشکارسازها متن را با متنی مشابه (اما نه دقیقاً مشابه) نوشته شده توسط انسان از وبسایتها و منابع دیگر مقایسه میکنند تا سعی کنند الگوهایی را بیاموزند که منشأ متن را نشان میدهند.
مشکل اینجاست که کیفیت متن تولید شده با هوش مصنوعی به طور مداوم در حال بهبود است و آشکارسازها احتمالاً بر روی نمونه های زیادی از نسل های قدیمی تر آموزش دیده اند. مدلهای طبقهبندیکننده مطمئناً در طول زمان دقیقتر میشوند، مگر اینکه آنها بهصورت تقریباً مستمر بازآموزی شوند.
البته، با تغییر برخی کلمات یا جملات در متن تولید شده توسط هوش مصنوعی، می توان به راحتی از هر یک از طبقه بندی کننده ها فرار کرد. برای دانشجویان مصمم و کلاهبرداران، احتمالاً به یک بازی موش و گربه تبدیل خواهد شد. همانطور که هوش مصنوعی تولید متن بهبود می یابد، آشکارسازها نیز بهبود می یابند.
در حالی که طبقهبندیکنندهها ممکن است در شرایط خاصی کمک کنند، اما هرگز تنها مدرک قابل اعتمادی برای تصمیمگیری در مورد اینکه آیا متن توسط هوش مصنوعی تولید شده است، نخواهند بود. همه اینها برای این است که بگوییم هیچ گلوله نقره ای برای حل مشکلات متن ایجاد شده توسط هوش مصنوعی وجود ندارد. به احتمال زیاد، هرگز وجود نخواهد داشت.
ارسال نظر