OpenAI به طور تصادفی شواهد احتمالی را در دعوای حق چاپ نیویورک تایمز حذف کرد (به روز شده)
وکلای نیویورک تایمز و دیلی نیوز، که از OpenAI به اتهام خراش دادن آثارشان برای آموزش مدلهای هوش مصنوعی بدون اجازه شکایت میکنند، میگویند مهندسان OpenAI بهطور تصادفی دادههای مرتبط با پرونده را حذف کردند.
اوایل پاییز امسال، OpenAI با ارائه دو ماشین مجازی موافقت کرد تا مشاور The Times و Daily News بتوانند محتوای دارای حق چاپ خود را در مجموعه های آموزشی هوش مصنوعی خود جستجو کنند. (ماشینهای مجازی رایانههای مبتنی بر نرمافزار هستند که در سیستم عامل رایانه دیگری وجود دارند و اغلب برای آزمایش، پشتیبانگیری از دادهها و اجرای برنامهها استفاده میشوند.) در نامهای، وکلای ناشران میگویند که آنها و کارشناسانی که استخدام کردهاند هزینه کردهاند. بیش از 150 ساعت از 1 نوامبر جستجو در داده های آموزشی OpenAI.
اما در 14 نوامبر، مهندسان OpenAI تمام داده های جستجوی ناشران را که در یکی از ماشین های مجازی ذخیره شده بود، پاک کردند، طبق نامه فوق الذکر که در اواخر روز چهارشنبه در دادگاه منطقه ای ایالات متحده برای ناحیه جنوبی نیویورک بایگانی شد.
OpenAI سعی کرد داده ها را بازیابی کند – و بیشتر موفقیت آمیز بود. با این حال، از آنجایی که ساختار پوشه و نام فایلها «بهطور غیرقابل برگشتی» از بین رفته بودند، دادههای بازیابی شده «نمیتوان برای تعیین محل استفاده از مقالههای کپیشده شاکیان اخبار برای ساخت مدلهای [OpenAI]» استفاده کرد.
مشاور روزنامه تایمز و دیلی نیوز نوشت: «شاکیان اخبار مجبور شدهاند تا با استفاده از ساعتهای کاری قابل توجه و زمان پردازش رایانه، کار خود را از ابتدا بازسازی کنند. شاکیان خبر همین دیروز متوجه شدند که داده های بازیابی شده غیرقابل استفاده است و یک هفته تمام کار کارشناسان و وکلای آن باید دوباره انجام شود، به همین دلیل این نامه تکمیلی امروز ثبت می شود.
وکیل شاکیان تصریح می کند که آنها هیچ دلیلی برای این باور ندارند که حذف عمدی بوده است. اما آنها می گویند که این حادثه تاکید می کند که OpenAI "در بهترین موقعیت برای جستجوی مجموعه داده های خود" برای محتوای بالقوه نقض کننده با استفاده از ابزارهای خود است.
یک سخنگوی OpenAI از ارائه بیانیه خودداری کرد.
اما اواخر روز جمعه، 22 نوامبر، مشاور OpenAI پاسخی به نامه ارسال شده توسط وکلای روزنامه تایمز و دیلی نیوز در روز چهارشنبه ارائه کرد. در پاسخ خود، وکلای OpenAI به صراحت حذف OpenAI هر گونه شواهدی را رد کردند و در عوض پیشنهاد کردند که شاکیان در پیکربندی اشتباه سیستم که منجر به یک مشکل فنی شده است مقصر هستند.
مشاور OpenAI نوشت: "شاکیان درخواست تغییر پیکربندی به یکی از چندین ماشینی را دادند که OpenAI برای جستجوی مجموعه داده های آموزشی ارائه کرده است. " با این حال، اجرای تغییر درخواستی شاکیان منجر به حذف ساختار پوشه و برخی از نامهای فایل در یک هارد دیسک شد – درایوی که قرار بود به عنوان یک کش موقت استفاده شود… در هر صورت، هیچ دلیلی وجود ندارد که فکر کنیم هیچ فایلی وجود ندارد. در واقع گم شدند.»
دیگر اخبار
Lucid Motors شروع به دریافت سفارش برای SUV وجودی Gravity خود می کند
در این مورد و موارد دیگر، OpenAI معتقد است که مدلهای آموزشی با استفاده از دادههای در دسترس عموم – از جمله مقالههایی از Times و Daily News – استفاده منصفانه است. به عبارت دیگر، در ایجاد مدلهایی مانند GPT-4o، که از میلیاردها نمونه کتاب الکترونیکی، مقاله و موارد دیگر برای تولید متنی با صدای انسانی «یاد میگیرند»، OpenAI معتقد است که نیازی به صدور مجوز یا هزینه دیگری برای آن نیست. مثالها – حتی اگر از آن مدلها درآمد کسب کند.
بیشتر بخوانید
Philips Hue ژانویه شما را با چراغهای فضای باز و داخلی جدید روشن میکند
همانطور که گفته شد، OpenAI با تعداد فزاینده ای از ناشران جدید، از جمله Associated Press، مالک Business Insider، Axel Springer، Financial Times، شرکت مادر People Dotdash Meredith، و News Corp قراردادهای مجوز منعقد کرده است. OpenAI از اجرای این شرایط خودداری کرده است. معاملات عمومی، اما یکی از شرکای محتوا، Dotdash، گزارش شده است که حداقل 16 میلیون دلار در سال پرداخت می شود.
OpenAI نه تایید و نه رد کرده است که سیستمهای هوش مصنوعی خود را بر روی هر اثر خاص دارای حق چاپ بدون مجوز آموزش داده است.
به روز رسانی: پاسخ OpenAI به اتهامات اضافه شد.
ارسال نظر