متن خبر

آمازون برای رقابت با بهترین های موجود در بازار، از مدل های ویدیویی و تصویری جدید شگفت انگیز هوش مصنوعی رونمایی می کند

آمازون برای رقابت با بهترین های موجود در بازار، از مدل های ویدیویی و تصویری جدید شگفت انگیز هوش مصنوعی رونمایی می کند

شناسهٔ خبر: 830694 -




مدل هوش مصنوعی تولید تصویر آمازون نوا
(اعتبار تصویر: آمازون)

آمازون از ابزارهای هوش مصنوعی جدید ایجاد تصویر و ویدئو رونمایی کرد

Amazon Nova Canvas و Nova Reel به دنبال کمک به فروشندگان تجارت الکترونیک هستند

هر دو مدل جدید نوا قرار است در سال 2025 عرضه شوند


آمازون در حالی که مبارزه خود را برای تبدیل شدن به یک وزنه سنگین هوش مصنوعی افزایش می دهد، مدل های جدید تولید تصویر و ویدئو را معرفی کرده است.

این شرکت در رویداد AWS re:Invent 2024 خود در لاس وگاس از Amazon Nova Canvas و Nova Reel رونمایی کرد و مدیر عامل آن اندی جاسی به عنوان بخشی از سری جدید مدل‌های هوش مصنوعی Nova رونمایی کرد.

هر دو مدل جدید در اواسط سال 2025 در دسترس خواهند بود و راه اندازی آن آمازون را به رقابت مستقیم با شرکت هایی مانند OpenAI و Grok در زمینه ایجاد تصویر و ویدیو می کشاند.

بوم و قرقره آمازون نوا

مدل‌های جدید در ابتدا فروشندگان و سایر کاربران را در پلتفرم تجارت الکترونیک آمازون هدف قرار می‌دهند و به آنها اجازه می‌دهد تا به سرعت و ارزان محتوای رسانه‌ای را برای غنی‌سازی صفحات خود ایجاد کنند.

آمازون در مورد پیشنهادات جدید اطلاعات زیادی را فاش نکرد، اما Nova Canvas به کاربران اجازه می‌دهد تصاویر را با استفاده از ورودی‌های متنی به زبان طبیعی ایجاد و ویرایش کنند، و Nova Reel می‌تواند ویدئویی با کیفیت استودیو ارائه دهد. با قابلیت هایی مانند کنترل حرکت دوربین، چرخش 360 درجه و زوم.

در یک پست وبلاگی که این خبر را اعلام کرد، این شرکت بيان کرد که مشتریان در پلتفرم تبلیغاتی آمازون خود با استفاده از مدل‌های جدید، پنج برابر بیشتر محصولات و دو برابر بیشتر تصاویر را در هر محصول تبلیغ شده تبلیغ می‌کنند و دامنه دسترسی خود را به خریداران در سراسر جهان افزایش می‌دهند.

به دنبال آینده، Jassy همچنین فاش کرد که آمازون در اوایل سال 2025 یک مدل از نسل گفتار به گفتار و به دنبال آن مدل «Any-to-Any» در اواسط سال 2025 راه اندازی خواهد کرد.

اولی قادر به تجزیه و تحلیل و درک ورودی گفتار جریانی به زبان طبیعی، با توانایی تفسیر نشانه های کلامی و غیرکلامی مانند لحن و آهنگ، برای پاسخ دادن به روشی طبیعی و انسانی خواهد بود.

مدل دوم، که جاسی آن را به عنوان یک مدل واقعی چند وجهی به چند وجهی توصیف کرد، می‌تواند متن، تصویر، صدا و ویدئو را قبل از خروجی در هر حالتی که لازم است دریافت کند.

شما هم ممکن است دوست داشته باشید

معاون سردبیر، TechRadar Pro

مایک مور معاون سردبیر TechRadar Pro است. او نزدیک به یک دهه به‌عنوان روزنامه‌نگار فناوری B2B و B2C کار کرده است، از جمله در یکی از روزنامه‌های ملی برجسته بریتانیا و عنوان Future ITProPortal، و زمانی که او آخرین روندهای سازمانی و محل کار را دنبال نمی‌کند، به احتمال زیاد می‌توان آن را پیدا کرد. تماشا کردن، دنبال کردن یا شرکت در نوعی ورزش.

خبرکاو

ارسال نظر




تبليغات ايهنا تبليغات ايهنا

تمامی حقوق مادی و معنوی این سایت متعلق به خبرکاو است و استفاده از مطالب با ذکر منبع بلامانع است