کد خبر : 208929
تاریخ انتشار : یکشنبه 20 آوریل 2025 - 21:09

Kling 2.0 Review: State of the Art AI کیفیت فیلم

Kling 2.0 Review: State of the Art AI کیفیت فیلم

[ad_1] Kling 2.0 ، یک به روزرسانی بزرگ به تولید کننده پیشرفته ویدیویی AI AI که توسط شرکت فناوری چینی Kuaishou منتشر شد ، هفته گذشته به یک سیل واکنش های فک پایین از سازندگان ، که به سرعت در میان صدها دلار آزمایش توانایی های خود را به کار گرفتند ، به بازار رسید.

[ad_1]

Kling 2.0 ، یک به روزرسانی بزرگ به تولید کننده پیشرفته ویدیویی AI AI که توسط شرکت فناوری چینی Kuaishou منتشر شد ، هفته گذشته به یک سیل واکنش های فک پایین از سازندگان ، که به سرعت در میان صدها دلار آزمایش توانایی های خود را به کار گرفتند ، به بازار رسید.

“کیفیت فیلم AI فقط یک شب 10x'd. من بی حرف هستم” ، توییت فیلمساز AI PJ Ace ، که ادعا می کرد قبلاً 1250 دلار برای اعتبار در مورد محدودیت های ابزار هزینه کرده است. “من هرگز ندیده ام این مایع را حرکت دهم یا این را دقیق ترغیب کند.” این پست بیش از 757،000 بازدید به دست آورد و وزوزهای اطراف این نسخه را برجسته کرد.

نسخه جدید یک جهش قابل توجه از Kling 1.6 را نشان می دهد ، و درک سریع ، حرکت شخصیت روانتر ، و زیبایی شناسی بصری را بهبود می بخشد که کاربران توصیف می کنند که به عنوان “فیلمبرداری ، تولید نشده”. مهمتر از همه ، Kling 2.0 می تواند فیلم ها را تا 2 دقیقه تولید کند و رقبایی مانند Sora Openai را در گرد و غبار قرار می دهد.

YouTuber Tim Simmon ، که متخصص در بررسی مدل های AI تولیدی است ، در بررسی خود گفت: “به طور کلی ، کلینگ برتری در تابلوی رهبر را حفظ می کند.” او معتقد است که این برنده واضح در نسل تصویر به ویدئو است ، با این رقابت نزدیکتر است که به یک نسل مستقیم متن به ویدئو می رسد.

این نسخه جدید به یک بازار نسل ویدیویی هوش مصنوعی به طور فزاینده ای وارد می شود. رقبا شامل باند فرودگاه است که برای خروجی های وفاداری بالا شناخته شده است-که اخیراً مدل V4 خود را منتشر کرده است ، با تمرکز بر نتایج سینمایی-و VEO2 Google ، با قابلیت های قوی متن به ویدیو و نتایج زیبا و دلپذیر.

تاکنون ، این مدل هنوز در صفحه اصلی ژنراتور ویدیویی تجزیه و تحلیل مصنوعی-که تمام بهترین مدل های ویدیویی تولیدی را رتبه بندی می کند-هرچند که سلف آن است ، Kling 1.6 در حال حاضر رهبر تصویر به فیلم است و بر اساس تست های کور رتبه دوم را دارد.

Kling 2.0 دارای یک ویرایشگر چند عناصر است که به کاربران امکان می دهد محتوای ویدیویی را با استفاده از ورودی های متن یا تصویر اضافه ، مبادله یا حذف کنند.

این پلتفرم همچنین دو مؤلفه تخصصی را معرفی می کند: Kling 2.0 Master برای تولید ویدیو و Kolors 2.0 برای ایجاد تصویر-نباید با یک ژنراتور تصویر یک منبع هوش مصنوعی با منبع باز دیگر که تحت همان نام “Kolor” منتشر شد ، سردرگم شود.

تمرکز این ابزار بر کیفیت سینمایی ، آن را برای فیلمسازان ، بازاریابان و سازندگان محتوا جذاب می کند. این مدل از نظر منابع بسیار قدرتمند است و نسل ها ساعت ها در برنامه رایگان و حداکثر 16 دقیقه برای نزدیک به 5 ثانیه از فیلم در سیستم عامل های آنلاین می گذرانند.

قیمت گذاری از 29 دلار در هر ماه برای برنامه استاندارد شروع می شود ، که شامل حالت حرفه ای ، فیلم های 8 ثانیه ای و کمک هزینه 30 فیلم در روز است. یک طرح رایگان 6 نسل روزانه با محدودیت 4 ثانیه و علامت های آبی ارائه می دهد. برنامه حرفه ای ، با 89 دلار در ماه ، وضوح بالا ، کنترل حرکت پیشرفته و پردازش اولویت را ارائه می دهد.

آزمایش مدل

ما مدل جدید را در پنج دسته امتحان کردیم: دینامیسم ، تصویر ، متن به فیلم ، انسجام ساختاری و انسجام چند موضوع. این چیزی است که ما پیدا کردیم.

پویایی

همه ژنراتورهای ویدئویی صحنه های هنوز هم به خوبی انجام می دهند ، اما به طور معمول با حرکت سریع ، صحنه های پیچیده و تنظیم پویا مبارزه می کنند. این فیلم یا انیمیشن در زندگی واقعی آینه را آینه می کند-زیرا تلویزیون شما در طی تعقیب “تام و جری” یا یک صحنه جنگ بسته بندی شده عمل می کند ، و قاب های عجیب و غریب را در همه جا مشاهده خواهید کرد.

ما مدل را با تصویری ثابت از مردی که از طریق یک شهر پرواز می کرد آزمایش کردیم و از آن خواستیم که صحنه را تولید کند.

Kling 2.0 نسبت به تغییرات فوری جزئی بسیار حساس بود. اولین تلاش ما مورد استفاده قرار گرفت: “شات ردیابی پویا: مردی با سرعت بسیار بالایی در خیابان شلوغ سیتی پرواز می کند. دوربین از نزدیک پشت سر می رود و عجله ساختمانها و لرزیدن ترافیک را به خود جلب می کند و بعد از چرخش شدید ، احساس سرعت و هیجان را تقویت می کند.”

متأسفانه این سریع توهم یک نوع موضوعی را ایجاد کرد که به عقب در خیابان خالی شود. این به احتمال زیاد به دلیل انتخاب کلمات ما در سریع بود.

بنابراین ما فقط یک کلمه را حذف کردیم: “پشت”. این نتیجه را تغییر داد و یک فیلم بسیار بهتر را نشان می داد که موضوعی را که به جلو پرواز می کند ، رو به دوربین است.

کلینگ عناصر اصلی صحنه-جنبش دموکراتیک و پر سرعت-را ضبط کرد ، هرچند بدن سوژه هنگام تغییر جهت به طرز عجیبی شکل گرفت و برخی از عناصر فاقد ساختار یکنواخت بودند. مدل های دیگر مانند پویایی تجارت VEO2 Google برای واقع گرایی ، ایجاد صحنه های کندتر ، استاتیک تر اما منسجم تر.

تصویر

سریع: “تابه افقی 360 درجه: یک شهر شلوغ و پر پیچ و خم که در اطراف یک درخت عظیم ساخته شده است ، پر از خانه ها و پل ها. دوربین به آرامی از جلو به پشت درخت حرکت می کند ، کودکانی را که در حال بازی هستند ، اسیر می کند ، افرادی که مشغول فعالیت های روزانه هستند ، و اتومبیل های پرواز که روی شاخه ها فرود می آیند ، همه زیر یک گرم و گرم ، دعوت می کنند.”

این مدل با سبک های تخیلی مانند کمیک و تصاویر عالی است ، اما با جزئیات جزئی مبارزه می کند. این امر انسجام بر جزئیات را در اولویت قرار می دهد و به عناصر اصلی سریع با حرکت دوربین صاف و صحنه سیال احترام می گذارد.

ساختار شیء بدون آنکه در سایر ژنراتورها دیده شود ، جامد باقی می ماند ، اگرچه برخی از بچه ها (که می توانند جزئیات کوچک فراتر از ساختار اصلی کل ترکیب باشند – یک درخت و شلوغ در اطراف آن) انسجام را از دست می دهند ، و اتومبیل های پرواز گاهی اوقات ناپدید می شوند.

با این وجود ، این آزمایش بهترین نتیجه ای را که از هر ژنراتور ویدیویی دیده ایم به دست آورد.

متن به فیلم

سریع: “یک زن بلوند با لباس قرمز و یک مرد آسیایی در چت کت و شلوار مشکی در داخل یک استارباکس. شلیک متوسط.”

متن به فیلم چالش های منحصر به فردی را برای ژنراتورهای هوش مصنوعی ارائه می دهد. این مدل باید یک قاب اولیه (اساساً یک کار متن به تصویر) ایجاد کند و از آن به عنوان مرجع برای همه فریم های بعدی استفاده کند. در حالت ایده آل ، اگر می خواهید بهترین انسجام را بخواهید ، یک ژنراتور تخصصی تصویر برای آن قاب اول – و در حالت ایده آل برای آخرین قاب نیز می خواهید.

Kling 2.0 به خصوص در اینجا نمی درخشد – اما بد نیست. این صحنه دارای سبک خاص و هوایی است که برای بسیاری از ژنراتورهای تصویر رایج است ، اما بدن ساختار مناسب را حفظ می کند ، انگشتان دست به نظر می رسند ، و آثار باستانی قابل توجه وجود ندارد که صحنه را مختل کنند.

این یک پیشرفت نسبت به Kling 1.6 است ، اما آنچه برای این مدل طراحی شده است.

انسجام ساختاری

سریع: “نمای هوایی: شات از ساختار معماری پیچیده و انتزاعی در حال چرخش.”

در حالی که کلینگ ممکن است در صحنه های شلوغ با جزئیات کوچک مبارزه کند ، از حفظ انسجام و جزئیات در عکس های تک موضوع برتری دارد.

ما تصویری از یک قطعه پیچیده را به اشتراک گذاشتیم و از مدل خواستیم که آن را بچرخاند. Kling 2.0 این کار را تقریباً بی عیب و نقص انجام داد – نورپردازی ثابت ماند ، حرکت یکنواخت بود ، هیچ مصنوعاتی ظاهر نشد و ساختار یکپارچگی خود را حفظ کرد.

این قابلیت باعث می شود که برای مدل سازی سه بعدی به طور بالقوه ارزشمند باشد و پیش نمایش های شی و صحنه را از زوایای مختلف امکان پذیر می کند.

انسجام چند موضوع

سریع: “پنج توله سگ گرگ خاکستری که در اطراف یک جاده ماسه ای از راه دور ، که با چمن احاطه شده اند ، در حال تعقیب و تعقیب یکدیگر هستند.

این همچنان پاشنه آشیل از همه مدل های ویدیویی است که Kling 2.0 گنجانده شده است. از زمانی که Openai نشان داد که سورا نتواند بسته ای از حیوانات کودک را که با هم بازی می کنند ، تولید کند ، تمام ژنراتورهای ویدئویی با نتایج مختلط این چالش را انجام داده اند. هیچ مدلی به طور مداوم به نتایج کامل نمی رسد.

Kling 2.0 صحنه ای واضح و واقع بینانه ایجاد کرد ، اما گرگ ها در یکدیگر ادغام می شوند و بین قاب ها ظاهر می شوند و ناپدید می شوند. اگر تنها چیزی که مورد تجزیه و تحلیل قرار گرفته است انسجام است ، بین Kling 2.0 و Kling 1.6 تفاوت زیادی وجود ندارد.

یک پیشرفت قابل توجه: بی نظمی ها بیشتر در پس زمینه اتفاق می افتد ، و حیوانات پیش زمینه بیشتر اوقات انسجام بهتری دارند.

Kling 2.0 از طریق Kling AI ، Freepik ، Pollo AI و سایر ارائه دهندگان قابل دسترسی است.

به طور کلی باهوش خبرنامه

یک سفر هفتگی هوش مصنوعی که توسط Gen ، یک مدل AI تولیدی روایت شده است.



[ad_2]

منبع:decrypt

برچسب ها :

ناموجود
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0
  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.

مبل مینیمال

دانلود فيلم زبان اصلي

زيرنويس ناشنوايان ترجمه‌شده

خرید رپورتاژ آگهی دائمی افزایش فروش محصولات