در دنیای رو به رشد هوش مصنوعی، گوگل بار دیگر با بهروزرسانی مدل Veo 3.1 خود، مرزهای خلاقیت را جابهجا کرده است. این مدل جدید نه تنها در پایبندی به دستورات (prompt) بهبود یافته، بلکه قابلیت تبدیل تصاویر به ویدیوهای پویا را با کیفیت بالاتری ارائه میدهد. اگر به دنبال ابزارهای پیشرفته تولید ویدیو با AI هستید، این مقاله را بخوانید تا با جزئیات Veo 3.1 و ادغام آن با ویرایشگر Flow آشنا شوید. با Google I/O 2025، گوگل گامهای بلندی در جهت حرفهایسازی ابزارهای ویدیویی برداشته است.

بهبودهای کلیدی Veo 3.1: از تصاویر به ویدیوهای هوشمند
Veo 3.1 بر پایه مدل Veo 3 ساخته شده که در رویداد Google I/O 2025 معرفی شد. طبق اعلام گوگل، این بهروزرسانی بر پایبندی به پرامپت تمرکز دارد و فرآیند تبدیل تصاویر آپلودشده به ویدیو را سادهتر میکند. کاربران میتوانند تصاویر را به عنوان “مواد اولیه” (ingredients) در کنار متن پرامپت استفاده کنند تا ویدیوهایی دقیقتر و خلاقانهتر تولید شود.
یکی از ویژگیهای برجسته جدید، تولید همزمان صدا و ویدیو است. در مدل قبلی Veo 3، این قابلیت وجود نداشت و کاربران مجبور به ویرایش جداگانه بودند. حالا با Veo 3.1، میتوانید از یک تصویر استاتیک، ویدیویی کامل با صدا بسازید – ایدهآل برای تولیدکنندگان محتوا، فیلمسازان و طراحان گرافیک.
این مدل از طریق Gemini API در دسترس است و کاربران حرفهای میتوانند بلافاصله آن را آزمایش کنند. اگر به هوش مصنوعی گوگل علاقهمند هستید، Veo 3.1 ابزاری قدرتمند برای خلق محتوای ویدیویی است.
ادغام با Flow: کنترل دقیقتر بر ویدیوهای AI
ویرایشگر ویدیویی Flow گوگل، که از Veo 3 قدرت میگیرد، حالا با Veo 3.1 ارتقا یافته و ویژگیهای جدیدی دریافت کرده است. برجستهترین آن، Frame to Video است: کاربران میتوانند فریم اول و آخر را آپلود کنند و Flow به طور خودکار محتوای میانی را تولید کند. این ویژگی مشابه Adobe Firefly (که از Veo 3 استفاده میکند) است، اما Flow با تولید همزمان صدا، برتری دارد.
علاوه بر این، قابلیتهای صوتی جدید به ابزارهای تمدید کلیپها و درج اشیاء در فوتیج موجود نیز اضافه شده. تصور کنید که یک کلیپ ویدیویی را بدون نیاز به نرمافزارهای پیچیده، به راحتی گسترش دهید یا عناصر جدیدی به آن بیفزایید – همه با کمک AI.
گوگل با این بهروزرسانیها، تمرکز خود را از تولید محتوای ساده برای شبکههای اجتماعی (مانند اسپم) به ابزارهای حرفهای برای کاربران واقعی ویدیویی تغییر داده است. این رویکرد، Veo را به رقیبی جدی برای مدلهایی مانند OpenAI’s Sora 2 تبدیل میکند.
نمونههای Veo 3.1: کیفیت و چالشها
بر اساس نمونههای منتشرشده توسط گوگل، ویدیوهای تولیدشده با Veo 3.1 دارای کیفیتی “عجیب و غریب” هستند که بسته به پرامپت و موضوع، متفاوت است. اگرچه هنوز به realism مدل Sora 2 نرسیده، اما پیشرفتهای آن در پایبندی به جزئیات پرامپت، قابل توجه است. برای مثال، ویدیوهایی از طبیعت یا صحنههای شهری با تصاویر ورودی، حرکتی روان و طبیعیتر نشان میدهند.
با این حال، همچنان چالشهایی مانند عدم تطابق کامل با واقعیت وجود دارد. گوگل با تمرکز بر کاربردهای حرفهای، میخواهد این مدل را به ابزاری مفید برای صنعت فیلم و تبلیغات تبدیل کند.
زمان دسترسی و آینده Veo: گام بعدی در AI ویدیویی
Veo 3.1 از امروز از طریق Gemini API قابل دسترسی است و ویرایشگر Flow نیز بهروزرسانی شده. اگر توسعهدهنده یا تولیدکننده محتوا هستید، همین حالا میتوانید آن را امتحان کنید. آینده این مدل، با ادغامهای بیشتر در ابزارهای گوگل مانند YouTube یا Google Photos، هیجانانگیز به نظر میرسد.
در جمعبندی، گوگل Veo 3.1 نه تنها تولید ویدیو از تصاویر را بهبود بخشیده، بلکه با ویژگیهای صوتی و کنترلهای دقیق Flow، اکوسیستم AI گوگل را قدرتمندتر کرده است. اگر به ابزارهای هوش مصنوعی برای ویدیو علاقهمندید، این بهروزرسانی را از دست ندهید.
مزایا:
-
پایبندی بهتر به پرامپتها
-
تولید همزمان ویدیو و صدا
-
ویژگی Frame to Video در Flow
-
دسترسی آسان از طریق API
معایب:
-
کیفیت هنوز به realism رقبا نرسیده
-
وابستگی به پرامپتهای دقیق
آسان نیوز سایت خبری تحلیلی آسان نیوز