تبدیل عکس به ویدیو با Gemini؛ قابلیت تازه هوش مصنوعی گوگل

گوگل در ۲۰ تیر ۱۴۰۴ با معرفی قابلیتی تازه در ابزار هوش مصنوعی Gemini، امکان تبدیل عکس به ویدیو را فراهم کرد. کاربران می‌توانند تنها با یک تصویر و چند توضیح کوتاه، کلیپی ۸ ثانیه‌ای همراه با صدا تولید و آن را به‌سادگی ذخیره یا منتشر کنند.

این قابلیت که با مدل پیشرفته Veo 3 کار می‌کند، گامی نو در تولید سریع و خلاقانه محتوای ویدیویی با هوش مصنوعی به‌شمار می‌رود و تجربه‌ای جذاب را برای تولیدکنندگان محتوا و کاربران عمومی رقم می‌زند.

نحوه کار با قابلیت جدید

لپ‌تاپ Lenovo Yoga 9i Aura Edition باز شده روی میز با صفحه‌نمایش OLED روشن

انتخاب گزینه Videos: کافی‌ست در اپ Gemini یا نسخه وب، گزینه‌ی Videos را از منوی ابزارها انتخاب کنید.
آپلود تصویر: عکسی را که می‌خواهید تبدیل به ویدیو شود بارگذاری کنید.
توضیح صحنه و صدا: با چند کلمه صحنه را توصیف کنید و در صورت تمایل افکت صوتی یا دیالوگ دلخواه اضافه کنید.
دریافت ویدیو: تنها چند ثانیه پس از ارسال درخواست، یک ویدیوی ۸ ثانیه‌ای با کیفیت HD (رزولوشن ۷۲۰p) و صدای همگام دریافت می‌کنید که آماده دانلود یا اشتراک‌گذاری در شبکه‌های اجتماعی است.

همچنین کاربران می‌توانند پس از تولید ویدیو، با گزینه‌های لایک یا دیسلایک روی خروجی، بازخورد خود را ثبت کرده و به بهبود کیفیت نتایج در آینده کمک کنند.

چه کسانی و در چه کشورهایی می‌توانند استفاده کنند؟

دسترسی محدود به اشتراک Pro و Ultra: تنها کاربران Google AI Pro یا Ultra می‌توانند این قابلیت را فعال کنند.
نسخه اولیه در حدود ۱۵۰ کشور منتشر شده و به‌تدریج گسترش بیشتری خواهد یافت.

آمار و محبوبیت

جدول مقایسه بهترین مدل‌های هوش مصنوعی در تولید ویدیو از متن در سال ۲۰۲۵ با صدرنشینی Google Veo 3 — در جدول رقابتی Arena 2025، مدل Veo 3 گوگل با امتیاز ELO برابر با ۱۲۷۷ در صدر ابزارهای تولید ویدیو از متن قرار گرفته و بالاتر از رقبایی چون OpenAI Sora، MiniMax و Kling ظاهر شده است.

از زمان معرفی Veo 3 در اردیبهشت–خرداد ۱۴۰۴، کاربران Gemini و Flow بیش از ۴۰ میلیون کلیپ ساخته‌اند؛ و با افزودن قابلیت عکس به ویدیو، این رقم قطعاً بالاتر خواهد رفت.

امنیت و شفافیت

نمای نزدیک از واترمارک قابل مشاهده Veo روی یک ویدیوی تولید شده با هوش مصنوعی گوگل

واترمارک قابل مشاهده: هر ویدیوی تولیدشده با یک علامت تصویری کوچک با نام "Veo" روی تصویر، نشانه‌گذاری می‌شود تا مشخص باشد این ویدیو با هوش مصنوعی ساخته شده است.
واترمارک دیجیتال SynthID: این نشانگر نامرئی در هر فریم جاسازی شده تا منشأ AI آن قابل ردگیری باشد و از جعل جلوگیری کند.

مزایا و معایب قابلیت جدید VEO 3

مدل Veo 3 با ارائه قابلیت تصویر به ویدیو، مرزهای تولید محتوای هوش مصنوعی را جابه‌جا کرده است. اما همان‌طور که در هر فناوری نوظهور انتظار می‌رود، این قابلیت نیز نقاط قوت و کاستی‌هایی دارد که در ادامه آن‌ها را به‌طور خلاصه مرور می‌کنیم.

مزایای قابلیت جدید

سرعت بالا در تولید ویدیو تنها با یک تصویر
امکان افزودن افکت صوتی یا توضیحات شنیداری
کیفیت ۷۲۰p و صداگذاری حرفه‌ای در هر ویدیو
رابط کاربری ساده و مناسب برای همه کاربران

معایب قابلیت جدید

محدودیت زمانی برای طول ویدیو (فقط ۸ ثانیه)
نیاز به اشتراک Pro یا Ultra برای دسترسی به این قابلیت

قابلیت جدید Veo 3 در Gemini، راهی سریع، ساده و خلاقانه برای ساخت ویدیو از عکس ارائه می‌دهد. با وجود محدودیت زمانی و نیاز به اشتراک ویژه، این ابزار می‌تواند آینده‌ای روشن در تولید محتوای هوشمند رقم بزند.

ویدیوی رسمی معرفی قابلیت «تبدیل عکس به ویدیو» با مدل Veo 3 در ابزار هوش مصنوعی Gemini