سحر الفيديو بالذكاء الاصطناعي من جوجل جيميني: كيف يحوّل تحديث “نانو موزة” الصور إلى مقاطع سينمائية

Google Gemini’s AI Video Magic: How the “Nano Banana” Update Turns Photos into Cinematic Clips
  • ترقية صورة “Nano Banana” تعزز جودة الفيديوهات: أحدث تحديث من Google Nano Banana هو نموذج صور متطور جديد (Gemini 2.5 Flash Image) يعزز واقعية الصور وتناسقها [1]. يتيح هذا التحديث لـ Gemini الحفاظ على ملامح الشخص بدقة عبر التعديلات ودمج عدة صور، بل ويمكنه أيضًا استخدام هذه الصور المحسنة في توليد الفيديوهات [2] [3]. تمهد هذه الترقية الطريق لتحويلات عالية الجودة من صورة إلى فيديو في تطبيق Gemini.
  • تحويل الصور إلى فيديوهات مدتها 8 ثوانٍ مع صوت: يتيح تطبيق Gemini الآن للمستخدمين تحويل أي صورة ثابتة إلى مقطع فيديو مدته 8 ثوانٍ مع صوت (مؤثرات صوتية، ضوضاء خلفية، وحتى حوار) [4]. مدعومًا بنموذج الفيديو الذكي Veo 3 من Google DeepMind، تقوم هذه الميزة بتحريك صورتك بناءً على نص مكتوب، وتنتج فيديو قصيرًا مصحوبًا بالموسيقى أو الصوت المحيط. تقول Google إنها شهدت بالفعل انفجارًا في الإبداع – أكثر من 40 مليون فيديو تم إنشاؤه بالذكاء الاصطناعي خلال سبعة أسابيع فقط من الإطلاق [5].
  • واجهة سهلة، وصول حصري للمحترفين: استخدام أداة الفيديو في Gemini بسيط: اختر “الفيديوهات” في التطبيق، حمّل صورة، واصف المشهد والصوت الذي تريده. في حوالي 1–2 دقيقة، ينتج Gemini مقطع فيديو بدقة 720p وبمعدل 24 إطارًا في الثانية. (يحصل مشتركو Google AI Pro على Veo 3 Fast لمقاطع فيديو أسرع مدتها 8 ثوانٍ، بينما يحصل مشتركو Ultra على نموذج Veo 3 الأعلى جودة.) التوفر يقتصر على الباقات المدفوعة – يمكن لمستخدمي Pro إنشاء 3 فيديوهات/يوم ولمستخدمي Ultra 5/يوم – والميزة تُطرح في بلدان محددة. جميع الفيديوهات المُنتجة بالذكاء الاصطناعي تحمل علامة واضحة “AI” وعلامة مائية رقمية غير مرئية SynthID مضمنة.
  • حيل ونصائح إبداعية جديدة من Google: في منشور على مدونة Google، يشارك منتج إبداعي 3 طرق لاستخدام أداة Gemini لتحويل الصور إلى فيديو. أولاً، تحريك الرسوم التوضيحية – اجعل الرسومات أو التصاميم تنبض بالحياة كصور متحركة [6]. (يتم إخراج الفيديوهات بنسبة عرض إلى ارتفاع 16:9، مع إضافة أشرطة سوداء إذا لم تكن صورتك عريضة بالفعل [7].) ثانياً، حوّل التصوير الفوتوغرافي إلى صورة متحركة – ابدأ بصورة حقيقية وأضف لمسات خيالية أو شخصيات جديدة؛ سيقوم Gemini بـ”سد الفجوات” وتحريك المشهد [8]. (نصيحة: الصورة الأصلية تصبح الإطار الأول في الفيديو، لذا فإن وجود موضوع واضح وقريب يعطي نتيجة أفضل [9].) ثالثاً، توضيح رؤية فنية – استخدم مطالبات مفصلة لتصور لوحات القصة أو المفاهيم للعروض التقديمية [10]. يشير الكاتب إلى أنه يمكن أن يكون أسرع وأكثر فعالية من النماذج الثابتة، مما يساعد الآخرين على “تصور فكرتي بشكل أفضل” من خلال تصيير واقعي بالذكاء الاصطناعي [11]. صياغة المطالبات تتطلب تدريباً – قد تحتاج إلى تحسين المطالبات عبر عدة محاولات [12]. يمكنك حتى أن تطلب من Gemini اقتراح زوايا تصوير أو تعديلات لتحسين الفيديو [13]. وإذا بدت النتائج واقعية جداً، تذكر: علامات SynthID والعلامات المائية موجودة لضمان الشفافية وأنها من صنع الذكاء الاصطناعي [14].
  • جودة سينمائية عبر Veo 3 وFlow: في الخلفية، يتم تشغيل إنشاء الفيديو في Gemini بواسطة Veo 3، أحدث نموذج فيديو توليدي من Google DeepMind. تم الكشف عنه في Google I/O 2025، Veo 3 هو مولد فيديو ذكاء اصطناعي بدرجة سينمائية قادر على إنتاج صور واقعية للغاية (حتى بدقة 4K في المختبرات) مع فيزياء دقيقة، حركة سلسة وتوليد صوت أصلي [15] [16]. لا ينتج فقط صورًا نابضة بالحياة، بل يزامن أيضًا المؤثرات الصوتية، الضوضاء المحيطة، والحوار المنطوق – كل ذلك من مطالبة نصية [17] [18]. هذا النهج الشامل يعني أن شخصيتك التي أنشأها الذكاء الاصطناعي يمكن أن تتحرك وتتحدث بشكل مقنع على الشاشة، وهي ميزة فريدة مقارنة ببعض المنافسين. كما قدمت Google Flow، واجهة صناعة أفلام ذكاء اصطناعي متقدمة مبنية حول Veo 3 [19]. متاحة لمستخدمي Pro/Ultra في Labs، Flow تتيح للمبدعين ربط لقطات متعددة تم إنشاؤها بالذكاء الاصطناعي في مشاهد أطول، مع تحكم بأسلوب لوحة القصة. يمكنك إنشاء سلسلة من المقاطع بشخصيات وبيئات متسقة، استخدام عناصر تحكم الكاميرا (حركات بانورامية، تكبير، تغييرات زاوية) وحتى “تمديد” المشاهد من خلال توليد ما يأتي قبل أو بعد اللقطة [20] [21]. باختصار، تهدف Flow + Gemini إلى أن تكون استوديو أفلام افتراضي – يتعامل مع الصور، الكاميرا، والصوت – بحيث يمكن للمبدعين الأفراد إنتاج قصص متعددة المشاهد بالكامل باستخدام الذكاء الاصطناعي [22] [23].
  • كيف تقارن Gemini مع Sora وRunway وPika وFirefly: دفع Google نحو الفيديو بالذكاء الاصطناعي يأتي وسط مجال مزدحم بأدوات تحويل النص إلى فيديو. Sora من OpenAI (تم إطلاقها مؤخرًا عبر ChatGPT) يمكنها أيضًا توليد مقاطع قصيرة من التعليمات النصية. تشتهر Sora بـجودة استثنائية ولمسة سينمائية، مع اتساق زمني قوي بين الإطارات[24]. تستخدم واجهة تعليمات بأسلوب “لوحة القصة”، والتي يجدها بعض المبدعين بديهية[25]. ومع ذلك، فإن الوصول إلى Sora متدرج – يمكن لمستخدمي ChatGPT Plus إنشاء فيديوهات حتى 720p، 10 ثوانٍ، بينما يتيح ChatGPT Pro (200 دولار/شهريًا) 1080p حتى 20 ثانية وإخراج أسرع[26] [27]. كما تفتقر Sora إلى توليد الصوت بشكل أصلي، ما يعني أنها تنتج فيديوهات صامتة (ستحتاج لإضافة الصوت يدويًا)[28]. بالمقابل، Veo 3 من Gemini يدمج تصميم الصوت تلقائيًا، وهو ميزة كبيرة[29]. Runway ML، رائدة مبكرة في الفيديو التوليدي، تطورت بسرعة من Gen-1 إلى Gen-2 والآن Gen-3. كان Runway Gen-2 (أُطلق أول مرة في 2023) أول نموذج نص إلى فيديو متاح تجاريًا وأذهل المستخدمين بتقدمه[30] [31]. تحديث أواخر 2023 لـGen-2 كان محط إشادة واسعة بأنه “غيّر قواعد اللعبة” بسبب التحسينات الكبيرة في جودة الفيديو والاتساق[32]. سمح بمقاطع أطول (في البداية ~4 ثوانٍ، ولاحقًا حتى 18 ثانية) وقدم ميزات “وضع المخرج” مثل التحكم في حركات الكاميرا المحاكاة (التحريك، التقريب، إلخ) في المشهد الذي ينشئه الذكاء الاصطناعي[33] <a href=”https://venturebeat.com/ai/runways-gفي سبتمبر، قامت Runway بتحديث إضافي، حيث أصبح بإمكان Gen-2 أخذ صورة إدخال وتحريكها (مشابه لتحويل الصور إلى فيديو في Gemini) وحتى رفع دقة الإخراج (أحد التحديثات زاد إخراج الفيديو المعتمد على الصور الثابتة إلى ~1536p)[34]. الآن في عام 2025، يستمر Runway’s Gen-3 (alpha) في دفع حدود الواقعية والتحكم في التعديل، مقتربًا من جودة إخراج احترافية[35]. يشيد المبدعون بـ Runway لأدواته الشاملة (يقدم محرر ويب كامل مع keyframing، وin-painting، وغيرها)، رغم أن الاستخدام المكثف قد يكون مكلفًا وقد تكون هناك طوابير في أوقات الذروة[36][37]. مثل Gemini، فإن فيديوهات Runway حاليًا صامتة (بدون صوت تلقائي)، مع التركيز فقط على المرئيات. Pika Labs هو لاعب ناشئ آخر، معروف بأسلوبه المرح والفني في الفيديوهات بالذكاء الاصطناعي. أُطلق في 2023 بواسطة شركة ناشئة صغيرة (وبدعم تمويلي كبير)، وقد اكتسب Pika شهرة بفضل “تأثيرات Pika” الفريدة – إعدادات مسبقة تضيف حركات مرحة أو أنماط بصرية عصرية للفيديوهات[38]. يدعم التحويل من نص إلى فيديو ومن صورة إلى فيديو، ويُشاد به لسهولة استخدامه وسرعته، مما يجعله رائعًا لمحتوى وسائل التواصل الاجتماعي. غالبًا ما تكون مخرجات Pika مقاطع قصيرة ومُزخرفة (مثالية للميمات، والمؤثرات الموسيقية، إلخ) بدلاً من السينما الواقعية للغاية. كما أشار أحد التحليلات، فإن أدوات مثل Runway وPika “وجدت لنفسها مكانة في المحتوى التجريبي أو المزخرف”، بينما Google Gemini/Veo “تسعى وراء الواقعية وتحققها”[39]. بعبارة أخرى، تتفوق Pika Labs في التعبير الإبداعي وسهولة الاستخدام، رغم أنها قد لا تضاهي واقعية Gemini. أسعار Pika تعتبر في المتناول نسبيًا (تقدم تجربة مجانية وخططًا بحوالي 10 دولارات شهريًا مع رصيد فيديو محدد)[40][41]، مما يجعلها شائعة بين المبدعين المستقلين. كما دخلت عملاقة الصناعة Adobe هذا المجال مع Adobe Firefly للفيديو التوليدي (حاليًا في مرحلة البيتا). أدوات Firefly من نص إلى فيديو ومن صورة إلى فيديو مدمجة في منصة Adobe على الويب، وتهدف إلى 1080p/strong> مقاطع عالية الجودة لبضع ثوانٍ. تركز أدوبي على “توليد الفيديو بالذكاء الاصطناعي الآمن للعلامة التجارية” – حيث تم تدريب نموذج Firefly على محتوى مرخص أو من Adobe Stock لتجنب مشكلات حقوق النشر، ويتم تسويقه كأول مولد فيديو مناسب للمؤسسات و“آمن تجاريًا”. عمليًا، يمكن لـ Firefly تحريك الصور أو توليد مشاهد قصيرة بتفاصيل مذهلة (تستعرض أدوبي أمثلة مثل مناظر طبيعية سينمائية، لقطات منتجات مع تحليق الكاميرا، وحتى لقطات مقربة لوجوه بشرية) [42] [43]. كما يقدم بعض أشرطة تحكم بالكاميرا وأنماطًا، مستفيدًا من خبرة أدوبي في المؤثرات البصرية. المقابل هو أن Firefly مقيد إلى حد ما لضمان أن النتائج “آمنة قانونيًا” ومرخصة بشكل صحيح [44]. تركيز أدوبي ينصب على المبدعين المحترفين الذين يحتاجون إلى لقطات موثوقة وخالية من مشاكل الحقوق – على سبيل المثال، يمكن لفرق التسويق توليد لقطات B-roll أو لوحات قصصية بسرعة دون القلق بشأن انتهاكات الملكية الفكرية. وبينما تتمتع Firefly بقوة في جودة الصورة الخام، إلا أن Gemini من Google يتفوق في توليد الصوت بسلاسة والمشاهد الديناميكية الأطول (وبالطبع، لدى Google ميزة قاعدة المستخدمين الراسخة عبر تطبيق Gemini). المنافسة شرسة، لكن كل منصة – Sora وRunway وPika وFirefly وGemini – تقدم مزيجًا مختلفًا قليلاً من القدرات لجماهير وحالات استخدام متنوعة.
  • الاستقبال: آراء المبدعين والخبراء: كان رد فعل الجمهور تجاه أدوات الفيديو في Gemini متحمسًا إلى حد كبير. شارك العديد من المستخدمين أمثلة مذهلة على وسائل التواصل الاجتماعي – من صور العائلة القديمة التي أُعيد إحياؤها بحركة خفيفة، إلى لوحات خيالية تم تحريكها إلى أفلام قصيرة. قام مراجعو التكنولوجيا في Tom’s Guide باختبار Veo 3 من Gemini وأعجبوا به. كتب أحد المراجعين: “سأعترف أنه يبدو شرعيًا جدًا”، بعد أن حوّل صورة سيلفي إلى فيديو لنفسه وهو يركض على الشاطئ، مشيرًا إلى أنه رغم أن بعض التفاصيل الدقيقة كانت ناعمة قليلاً، “الفيديو يبدو دقيقًا” واحتوى حتى على صوت الأمواج وخطوات الأقدام مما “جعله يبدو أكثر واقعية” [45] [46]. في اختبار آخر، أضاف الذكاء الاصطناعي بنجاح “غزوًا فضائيًا” إلى صورة بسيطة في الحديقة – وكانت النتيجة بها بعض الشوائب الطريفة (أجسام طائرة تظهر وتختفي) لكنها بشكل عام كانت مشهد خيال علمي مقنع تم إنشاؤه في دقائق [47] [48]. تبرز مثل هذه التجارب الحماس والقيود الحالية معًا: يمكن لـ Gemini إنتاج صور وصوت واقعيين بشكل مذهل، لكن المستخدمين ذوي الملاحظة الدقيقة قد يلاحظون أحيانًا بعض الأخطاء أو الضبابية. تشير آراء الخبراء إلى أن Google في طليعة هذا المجال سريع التطور. لاحظ فريق Stockimg.ai، عند مقارنة أفضل نماذج الفيديو، أن “من حيث جودة المخرجات البحتة، يتصدر Sora وVEO3 حاليًا القائمة”، حيث ينتج كلاهما مقاطع فيديو “يصعب تمييزها عن اللقطات الحقيقية” [49]. وأكدوا على ميزة Gemini في الصوت الأصلي ودعم الذكاء الاصطناعي القوي من Google [50]. وأشار محلل آخر إلى أن دمج Google لهذه الأدوات (Gemini، Veo، Flow) يخلق “ما يشبه الاستوديو الكامل بين يديك”، في حين قد يحتاج الآخرون إلى حلول مجزأة للصوت أو التحرير [51]. ومع ذلك، هناك اعتراف بأنه لا يوجد نموذج مثالي حتى الآن – فعلى سبيل المثال، قد يواجه Veo 3 صعوبة مع الحركة السريعة جدًا أو التفاعلات المعقدة (مثل حديث عدة أشخاص)، كما أنه يتجنب عمدًا توليد وجوه حقيقية معروفة أو شخصيات محمية بحقوق النشر لأسباب أخلاقية. ومن الجدير بالذكر أن Google تتعامل بوعي مع المخاوف الأخلاقية والسلامة المتعلقة بالفيديو التوليدي. في إعلانها، أكدت Google على extensive”الاختبار الأحمر” وتطبيق السياسات لمنع إساءة استخدام مقاطع الفيديو بالذكاء الاصطناعي [52]. كل فيديو تم إنشاؤه بواسطة Gemini يحمل علامة مائية للحد من الخداع [53]. هذا النهج الحذر لاقى ترحيبًا من معظم الخبراء، الذين يتفقون على أنه من الضروري وضع علامات واضحة على محتوى الذكاء الاصطناعي مع ازدياد واقعيته. لا يزال بعض المبدعين يشعرون بعدم الارتياح تجاه الصور المنتجة بالذكاء الاصطناعي – حتى أن إحدى المنتجين في Google تعترف بأنها “تتأرجح بين الشعور بالحماس وعدم الارتياح” عند استخدام هذه الأدوات، لكنها تجد في النهاية أن الفن الذي ينتجه الذكاء الاصطناعي يسمح لها بإنشاء صور لم تكن لتوجد لولا ذلك، مما يعزز عملها بدلاً من استبداله [54]. هذا التفاؤل الحذر – احتضان الإمكانيات الإبداعية الجديدة مع الانتباه إلى المخاطر – يلخص إلى حد كبير شعور الجمهور.

في غضون بضعة أشهر، تحديث “Nano Banana” لمنصة Google Gemini وميزات توليد الفيديو قد دفعا المنصة إلى طليعة الإبداع بالذكاء الاصطناعي. من خلال دمج محرر صور قوي مع محرك فيديو توليدي، تتيح Gemini لأي شخص لديه اشتراك وخيال أن ينتج “أفلامًا” قصيرة من صورة واحدة أو طلب نصي. هذا التقارب بين الذكاء الاصطناعي للصور والفيديو – إلى جانب المنافسين الذين يتسابقون جنبًا إلى جنب – يشير إلى أننا ندخل عصرًا جديدًا حيث قد يبدأ سرد القصص فقط بطلب نصي وحلم. ورسالة Google للمبدعين واضحة: الأضواء. الكاميرا. الذكاء الاصطناعي يبدأ! [55]

المصادر:

  • مدونة Google – “تحرير الصور في Gemini حصل على ترقية كبيرة” (تحديث Nano Banana) [56] [57]
  • مدونة Google – “حوّل صورك إلى فيديوهات في Gemini” (David Sharon) [58] [59] [60] [61] [62]
  • مدونة Google – “3 طرق لاستخدام تحويل الصور إلى فيديو في Gemini” (Tatiana Gonzalez) [63] [64] [65] [66] [67] [68]
  • دليل توم – “حوّلت الصور إلى فيديوهات باستخدام Veo 3 من Google – نتائج مذهلة” [69] [70] [71]
  • ProTunes One – “أداة إنشاء الفيديو الجديدة من Gemini: ماذا تعني للمبدعين” [72] [73] [74]
  • مدونة Stockimg AI – “مقارنة أفضل نماذج توليد الفيديو بالذكاء الاصطناعي: Sora، VEO3، Runway والمزيد” [75] [76] [77] [78] [79]
  • VentureBeat – “تحديث Gen-2 من Runway… فيديو ذكاء اصطناعي مذهل” [80] [81] [82]
  • OpenAI – صفحة منتج Sora [83] [84]
  • Adobe – صفحة مولد الفيديو Firefly AI [85] [86]
https://youtube.com/watch?v=gcZwE5cM4xs

References

1. blog.google, 2. blog.google, 3. blog.google, 4. blog.google, 5. blog.google, 6. blog.google, 7. blog.google, 8. blog.google, 9. blog.google, 10. blog.google, 11. blog.google, 12. blog.google, 13. blog.google, 14. blog.google, 15. protunesone.com, 16. protunesone.com, 17. protunesone.com, 18. protunesone.com, 19. protunesone.com, 20. venturebeat.com, 21. venturebeat.com, 22. protunesone.com, 23. blog.google, 24. stockimg.ai, 25. stockimg.ai, 26. openai.com, 27. openai.com, 28. protunesone.com, 29. stockimg.ai, 30. venturebeat.com, 31. venturebeat.com, 32. venturebeat.com, 33. venturebeat.com, 34. venturebeat.com, 35. stockimg.ai, 36. stockimg.ai, 37. stockimg.ai, 38. generativeai.pub, 39. protunesone.com, 40. www.tomsguide.com, 41. www.tomsguide.com, 42. www.adobe.com, 43. www.adobe.com, 44. www.adobe.com, 45. www.tomsguide.com, 46. www.tomsguide.com, 47. www.tomsguide.com, 48. www.tomsguide.com, 49. stockimg.ai, 50. stockimg.ai, 51. protunesone.com, 52. blog.google, 53. blog.google, 54. blog.google, 55. blog.google, 56. blog.google, 57. blog.google, 58. blog.google, 59. blog.google, 60. blog.google, 61. blog.google, 62. blog.google, 63. blog.google, 64. blog.google, 65. blog.google, 66. blog.google, 67. blog.google, 68. blog.google, 69. www.tomsguide.com, 70. www.tomsguide.com, 71. www.tomsguide.com, 72. protunesone.com, 73. protunesone.com, 74. protunesone.com, 75. stockimg.ai, 76. stockimg.ai, 77. stockimg.ai, 78. stockimg.ai, 79. stockimg.ai, 80. venturebeat.com, 81. venturebeat.com, 82. venturebeat.com, 83. openai.com, 84. openai.com, 85. www.adobe.com, 86. www.adobe.com

Bitcoin vs Ethereum 2025: The Ultimate Crypto Investment Showdown 🚀💰
Previous Story

بيتكوين مقابل إيثريوم 2025: المواجهة النهائية للاستثمار في العملات الرقمية 🚀💰

Go toTop