روز سه‌شنبه، گوگل در رویداد I/O خود از Flow، ابزاری برای تولید ویدیوی هوش مصنوعی مولد که توسط آخرین مدل هوش مصنوعی گوگل، Veo 3، پشتیبانی می‌شود، رونمایی کرد. کلارک یکی از فیلمسازان هوش مصنوعی بود که با آزمایشگاه‌های گوگل در مورد عملکرد و رابط کاربری این ابزار جدید همکاری کرد، به طوری که با در نظر گرفتن فیلمسازان و سازندگان طراحی شده است. همین کافی است که بگوییم، او از نتایج تحت تأثیر قرار گرفته است.


نقد فیلم «چشمه جوانی»: جان کرازینسکی و ناتالی پورتمن سعی می‌کنند ماجراجویی «ایندیانا جونز» خودشان را خلق کنند
«زن و کودک»
نقد فیلم «زن و کودک»: بازی قدرتمند پریناز ایزدیار در یک ملودرام ایرانی، یکی از مدعیان جایزه بهترین بازیگر زن کن است
کلارک پیش از رونمایی از فیلم «فلو» به ایندی‌وایر گفت: «هنوز از این سطح کنترل شگفت‌زده‌ام. این برای من به عنوان یک فیلمساز است، این چیزی است که منتظرش بوده‌ام. شما 10000 ساعت وقت گذاشته‌اید، با این دستورالعمل‌ها دست و پنجه نرم می‌کنید و از این سیستم‌های مختلف استفاده می‌کنید. اما تنها چیزی که ما واقعاً به آن امیدواریم، آن سطح از کنترل است که احساس می‌کنم بالاخره به آن رسیده‌ایم و مدت زیادی طول کشیده تا به این زودی به آن برسیم.»

فلو دارای کنترل‌های دوربین است که به فیلمسازان اجازه می‌دهد حرکت و زاویه بصری مورد نظر خود را برای یک نما به طور خاص بیان کنند، گویی که یک فیلمبردار را هدایت می‌کنند. این برنامه دارای قابلیتی به نام Scenebuilder است که به فیلمسازان اجازه می‌دهد صحنه‌ای را تولید کنند و سپس آن را گسترش دهند، در حالی که تمام طراحی‌های شخصیت‌ها و مکان‌های آنها ثابت و دست نخورده باقی می‌ماند. سازندگان می‌توانند تصاویر مرجع متعددی را که با مواردی مانند چهره‌ها، لباس‌ها و مکان‌ها مطابقت دارند، آپلود و ترکیب کنند و این کار را با جزئیات بسیار خاص انجام دهند.

Flow همچنین امکان زبان طبیعی‌تری را در نوشتن سریع فراهم می‌کند، به طوری که زبان بصری فیلمنامه‌نویسی و جزئیات فنی جزئی مانند انتخاب لنز، شرایط روشنایی، فواصل کانونی یا دانه‌بندی فیلم را درک می‌کند. این برنامه حتی قادر است صدا را به صورت بلادرنگ با تولید ویدیو، از جمله جلوه‌های صوتی، موسیقی پس زمینه و دیالوگ، تولید کند.

کلارک و شرکت تولید هوش مصنوعی او، Promise، از Flow برای ساخت یک فیلم کوتاه جدید تولید شده توسط هوش مصنوعی به نام «Freelancers» در مورد دو برادر خوانده که هر کدام از طریق مسیرهای جداگانه به جاسوسان و آدمکش‌های بین‌المللی تبدیل می‌شوند، استفاده می‌کنند. او صحنه‌ای را که ایجاد کرده بود، توصیف کرد که در آن دو شخصیت اصلی‌اش در یک رستوران نشسته بودند، با یک نمای مقدماتی با یک دالی آهسته که به داخل می‌رود. سپس او از مدل خواست تا از یک حرکت دوربین دستی پویا استفاده کند و به دنبال آن یک نمای ردیابی از دو شخصیت در حال دویدن.

«و این کار را کرد! برای دیدن نحوه لرزش دوربین، باید بگویم که دقیقاً به همان شکلی است که اگر من در آن رستوران بودم، احتمالاً آن را فیلمبرداری می‌کردم. خیلی جالب بود و من این سطح از [کنترل] را ندیده بودم.» کلارک گفت.

مدت زیادی از زمانی که OpenAI از مدل ویدیویی Sora خود رونمایی کرد، نمی‌گذرد. ​​فیلمسازان هوش مصنوعی که در آن زمان با آنها صحبت کردیم، از اینکه این مدل «به سرعت به هدف خود پایبند است» شگفت‌زده شدند، جایی که می‌توانید یک اتفاق را بیان کنید و سپس اتفاق دیگری برای آن شخصیت در همان سکانس رخ دهد. Flow و Veo 3 قابلیت پیشرفته‌تری را نشان دادند که در آن صحنه‌ای که سازندگان ایجاد کرده‌اند، می‌تواند در یک جدول زمانی کشیده و گسترش یابد تا به طور مؤثر عمل را ادامه دهد و حتی مدت زمان یک نمای واحد را بیش از ۶ تا ۸ ثانیه‌ای که مدل معمولاً تولید می‌کند، طولانی‌تر کند.

کلارک این را به توانایی واقعی در ایجاد «یک صحنه» به سبک «۱۹۱۷» خودش در صورت تمایل تشبیه کرد، به طوری که عمل از مکانی به مکان دیگر گسترش می‌یابد، حتی اگر شخصیت ثابت بماند.

کلارک توضیح داد: «فرض کنید مردی در حال رانندگی در ساحل آمالفی است. با استفاده از Scenebuilder درون Flow، کارگردان درون من توانست بقیه صحنه را بلاک کند. بنابراین شاید از داخل ماشین با رانندگی مرد شروع شود، سپس زاویه دید باشد، سپس می‌توانم به یک نمای باز تغییر دهم، و نحوه کار Flow این است که در واقع تمام اطلاعات وارد شده، تمام نکات، نحوه نگاه شخصیت، نحوه نگاه ساحل آمالفی و جاده، رنگ ماشین را می‌داند. می‌تواند آن اطلاعات را به برش یا صحنه یا تدوین بعدی، اگر بخواهید، ترجمه کند و روایت را ادامه دهد.»

کلارک گفت که او به اندازه‌ای دقیق شده که صحنه را طوری طراحی کرده که انگار با لنز ۵۰ میلی‌متری تا لنز ۱۳۵ میلی‌متری فیلمبرداری شده است، و Flow نه تنها آن را درک می‌کند، بلکه می‌تواند آن کار را با بلاکینگ خاص ترکیب کند.

متیو کیم لورین، مدیر خلاقیت در گوگل دیپ‌مایند، و توماس ایلجیک، مدیر محصول در گوگل لبز، در مصاحبه با ایندی‌وایر درباره درک فرآیند خلاقانه‌ی کسی مانند کلارک به منظور آگاهی از نحوه‌ی عملکرد Flow صحبت کردند.