روز سهشنبه، گوگل در رویداد I/O خود از Flow، ابزاری برای تولید ویدیوی هوش مصنوعی مولد که توسط آخرین مدل هوش مصنوعی گوگل، Veo 3، پشتیبانی میشود، رونمایی کرد. کلارک یکی از فیلمسازان هوش مصنوعی بود که با آزمایشگاههای گوگل در مورد عملکرد و رابط کاربری این ابزار جدید همکاری کرد، به طوری که با در نظر گرفتن فیلمسازان و سازندگان طراحی شده است. همین کافی است که بگوییم، او از نتایج تحت تأثیر قرار گرفته است.
نقد فیلم «چشمه جوانی»: جان کرازینسکی و ناتالی پورتمن سعی میکنند ماجراجویی «ایندیانا جونز» خودشان را خلق کنند
«زن و کودک»
نقد فیلم «زن و کودک»: بازی قدرتمند پریناز ایزدیار در یک ملودرام ایرانی، یکی از مدعیان جایزه بهترین بازیگر زن کن است
کلارک پیش از رونمایی از فیلم «فلو» به ایندیوایر گفت: «هنوز از این سطح کنترل شگفتزدهام. این برای من به عنوان یک فیلمساز است، این چیزی است که منتظرش بودهام. شما 10000 ساعت وقت گذاشتهاید، با این دستورالعملها دست و پنجه نرم میکنید و از این سیستمهای مختلف استفاده میکنید. اما تنها چیزی که ما واقعاً به آن امیدواریم، آن سطح از کنترل است که احساس میکنم بالاخره به آن رسیدهایم و مدت زیادی طول کشیده تا به این زودی به آن برسیم.»
فلو دارای کنترلهای دوربین است که به فیلمسازان اجازه میدهد حرکت و زاویه بصری مورد نظر خود را برای یک نما به طور خاص بیان کنند، گویی که یک فیلمبردار را هدایت میکنند. این برنامه دارای قابلیتی به نام Scenebuilder است که به فیلمسازان اجازه میدهد صحنهای را تولید کنند و سپس آن را گسترش دهند، در حالی که تمام طراحیهای شخصیتها و مکانهای آنها ثابت و دست نخورده باقی میماند. سازندگان میتوانند تصاویر مرجع متعددی را که با مواردی مانند چهرهها، لباسها و مکانها مطابقت دارند، آپلود و ترکیب کنند و این کار را با جزئیات بسیار خاص انجام دهند.
Flow همچنین امکان زبان طبیعیتری را در نوشتن سریع فراهم میکند، به طوری که زبان بصری فیلمنامهنویسی و جزئیات فنی جزئی مانند انتخاب لنز، شرایط روشنایی، فواصل کانونی یا دانهبندی فیلم را درک میکند. این برنامه حتی قادر است صدا را به صورت بلادرنگ با تولید ویدیو، از جمله جلوههای صوتی، موسیقی پس زمینه و دیالوگ، تولید کند.
کلارک و شرکت تولید هوش مصنوعی او، Promise، از Flow برای ساخت یک فیلم کوتاه جدید تولید شده توسط هوش مصنوعی به نام «Freelancers» در مورد دو برادر خوانده که هر کدام از طریق مسیرهای جداگانه به جاسوسان و آدمکشهای بینالمللی تبدیل میشوند، استفاده میکنند. او صحنهای را که ایجاد کرده بود، توصیف کرد که در آن دو شخصیت اصلیاش در یک رستوران نشسته بودند، با یک نمای مقدماتی با یک دالی آهسته که به داخل میرود. سپس او از مدل خواست تا از یک حرکت دوربین دستی پویا استفاده کند و به دنبال آن یک نمای ردیابی از دو شخصیت در حال دویدن.
«و این کار را کرد! برای دیدن نحوه لرزش دوربین، باید بگویم که دقیقاً به همان شکلی است که اگر من در آن رستوران بودم، احتمالاً آن را فیلمبرداری میکردم. خیلی جالب بود و من این سطح از [کنترل] را ندیده بودم.» کلارک گفت.
مدت زیادی از زمانی که OpenAI از مدل ویدیویی Sora خود رونمایی کرد، نمیگذرد. فیلمسازان هوش مصنوعی که در آن زمان با آنها صحبت کردیم، از اینکه این مدل «به سرعت به هدف خود پایبند است» شگفتزده شدند، جایی که میتوانید یک اتفاق را بیان کنید و سپس اتفاق دیگری برای آن شخصیت در همان سکانس رخ دهد. Flow و Veo 3 قابلیت پیشرفتهتری را نشان دادند که در آن صحنهای که سازندگان ایجاد کردهاند، میتواند در یک جدول زمانی کشیده و گسترش یابد تا به طور مؤثر عمل را ادامه دهد و حتی مدت زمان یک نمای واحد را بیش از ۶ تا ۸ ثانیهای که مدل معمولاً تولید میکند، طولانیتر کند.
کلارک این را به توانایی واقعی در ایجاد «یک صحنه» به سبک «۱۹۱۷» خودش در صورت تمایل تشبیه کرد، به طوری که عمل از مکانی به مکان دیگر گسترش مییابد، حتی اگر شخصیت ثابت بماند.
کلارک توضیح داد: «فرض کنید مردی در حال رانندگی در ساحل آمالفی است. با استفاده از Scenebuilder درون Flow، کارگردان درون من توانست بقیه صحنه را بلاک کند. بنابراین شاید از داخل ماشین با رانندگی مرد شروع شود، سپس زاویه دید باشد، سپس میتوانم به یک نمای باز تغییر دهم، و نحوه کار Flow این است که در واقع تمام اطلاعات وارد شده، تمام نکات، نحوه نگاه شخصیت، نحوه نگاه ساحل آمالفی و جاده، رنگ ماشین را میداند. میتواند آن اطلاعات را به برش یا صحنه یا تدوین بعدی، اگر بخواهید، ترجمه کند و روایت را ادامه دهد.»
کلارک گفت که او به اندازهای دقیق شده که صحنه را طوری طراحی کرده که انگار با لنز ۵۰ میلیمتری تا لنز ۱۳۵ میلیمتری فیلمبرداری شده است، و Flow نه تنها آن را درک میکند، بلکه میتواند آن کار را با بلاکینگ خاص ترکیب کند.
متیو کیم لورین، مدیر خلاقیت در گوگل دیپمایند، و توماس ایلجیک، مدیر محصول در گوگل لبز، در مصاحبه با ایندیوایر درباره درک فرآیند خلاقانهی کسی مانند کلارک به منظور آگاهی از نحوهی عملکرد Flow صحبت کردند.