Den größten Teil der Geschichte des Kinos haben Animation und Live-Action auf gegenüberliegenden Seiten einer dicken Mauer gelebt. Man brauchte Kameras, Standorte und menschliche Darsteller. Das andere erforderte Künstler, Rigs und unverhältnismäßig viel Geduld. Zwischen beiden wechseln – eine Live-Aufnahme wie handgezeichnet aussehen lassen oder eine Animation bodenständig wirken lassen
die physische Welt – war die Art von Projekt, die Budgets und Versandpläne verschlang. Die Style-Transfer-Funktion im Inneren Zwillinge Omni hat diese Mauer fast beiläufig aufgelöst.
Sie laden einen Clip hoch, den Sie tatsächlich gedreht haben. Sie beschreiben den gewünschten Look – Studio Ghibli-Wärme, Spider-Verse-Comic-Tinte, Aquarellwaschung, Low-Poly-Geometrie, düsteres Rotoskop. Sekunden später haben Sie eine neue Version Ihres Filmmaterials in diesem Stil gerendert, wobei die ursprüngliche Bewegung erhalten bleibt. Die Geste des Schauspielers bleibt erhalten. Die Kamerabewegung bleibt erhalten. Was sich ändert, ist alles andere – Textur, Linienstärke, Farbpalette, die gesamte visuelle Sprache.
Stiltransfer existiert als Konzept seit fast einem Jahrzehnt. Frühe Demos neuronaler Netze im Jahr 2016 könnten ein Standbild im Stil von Van Gogh neu zeichnen. Dann kamen die Videoversionen, die meist ein flackerndes, schwebendes Durcheinander erzeugten, das auseinanderfiel, sobald ein Motiv den Kopf drehte. Jedes Jahr verkündete jemand einen Durchbruch; Jedes Jahr sah das Ergebnis immer noch wie eine verfluchte PowerPoint-Animation aus.
Was sich mit Omni geändert hat, ist zeitliche Kohärenz. Das Modell behandelt einen Clip als fortlaufende Szene und nicht als Folge unabhängiger Bilder. Die Tintenlinien auf der Jacke einer Figur bleiben von Bild eins bis Bild neunzig an derselben Stelle. Der Aquarellrand am Rand eines Schattens bewegt sich mit dem Schatten, nicht gegen ihn. Die Beleuchtung, die in einer Aufnahme warm ist, bleibt auch in der nächsten warm. Diese klingen wie kleine Details, bis Sie sich ältere, im KI-Stil gehaltene Aufnahmen angesehen haben und bemerken, dass Ihr Auge sich weigert, zur Ruhe zu kommen, weil nichts stillsteht.
Die andere Verschiebung ist Kontrolle. Sie wählen nicht aus einem Dropdown-Menü mit sieben voreingestellten Filtern aus. Sie beschreiben den Stil in natürlicher Sprache, was bedeutet, dass das Ergebnis tatsächlich auf Begriffe wie „weniger gesättigt“, „dickere Konturen“, „mehr Ukiyo-e-Holzschnitt, weniger Anime“ reagiert. Jede Iteration baut auf der letzten auf, anstatt bei Null anzufangen, sodass die Auswahl eines bestimmten Looks zu einem Gespräch und nicht zu einem Ratespiel wird.
Die in den Ersteller-Feeds auftretenden Anwendungsfälle sind nicht die offensichtlichsten. Ja, die Leute verwandeln Urlaubsaufnahmen in Ghibli-Filme. Das ist der Einstiegspunkt. Die interessantere Arbeit findet eine Schicht tiefer statt.
Musikvideoregisseure drehen einen einzigen Live-Auftritt und produzieren drei stilistisch unterschiedliche Schnitte aus demselben Filmmaterial – eine Samstagmorgen-Cartoon-Version für eine soziale Plattform, eine Noir-Comic-Version für eine andere und einen sauberen Live-Schnitt für den Hauptkanal der Band. Die Leistung ist identisch. Die visuelle Identität ist es nicht. Das ist ein Content-Multiplikator, den kein Redakteur manuell innerhalb eines normalen Bearbeitungsfensters hätte erzeugen können.
Indie-Filmemacher experimentieren mit Gemni Omni kostenlos Testzugang nutzen die Funktion für Vorab- und Proof-of-Concept-Arbeiten. Anstatt mit Moodboards und Storyboards einen „animierten Kurzfilm im Stil von Die Umstellung von „Stellen Sie sich das vor“ zu „Hier ist es“ verschärft den gesamten Greenlight-Prozess.
Pädagogen und Ersteller von Erklärkanälen nutzen Stiltransfer, um trockenes Filmmaterial anschaubar zu machen. Aus einem sprechenden Erklärer wird eine stilisierte Graphic-Novel-Sequenz. Ein Rundgang durch ein Museum wird zu einer Bilderbuchillustration in Bewegung. Die Informationen sind die gleichen; Die Engagement-Kurve ist noch nicht einmal annähernd gleich.
Einige Muster haben sich im Handlungsspielbuch der Community etabliert. Die Benennung einer bestimmten Referenz – eines Films, eines Künstlers, einer Bewegung – ist tendenziell besser als vage stilistische Adjektive. „Aquarell“ gibt Ihnen etwas Allgemeines; „Aquarellhintergründe von Studio Ghibli, weiche Kanten, gedämpfte Grüntöne“ bieten Ihnen etwas Brauchbares.
Beleuchtungsverben sind wichtiger, als die Leute erwarten. Wenn Sie dem Modell mitteilen, dass das Licht „weich und diffus“ und nicht „kontrastreich und gerichtet“ ist, wirkt sich dies erheblich auf die stilisierte Ausgabe aus, da das Modell die Beleuchtung des Originalmaterials durch die Linse des gewünschten Stils interpretiert.
Bei den ersten Versuchen schlagen kurze Clips lange. Mit Sequenzen von fünf bis zehn Sekunden können Sie den Look schnell ändern, bevor Sie sich auf ein längeres Rendering festlegen. Sobald der Stil festgelegt ist, können Sie dieselbe Eingabeaufforderungsstruktur auf weitere Clips anwenden und so die Konsistenz über eine Sequenz hinweg gewährleisten.
Und für alle, die neugierig genug sind, die Funktion zu testen, ohne einen vollständigen Produktionsworkflow einzurichten, ist es der Weg mit dem geringsten Widerstand, es auszuprobieren Kostenloses Gemni Omni über eine gehostete Schnittstelle, fügen Sie einen Telefonclip ein und führen Sie eine einzelne Stilaufforderung aus. Fünf Minuten reichen normalerweise aus, um zu verstehen, worum es bei der Aufregung geht – und um mental zu überdenken, wie Sie an Ihr nächstes Projekt herangehen.
Was in den meisten Berichten über dieses Feature nicht laut erwähnt wird, ist, dass es die Wirtschaftlichkeit verändert entscheiden auf einen Stil. Historisch gesehen war die Wahl einer ästhetischen Richtung eine Verpflichtung mit hohem Risiko – sobald ein Projekt in einem bestimmten Look gerendert oder gedreht wurde, bedeutete die Neuausrichtung einen Neuanfang. Der Stiltransfer verwandelt diese Verpflichtung in eine umkehrbare Entscheidung. Sie können den Live-Action-Schnitt, den gemalten Schnitt und den Comic-Schnitt aus demselben Ausgangsmaterial liefern und das Publikum diejenige auswählen lassen, die Anklang findet.
Das ist keine schnellere Möglichkeit, den alten Job zu erledigen. Das ist ein ganz anderer Job.
No Comments