Modellarchitektur

Wie DecorViz Denkt

Eine proprietäre KI-Bildsynthese-Pipeline, die zwei unstrukturierte Fotografien in ein einziges fotorealistisches Composite verwandelt. Keine 3D-Assets. Keine Tiefensensoren. Keine Raumscans.

Monokulare Tiefenschätzung Lichtfeldanalyse Generatives Compositing Schattensynthese Zweistufiges Spiegel-Rendering Textgesteuertes Steuern
01 / Vollständige Synthesepipeline

Von Zwei Fotos zu einem Fotorealistischen Ergebnis

Das DecorViz-Modell verarbeitet zwei Eingaben in einer einzigen End-to-End-Synthesepipeline. Jede Stufe konditioniert die nächste: Segmentierung speist Compositing, Geometrie speist Perspektive, Photometrie speist Schattensynthese.

ROOM PHOTO RGB image uncalibrated PRODUCT IMAGE any background any source PROMPT optional natural language SEGMENTATION product isolation bg removal SCENE GEOMETRY depth estimation vanishing points PHOTOMETRY light field est. color temp. COMPOSITING perspective align depth placement SHADOW SYNTH occlusion light cast OUTPUT photorealistic composite original resolution STUFE 1 STUFEN 2–3 STUFE 4 STUFE 5
02 / Stufe 1

Robuste Produktsegmentierung

Bevor das Compositing beginnt, führt das Modell eine automatische Segmentierungsstufe durch, die das Zielprodukt aus jedem Eingabebild isoliert. Die Pipeline ist so konzipiert, dass sie das volle Spektrum realer Eingaben verarbeitet, ohne sauberes oder strukturiertes Quellmaterial zu benötigen.

  • 01 Saubere Hintergründe. Produkt auf weißem, grauem oder transparentem PNG. Höchste Wiedergabetreue als Ausgangspunkt.
  • 02 Lifestyle-Fotos. Produkt eingebettet in eine gestaltete oder inszenierte Raumszene. Das Modell identifiziert und extrahiert das Zielobjekt aus dem umgebenden Kontext.
  • 03 E-Commerce-Screenshots. Mischinhaltbilder mit Produktfotografie, Werbebannern, UI-Chrome, Navigation und Text. Das Modell lokalisiert und isoliert das Produkt ohne manuelle Maskierung.
WHITE BG LIFESTYLE E-COMMERCE SCREENSHOT clean lifestyle screenshot SEGMENTATION automatic object isolation ISOLATED PRODUCT background removed
03 / Stufe 2

Monokulare Szenengeometrie-Inferenz

Aus einem einzigen unkalibrierten 2D-Foto führt das Modell implizite monokulare Tiefenschätzung und vollständige Szenenstrukturanalyse durch. Keine Stereo-Eingabe, kein Tiefensensor oder strukturiertes Licht ist erforderlich.

  • 01 Fluchtpunkt-Inferenz. Perspektiv-Konvergenzlinien werden erkannt und das dominante Fluchtpunktfeld wird rekonstruiert, um die Szenenorientierung zu etablieren.
  • 02 Boden- und Grundebenen-Lokalisierung. Das Modell identifiziert die primäre Stützfläche: Innenböden, Außenpatios, Terrassen oder Rasen. Diese Ebene verankert alle Produktplatzierungen.
  • 03 Per-Pixel-Tiefenfeld. Eine kontinuierliche Tiefenkarte wird über die gesamte Szene inferiert, was eine tiefensortierte Platzierung eingefügter Objekte ohne Kollision mit vorhandener Geometrie ermöglicht.
  • 04 Räumliche Skalenschätzung. Relative Objektgrößen in der Szene werden analysiert, um eine kohärente Skalenreferenz für die korrekte Größenbestimmung eingefügter Produkte zu etablieren.
FP fern mitte nah BODENEBENE Produkt platziert bei Tiefe Z räumliche Skalenschätzung
04 / Stufe 3

Photometrische Umgebungsanalyse

Das Modell führt implizite Lichtfeldschätzung aus dem Szenenfloto durch und gewinnt das vollständige photometrische Profil, das benötigt wird, um das eingefügte Produkt mit beleuchtungskonsistenter Treue zu rendern.

Parameter Beschreibung
Lichtrichtung Dominanter Quellenwinkel und Azimut, abgeleitet aus Schattenorientierung und Highlight-Verteilung auf Oberflächen.
Intensität Leuchtdichte der primären Lichtquelle, die den Schattenkontrast und die Spiegelflächenreaktion auf dem eingefügten Produkt bestimmt.
Farbtemperatur Kelvin-Bereich der dominanten Lichtquelle, aus dem Szenen-Weißabgleich gewonnen. Auf die Oberflächenschattierung des eingefügten Produkts angewendet.
Winkelverteilung Weiches vs. hartes Licht, abgeleitet aus der Schärfe der Schattenkanten. Bestimmt die Penumbra-Breite in der Synthese.
LICHTQUELLE dominante Richtung 2700K warm 6500K kalt Farbtemperaturwiederherstellung Intensität Produkt
05 / Stufe 5

Schatten- und Okklusions-Synthese

Schatten werden geometrisch aus der inferierten Szene abgeleitet, nicht als statische Overlays oder vorgebackene Assets angewendet. Jede Schattenkomponente wird unabhängig synthetisiert und compositet, um der photometrischen Umgebung zu entsprechen.

Kontaktschatten
Weiches Abdunkeln an der Objekt-Boden-Grenze. Radius und Intensität abgeleitet aus der inferierten Lichtdistanz.
Umgebungsokklusion
Okklusionsakkumulation in konkaven Bereichen, Ecken und Nischen angrenzend an das platzierte Objekt.
Direktionaler Schattenwurf
Langform-Schattenwurf über die Bodenebene, gewinkelt und skaliert entsprechend der gewonnenen Lichtquellenrichtung.
Penumbra
Schattenkanten-Weichheit skaliert nach der Winkelverteilung der Lichtquelle: hart für direktes Sonnenlicht, weich für diffuses Umgebungslicht.
L dir. Schattenwurf Kontaktschatten Umgeb.-okk.
06 / Reflektierende Flächen

Zweistufiges Spiegel-Rendering

Wenn die Szene Spiegel oder hochreflektierende Oberflächen enthält, wendet das Modell einen zweistufigen Rendering-Ansatz an, um physisch konsistente Reflexionen zu generieren, die das neu platzierte Produkt einbeziehen.

  • D1 Durchgang 1: Szenenestablishment. Raumgeometrie, Beleuchtung und Produktplatzierung werden finalisiert. Das primäre Composite wird ohne reflektierenden Inhalt gerendert.
  • D2 Durchgang 2: Generierung von reflektiertem Inhalt. Spiegelflächen erhalten reflektierten Inhalt, der aus dem Zustand von Durchgang 1 abgeleitet wird: die Szenengeometrie, das platzierte Produkt und die Beleuchtung sind alle in der Reflexion mit korrekter Perspektiv-Invertierung und Dämpfung sichtbar.
DURCHGANG 1 Spiegel Geometrie + Beleuchtung etabliert DURCHGANG 2 Reflexion Reflexion generiert aus Zustand Durchgang 1 Produkt erscheint korrekt in der Reflexion mit Perspektiv-Invertierung und Luminanzdämpfung kein Post-Process-Overlay -- Reflexion aus Szenenzustand synthetisiert
07 / Natürlichsprachliche Schnittstelle

Textgesteuerte Szenenkontrolle

Eine optionale Eingabeaufforderung in natürlicher Sprache ermöglicht es Benutzern, spezifische Parameter der Generierung zu steuern. Ohne Eingabeaufforderung wendet das Modell vollautomatische Platzierung, Tiefenpositionierung, Skalierungsinferenz und Beleuchtungssynthese an. Wenn eine Eingabeaufforderung bereitgestellt wird, konditioniert sie drei unabhängige Subsysteme:

Räumliche Platzierung
Das Modell führt semantisches Szenenverständnis durch, identifiziert vorhandene Objekte und ihre Positionen, und löst dann räumliche Beziehungsanweisungen auf.
"Sofa zwischen TV und Couchtisch stellen"
"Lampe über dem Esstisch aufhängen"
Skalierungskalibrierung
Natürlichsprachliche Dimensionsbeschreibungen werden geparst und angewendet, um das Skalierungskalibrierungssystem einzuschränken und die Produkt-zu-Raum-Proportionalität zu verbessern.
"mein Wohnzimmer ist 4 Meter breit"
"Deckenhöhe etwa 2,8m"
Szenenattribut-Steuerung
Beleuchtungsattribute, die mit bestimmten Szenenobjekten verknüpft sind, werden geparst und auf das photometrische Rendering der relevanten Leuchte und ihren Szenenanteil angewendet.
"warmes rosa Licht vom Stehlampe hinzufügen"
"Szene im goldenen Stundenlicht"
08 / Produkttreue

Material- und Erscheinungserhaltung

Materialeigenschaften, Oberflächentextur und Kolorimetrie des Produkts werden durch den Syntheseprozess erhalten. Das Modell inferiert den Oberflächentyp aus dem Produktbild und wendet die materialspezifische Lichtreaktion entsprechend an. Produktgeometrie und Oberflächenerscheinung werden nicht halluziniert oder neu interpretiert.

Oberflächentyp Renderverhalten
Spiegelnd / Lackiert Spiegelflecken positioniert relativ zur gewonnenen Lichtquelle. Umgebungsreflexionen aus dem Szenenkontext abgeleitet.
Stoff / Textil Textur-Level-Schattierung mit gerichteter Faserlage. Subsurface-Scattering für Weichpolstermaterialien wie Samt und Bouclé.
Metall Anisotrope Reflexionsreaktion. Gebürstetes vs. poliertes Verhalten aus der Texturverteilung inferiert. Beitrag der Umgebungskarte angewendet.
Matt / Lackiert Lambertianische diffuse Schattierung. Schattenabsorption kalibriert auf die Oberflächenalbedo, gewonnen aus der Kolorimetrie des Produktbildes.
Glas / Transparent Transmission und Brechung relativ zum Szenen-Hintergrund angewendet. Fresnel-Reaktion an Silhouettenkanten.
Natürliche Materialien (Holz, Stein, Rattan) Korn- und Texturdirektionalität erhalten. Diffuse Reaktion mit niedrigem Spiegelkomponent aus der Oberflächenbearbeitung abgeleitet.
09 / Generalisierung

Szenen- und Kategorieabdeckung

Das Modell generalisiert über Szenentypen und Produktkategorien hinweg ohne kategoriespezifisches Fine-Tuning oder 3D-Scanning. Jedes Produktfoto mit ausreichender Klarheit ist eine gültige Eingabe.

Szenentypen
Wohnräume: Wohnzimmer, Schlafzimmer, Esszimmer, Heimarbeitszimmer
Offene Grundrisse und Studios
Außenbereiche: Terrassen, Veranden, überdachte Pergolen
Gemischte Innen-Außen-Übergänge
Produktkategorien
Alle Sitzmöbel: Sofas, Sektionalsofas, Stühle, Bänke, Hocker
Alle Tische: Esstische, Couchtische, Beistelltische, Konsolentische, Schreibtische
Teppiche, Bodenbeläge, Wandkunst, Spiegel, Aufbewahrung
Beleuchtungskörper, Pflanzen, große Außeninstallationen

Das Modell in Aktion Sehen

Laden Sie ein Raumfoto und ein beliebiges Produktbild hoch. Ergebnisse in Sekunden.

DecorViz Kostenlos Testen