Category: AI

  • Kuvien editointia qwen-image-2509:llä

    Z-Image Turbolla generoitu kuva jota käytetty testaamiseen

    Lähiaikoina olen käyttänyt enemmän tai vähemmän jälleen qwen-image-2509:ää kuvien muokkaamiseen. En ole aikaisemin siitä tänne kirjoittanut, joten laitan lyhyen postauksen siitä mitä tällä työkalulla on mahdollista tehdä jotta vähemmän teknologiaa seuraavatkin voivat kuulla mitä kaikkea nykyajan AI-härpättimillä voidaan tehdä jo kotikoneella.

    Lyhesti kerrottuna kyseessä on tekoälymalli jolla voi muokata olemassa olevia kuvia. Erinomaista siinä on sen laatu, sekä se, että sitä voi ajaa omalla koneellaan ainakin ComfyUI käyttöliittymässä mikäli koneessa riittävät tehot.

    Omassa koneessa on 32 GB RAMia ja näytönohjaimena on 16 GB VRAM:illa varustettu NVidia RTX 4060 Ti jolla ainakin pikaisella 4 Step LoRA:lla yhden kuvan saa muokattua muutamassa minuutissa, tosin vaihteluväliä on paljon aina 53 sekunnista 134:ään sekuntiin.

    Mikäli laatua haluaa paremmaksi, pitää nopeuttavat LoRA:t jättää työnkulusta pois jolloin laatu ainakin joissain tapauksissa paranee mutta generoinnissa kestää merkittävästi kauemmin. Muutaman testin perusteella tähän meni aikaa noin 8,5 minuuttia per kuva.

    Generoin tämän blogipostauksen alussa nähtävän hevoskärrykuvan ensin Z-Image Turbolla jonka jälkeen käytin qwen-image-edit-2509:ää seuraavien kuvien muokkaamiseen joista saa jonkinlaisen käsityksen mitä tällä voi tehdä.

    Qwen-image-edit-2509:n näkemys samasta hevoskärrystä jos se olisi kuvattuna edestä.
    Sama kärry kuvattuna takaa.

    Yhdestä kuvasta pystyi tällä työkalulla siis generoimaan useamman kuvan eri kuvakulmasta. Tästä oli hyötyä lyhyessä AI:lla tekemässäni videossa.

    Olen käyttänyt qwen-image-edit-2509:ää myös laajentamaan kuvia. Alkuperäisessä kuvassa on ollut henkilö osittain näkyvissä jonka jälkeen tällä mallilla on voinut luoda henkilöstä kokovartalokuvan kuten alla olevista kuvista voi nähdä.

    Alkuperäinen Z Image Turbolla generoitu kuva
    Qwen-Edit-2509:llä laajennettu kuva, eli puolivartalokuvasta saa tehtyä kokovartalokuvan.
    Myös hahmon pyöräyttäminen onnistuu tässäkin tapauksessa kumpaan suuntaan tahansa

    Kuvan muokkausta voi käyttää myös kohteiden sijoittamiseen uuteen taustaan kuten alla olevista kuvista näkee.

    Alkuperäinen Z Image Turbolla generoitu kuva
    Hahmo siirrettynä uuteen taustaan käyttäen qwen-image-2509:ää
    Maiseman vaihdon lisäksi myös vaatteiden vaihto, käsien asennon muutos sekä ilmeen vaihdos onnistuu. Lisäksi kädessä olleet pelikortit on jätetty pois.

    Kuten yllä olevista esimerkeistä voi huomata, tekoälymallilla on mahdollista muokata kuvia jo tätä nykyä omalla kotikoneella erittäin monipuolisesti. Kuvissa nähtävien taustojen ja esineiden vaihto tai poisto, ilmeiden ja kehon asennon muutokset, eri kuvakulmista kohteen näyttämiset sekä valaistuksen muutokset ja monet muut tarpeet onnistuvat kohtalaisen nopeasti.

    Kuvan laatu on omiin tarpeisiini hyvä jo nopealla 4 Step LoRA:lla jolloin myös kuvan generointiaika pystyy maltillisena.

    Virheitä muokkauksiin kyllä tulee ja toisinaan olen jättänyt asian tekemättä jos tarpeeksi monella yrittämällä en ole saanut tulosta joka olisi edes sinne päinkään sitä mitä koetan saavuttaa, mutta näiden tapausten määrä on merkittävästi vähäisempää kuin onnistuneiden muokkausten tekeminen. Useasti tulee kuitenkin samasta kuvauksesta generoitua monta kuvaa ennen kuin tulos tulee sellaiseksi kuin haluaa.

    Esimerkiksi vielä loppuun laitan kolme kuvaa joista kaksi ensimmäistä on lähdekuvat ja viimeisenä on kuva jossa olen yhdistänyt viulua soittavan naisen käyttämään toisessa kuvassa nähtyä avaruuspukua. Näitä kuvia generoin ensin seitsemän kuvaa jotka ei onnistuneet siinä mitä koetin tavoitella, mutta kahdeksas kerta tuotti haluamani lopputuleman.

    Alkuperäinen Z Image Turbolla generoitu kuva naisesta soittamassa viulua.
    Alkuperäinen Z Image Turbolla generoitu kuva astronautista hyppimässä avaruudessa planeetalla.
    Lopullinen qwen-image-2509:llä generoitu kuva jossa on yhdistetty henkilö ja asu yllä nähdyistä kuvista