Category: AI

Krea 2 Turbo on pätevä AI-työkalu kuvien generointiin

Eilen ja tänään olen jälleen leikkinyt AI-kuvageneraattoreilla. Aikaisemmin olen kirjoittanut tänne Z Image Turbosta (lue täältä), mutta uudempia päteviä lokaaleja malleja on tullut markkinoille, joten tällä kertaa postaan muutamia kuvia joita olen generoinut Krea 2 Turbo -mallilla.

Tavalliseen tapaan nämäkin kuvat on luotu käyttäen ComfyUI-työkalua mallin ajamisessa. Omassa koneessani on yhä RTX 4060 Ti jossa on 16 GB VRAM-muistia ja 32 GB RAM-muistia ja tällaisella setupilla yhden kuvan generointiin resoluutiolla 1928 x 1088 kestää hieman alle 40 sekuntia.

Kaikki kuvat joita tähän laitan on mustavalkoisia, sillä olen erityisen paljon pitänyt mustavalkoisista kuvista joita tällä olen onnistunut generoimaan. Eipä siinä, pidän myös paljon mustavalkoisesta kuvaamisesta myös kameroilla.

July 27, 2026
Vibekoodailua lokaaleilla malleilla

Kuvankaappaus lokaalilla AI-mallilla koodatusta tekstieditorista

Taustaa

Noin viikko sitten koetin enismmäistä kertaa käyttää AI:ta eli tuttavallisemmin tekoälyä koodaamiseen. Teknisemmin ilmaistuna käytin siis koodaamiseen LLM:ää eli suurta kielimallia joka kuitenkin tavan tallaajalle on helpompi ilmaista vain ympäripyöreällä ilmaisulla tekoäly.

Olen aikaisemmin käyttänyt kielimalleja koodamisessa apuna siten että olen pitänyt sitä Googlaamisen vaihtoehtona ongelmien ilmetessä. Esimerkiksi vaikkapa jos on ollut tarve pilkkoa merkkijono Pythonilla tietystä merkistä eteenpäin mutta en ole muistanut syntaksia, en olekaan aina Googlannut ongelmaan vastausta vaan olen käyttänyt lokaalia kielimallia ja kysynyt siltä vastausta ongelmaan. Sen jälkeen olen kopioinut vastauksesta relevantit osuudet omaan koodiin manuaalisesti.

Olen kuitenkin nyt viime viikolla ja tällä kuluneella viikolla muutamina iltoina leikkinyt enemmänkin koodin kanssa, mutta tällä kertaa siten että en ole itse kirjoittanut koodia vaan olen pyytänyt AI-agenttia kirjoittamaan sen puolestani alusta loppuun asti.

Työkalu jota olen käyttänyt agenttina on Pi (pi.dev) ja kielimalli jota olen käyttänyt on ollut ensin Gemma 4 E4B ja myöhemmin Qwen 3.6 35B A3B UD. Tällä hetkellä tätä kirjoittaessa testauksessa on Qwen 3.6 27B malli jonka juuri latasin koneelleni. Pitä olen ajan ajanut Ubuntu Linuxissa jota pyöritän Windowsissa WSL2:ssa.

Viikon aikana olen koettanut koodata pienimuotoisia ohjelmia testin vuoksi että saan edes jonkinlaisen käsityksen siitä mitä kaikkea näillä voi tehdä. Tietenkin osaavissa käsissä niillä voi varmasti tehdä paljon enemmänkin etenkin jos käyttää parempia malleja, mutta omassa testailussa tärkein vaatimus on ollut lokaalien mallin käyttö.

Lokaalin mallien käytön perustelut on käytännössä kustannukset sekä ympäristö. En halua maksaa kielimallin käytöstä jossain muualla kun voin pyörittää omiin tarpeisiini tarpeeksi hyvää mallia omalla koneellani. Lisäksi ajatuksen tasolla itselläni tökkii AI:n aiheuttamat negatiiviset ympäristövaikutukset, joten en halua että energia- ja vesisyöpöt konesalit joutuvat pyörimään 24/7 vain sen takia että voin itsekin käyttää niitä kaikkeen kivaan.

Tietenkin lokaalit mallit on vaatineet kouluttaessa jo hillittömästi konetehoa ja niillä on negatiivinen vaikutus ympäristöön, mutta jatkossa ne ei kuluta yhtään virtaa omalla koneellani sinä aikana kun en niitä käytä, eli koneen ei tarvitse olla pyörimässä 24/7. Vähän samalla tapaa kuin CD vs. suoratoistopalvelut. Energiankulutus on tapahtunut valmistusvaiheessa, mutta ne eivät kuluta virtaa silloin kun niitä ei käytetä kun taas suoratoistopalvelut vaativat sen että konesalit pyörivät 24/7 vaikka en sattuisi sieltä mitään kuuntelemaan.

Mitä näillä olen saanut aikaiseksi

Olen tähän mennessä muutaman pienen koodauksen saanut näillä tehty joten laitan tähän alle lyhyesti niistä mitä kaikkea niillä olen saanut aikaiseksi näiden työkalujen opetteluvaiheessa.

Wallhaven.cc:n kuvien lataaja

Ensimmäinen minkä koodasin – tai tarkemmin ottaen pyysin tekoälytyökaluja tekemään sen koodauksen – oli wallhaven.cc sivustolta taustakuvien lataajan. Käyttäjä voi antaa parametrinä hakusanan jonka jälkeen skripti hakee taustakuvia sillä hakusanalla.

Lisäksi skripti osaa lukea konfiguraatiotiedoston minne käyttäjän on pitänyt syöttää API-avain (jonka rekisteröitynyt käyttäjä saa haettua wallhaven.cc-sivustolta asetuksista). Konfiguraatiotiedostosta luetaan myös muutamia muita asetuksia, eli ainakin yksinkertaisen skriptin sain toteutettua jossa on tuki konfiguraatiotiedostoille.

Valokuvien automaattinen siirtäjä

Toinen skripti mitä olen tehnyt on ollut oikeasti jopa hyödyllinen itselleni. Normaalisti olen valokuvat siirtänyt muistikortilta tietokoneelle käsipelissä oikeisiin kansioihin. Tämä kuvien importoija sitä vastoin tekee sen automaattisesti. Kun laitan muistikortin tietokoneeseen kiinni ja käynnistän skriptin käy skripti läpi kaikki valokuvat joita se löytää muistikortilta.

Skripti käyttää exiftool-nimistä ohjelmaa katsomaan kuvien metadatoista kuvan ottamisen päivämäärän ja muodostaa niistä automaattisesti oikeat polut omien tarpeideni mukaisesti. Kopioin aina kuvat YYYY\MM\DD rakenteeseen, eli 23.04.2026 otetut kuvat menisivät 2026\04\23 kansioon. Skripti listaa ensin löytämänsä kuvat ja kun kirjoitan “Yes” tai “y” ja painan enter alkaa skripti kopioimaan kuvat koneelle oikeisiin kansioihin.

Skirpti osaa myös luoda puuttuvat kansiot automaattisesti ja lisäksi se tajuaa olla ylikirjoittamatta jo aikaisemmin kovalevyllä samalla nimellä löytyviä tiedostoja.

Sivuston pystyssäolon tarkistaja

Sivustojen pystyssä olon tarkastajan web-käyttöliittymä

Yksi skripti mikä tuli vibekoodattua on sivustojen pystyssä olon tarkistaja. Skripti tarkistaa sites.txt tiedostosta onko sivusto vielä pystyssä ja löytyykö sieltä sitä sisältöä mitä sinne on määritetty.

Esimerkiksi https://deepcontrastmedia.com sivulta skripti tarkastaa löytyykö sieltä teksti “Audiovisuaalista tuotantoa”. Mikäli sivu on pystyssä mutta palauttaa sisältöä jossa ei löydykään tuota tekstiä niin silloin skripti osaa kertoa sen käyttöliittymässä. Samoin jos sivu ei vastaa lainkaan eli se on kaatunut osaa skripti ilmoittaa siitäkin.

Alunperin tein tämän komentorivillä ajettavaksi skriptiksi, mutta myöhemmin sitten muutin tämän toimimaan webbiselaimessa. Lisäksi web-käyttöliittymään tuli lisättyä tekstikenttä mihin voin lisätä domainin ja tekstin mitä sieltä pitää löytyä jolla voin validoida sivuston toimivuuden.

Kuten voi arvata, tämä sivu ei ole auki julkiseen Internetiin koska muuten tuon tekstikentän kautta olisi kohta levy tungettu täyteen kaikkea tai vähintäänkin yritetty tunkeutua palvelimelle etsimällä tietoturva-aukkoja.

Boom

Kuvankaappaus Boom-nimisen pelin prototyypistä jonka sai tehtyä Qwen 3.6:n 35b A3B UD:llä.

Ajatus mikä nousi mieleeni etsiessä rajoja mitä kaikkea näillä lokaaleilla malleilla oman koneen tehojen riittäessä voisi tehdä oli se, saisinko nämä tekemään yksinkertaisen raycaster-tyylillä toteutetun pelin tai ainakin edes mitenkään toimivan prototyypin. Esimerkkinä raycaster-pelistä on klassinen Wolfenstein 3D.

Yllättävää kyllä, Qwen 3.6 35b A3B:lla (tai A3B UD:lla) tämäkin onnistui. Peli lukee “maps.txt” tiedoston ja generoi sen mukaan kartan jossa pelaajana sitten voi pyöriä W, A, S, D napeilla sekä nuolilla liikutellen. Käyttöliittymä sanoo kyllä että myös hiirellä voisi katsella ympärilleen mutta ainakaan vielä moinen ei ole mahdollista.

Tämä oli itselleni todellinen wow että tällaisen pystyi näillä jo tekemään muutamilla promptauksilla. Kehitys on mennyt selvästi jo kovasti eteenpäin.

NoteBad

Viimeisin testailu oli koodata yksinkertainen tekstieditori joka on vähän kuten Microsoft Windowsin Notepad mutta simppelimpi ja vibekoodattu. Tämäkin onnistui, mutta ominaisuuksia vielä puuttuu koska en saanut niitä vibekoodaamalla vielä toimimaan. Esimerkiksi en ainakaan saanut vasempaan laitaan rivien näyttämistä oikein joten sitä en ole lisännyt lainkaan. Lisäksi ominaisuuksia puuttuu koska en ole niitä vielä koettanut edes lisätä (kuten kopioi/liitä valikot, Ctrl + S -pikanapilla tallennus yms.).

Saapa nähdä tuleeko tätä projektia jatkettua koskaan sen enempää kuin muitakaan, kuitenkin nämä ovat enemmänkin harjoitteluprojekteja olleet jotta saan perspektiiviä mitä kaikkea voin näillä tehdä.

Loppusanat

Kuten yllä olevista esimerkeistä voi nähdä, lokaaleilla malleilla on mahdollista tehdä jo jotain pienimuotoista koodausta mikäli koneessa on riittävästi tehoa.

Koneessani on näytönohjaimena NVidia RTX 4060 Ti jossa on 16 GB VRAMia ja tavallista RAM-muistia löytyy 32 GB joten tehojen puolesta kone on selvästi tehokkaampi kuin monelta kotona löytyy. Silti tämäkin on kohtalaisen tehoton jos AI-työkaluja haluaisi käyttää ammattimaisesti ja nopeudella olisi enemmän merkitystä, mutta tällaiseen omaan räpellykseen kone on vielä riittänyt moneen.

Kokemukset ovat olleet positiiviset. Monia asioita on tullut opittua ja paljon olisi vielä opittavaa edessä, joten aika näyttää mitä tulevaisuudessa näiden kanssa keksii.

April 23, 2026
Ace-Step 1.5 XL turbo on suuri harppaus eteenpäin lokaalisti tekoälyllä tehtävässä musiikissa

Olen aikaisemmin täällä blogissani kirjoittanut Ace-Step-ohjelmistosta jolla voi generoida musiikkia AI:lla (lue täältä). Kuten monet muutkin tekoälytyökalut, myös Ace-Step on ottanut harppauksia eteenpäin sen jälkeen kun olen siitä lähes vuosi sitten kirjoittanut, joten on aika kirjoittaa tämä lyhyt postaus missä jaan kappaleita joita on generoitu uudemmalla mallilla.

Uusin malli jonka sain omalle koneelleni pyörimään on Ace-Step 1.5 XL Turbo jolla tämän blogipostauksen kappaleet on generoitu. Omaan korvaani kehitys on kehittynyt merkittävästi, sillä nyt monet tällä generoidut biisit kuulostavat omaan korvaani hyvältä.

Ace-Step osaa generoida monia eri musiikkityylejä ja laulaa myöskin usealla eri kielillä. Käyttöliittymässä on painike millä saa kirjoitettua tyylilajin ja sanoitukset jos haluaa antaa AI:n generoida kaiken. Tämä onkin oikein kätevä ominaisuus, sillä tätä kautta löytää uudenlaisia tyylilajeja ja näkee miten niitä pitäisi promptata jotta samankaltaisella tyylillä sitten voi generoida lisää biisejä mutta erilaisilla sanoituksilla.

Yksi akilleen kantapää tässä yhä on. Metallimusiikin generointi ei tunnu tuottavan haluttua tulosta. Kepeää metallin kaltaista musiikkia saa toisinaan ulos, mutta oikeaa eli kunnollista metallia ei kyllä tunnu saavan ulos kirveelläkään. Oikealla kunnollisella metallilla tarkoitan tietenkin sellaista mikä ei kuulosta radiopopilta.

Alla muutamia kappaleita joita tällä generoin.

Kultainen kääre (versio 2) – Suomeksi laulettu laulu. Sanat on generoitu Gemma 4: 31B:llä.

Big Band Jazz tai jotain sellaista

Venäläistä Dark Poppia

Jonkinlaista countryä

Mitä lie poppia

Korea-poppia ja EDM:ää yhdisteltynä

Shoegaze-vivahteista fiilistelyä

Teatreelista settiä. Harmi että en ottanut prompteja talteen.

Positiivista korealaista musiikkia

April 14, 2026
Kuvien editointia qwen-image-2509:llä

Z-Image Turbolla generoitu kuva jota käytetty testaamiseen

Lähiaikoina olen käyttänyt enemmän tai vähemmän jälleen qwen-image-2509:ää kuvien muokkaamiseen. En ole aikaisemin siitä tänne kirjoittanut, joten laitan lyhyen postauksen siitä mitä tällä työkalulla on mahdollista tehdä jotta vähemmän teknologiaa seuraavatkin voivat kuulla mitä kaikkea nykyajan AI-härpättimillä voidaan tehdä jo kotikoneella.

Lyhesti kerrottuna kyseessä on tekoälymalli jolla voi muokata olemassa olevia kuvia. Erinomaista siinä on sen laatu, sekä se, että sitä voi ajaa omalla koneellaan ainakin ComfyUI käyttöliittymässä mikäli koneessa riittävät tehot.

Omassa koneessa on 32 GB RAMia ja näytönohjaimena on 16 GB VRAM:illa varustettu NVidia RTX 4060 Ti jolla ainakin pikaisella 4 Step LoRA:lla yhden kuvan saa muokattua muutamassa minuutissa, tosin vaihteluväliä on paljon aina 53 sekunnista 134:ään sekuntiin.

Mikäli laatua haluaa paremmaksi, pitää nopeuttavat LoRA:t jättää työnkulusta pois jolloin laatu ainakin joissain tapauksissa paranee mutta generoinnissa kestää merkittävästi kauemmin. Muutaman testin perusteella tähän meni aikaa noin 8,5 minuuttia per kuva.

Generoin tämän blogipostauksen alussa nähtävän hevoskärrykuvan ensin Z-Image Turbolla jonka jälkeen käytin qwen-image-edit-2509:ää seuraavien kuvien muokkaamiseen joista saa jonkinlaisen käsityksen mitä tällä voi tehdä.

Qwen-image-edit-2509:n näkemys samasta hevoskärrystä jos se olisi kuvattuna edestä.

Sama kärry kuvattuna takaa.

Yhdestä kuvasta pystyi tällä työkalulla siis generoimaan useamman kuvan eri kuvakulmasta. Tästä oli hyötyä lyhyessä AI:lla tekemässäni videossa.

Olen käyttänyt qwen-image-edit-2509:ää myös laajentamaan kuvia. Alkuperäisessä kuvassa on ollut henkilö osittain näkyvissä jonka jälkeen tällä mallilla on voinut luoda henkilöstä kokovartalokuvan kuten alla olevista kuvista voi nähdä.

Alkuperäinen Z Image Turbolla generoitu kuva

Qwen-Edit-2509:llä laajennettu kuva, eli puolivartalokuvasta saa tehtyä kokovartalokuvan.

Myös hahmon pyöräyttäminen onnistuu tässäkin tapauksessa kumpaan suuntaan tahansa

Kuvan muokkausta voi käyttää myös kohteiden sijoittamiseen uuteen taustaan kuten alla olevista kuvista näkee.

Alkuperäinen Z Image Turbolla generoitu kuva

Hahmo siirrettynä uuteen taustaan käyttäen qwen-image-2509:ää

Maiseman vaihdon lisäksi myös vaatteiden vaihto, käsien asennon muutos sekä ilmeen vaihdos onnistuu. Lisäksi kädessä olleet pelikortit on jätetty pois.

Kuten yllä olevista esimerkeistä voi huomata, tekoälymallilla on mahdollista muokata kuvia jo tätä nykyä omalla kotikoneella erittäin monipuolisesti. Kuvissa nähtävien taustojen ja esineiden vaihto tai poisto, ilmeiden ja kehon asennon muutokset, eri kuvakulmista kohteen näyttämiset sekä valaistuksen muutokset ja monet muut tarpeet onnistuvat kohtalaisen nopeasti.

Kuvan laatu on omiin tarpeisiini hyvä jo nopealla 4 Step LoRA:lla jolloin myös kuvan generointiaika pystyy maltillisena.

Virheitä muokkauksiin kyllä tulee ja toisinaan olen jättänyt asian tekemättä jos tarpeeksi monella yrittämällä en ole saanut tulosta joka olisi edes sinne päinkään sitä mitä koetan saavuttaa, mutta näiden tapausten määrä on merkittävästi vähäisempää kuin onnistuneiden muokkausten tekeminen. Useasti tulee kuitenkin samasta kuvauksesta generoitua monta kuvaa ennen kuin tulos tulee sellaiseksi kuin haluaa.

Esimerkiksi vielä loppuun laitan kolme kuvaa joista kaksi ensimmäistä on lähdekuvat ja viimeisenä on kuva jossa olen yhdistänyt viulua soittavan naisen käyttämään toisessa kuvassa nähtyä avaruuspukua. Näitä kuvia generoin ensin seitsemän kuvaa jotka ei onnistuneet siinä mitä koetin tavoitella, mutta kahdeksas kerta tuotti haluamani lopputuleman.

Alkuperäinen Z Image Turbolla generoitu kuva naisesta soittamassa viulua.

Alkuperäinen Z Image Turbolla generoitu kuva astronautista hyppimässä avaruudessa planeetalla.

Lopullinen qwen-image-2509:llä generoitu kuva jossa on yhdistetty henkilö ja asu yllä nähdyistä kuvista

December 4, 2025
Eläköön, AI-kuvien fotorealismi!

Omalla tietokoneella pyörivällä AI-kuvien generoinnilla saavutetaan jo huikean realistinen taso

Ilmeisesti eilen julkaistiin uusi poikkeuksellisen hyvä tekoälymalli kuvien generointiin, sillä huomasin sen tänään työpäivän loppuvaiheilla ja ensimmäiset postaukset siitä olivat eiliseltä ainakin nopeasti Redditin viestien aikaleimoista katsottuna. Heti toimistolta kotiin päästyäni täytyi malli ladata omalle koneelle kokeilemista varten. Yhden illan kokeilujen perusteella olen todella vakuuttunut sen laadusta ja nopeudesta.

Malli on nimeltään Z Image Turbo ja sen saa pyörimään omalla koneella mikäli konetehot riittävät, eli sitä ei tarvitse ajaa missään pilvipalvelussa. Tavalliseen tapaan tätäkin onnistuu ajaa ComfyUI:n työnkulkujen kautta ja valmis työnkulkuesimerkki löytyi nopeasti netistä Redditin keskusteluista.

Omassa tietokoneessani on näytönohjaimena NVidia RTX 4060 Ti jossa on 16 GB VRAMia ja koneesta löytyy muistia 32 GB ja ainakin tällä kombinaatiolla kuvia onnistuu generoida nopealla tahdilla, sillä yhden kuvan generointiin menee ainoastaan n. 35 – 55 sekuntia 1920×1088 tai 1088×1920 resoluutiolla. Jostain syystä ComfyUI:ssa ei onnistu valita tälle FullHD-resoluutiota (eli 1920×1080), mutta väliäkö tuolla. Myös muita resoluutioita tuetaan, sillä ainakin oletuksena valintana oli 1024×1024.

Tuttuun tapaan selkeimmät havaintokohdat mistä näistä yleensä erottaa ne tekoälyn generoimaksi kuvaksi on tekstit, sormet tai varpaat (jos varpaat on kuvassa nähtävissä). Myös näissä alempana nähtävissä esimerkkikuvissa voi ainakin yhden kuvan tunnistaa helposti tekoälyllä tehdyksi jos keskittyy katsomaan kuvassa tekstejä etiketeistä.

Vaikka malli onkin hyvä, toisinaan kuvia generoidessa tulee silti mukaan selkeitä järjettömyyksiä kuten vaikkapa kolme kättä, mutta näin räikeiden epämääräisyyksien määrä on ollut erittäin harvinaista ainakin ensimmäisen illan testien perusteella, ehkä yksi tai kaksi kuvaa kahdesta sadasta generoidusta kuvasta on mennyt tähän kategoriaan.

Vaikka nämä kuvat joita tässä blogitekstissä jaan ovat fotorealistisia tai vähintäänkin sellaiseen pyrkiviä, on hyvä huomioida että tällä mallilla onnistuu myös muunkinlaisten kuvien generointi. Kuvien aiheiden ei tarvitse noudattaa siis mitään fysiikan tai realismin lakeja ja sillä onnistuu generoida myös kuvia vaikkapa keijuista tai dinosauruksista. Lisäksi kuvatyylin ei tarvitse olla valokuva, vaan ne voivat olla esimerkiksi anime-tyylisiä piirroksia tai Pixarin elokuvien tyyliä, joten malli soveltuu muuhunkin kuin valokuvilta näyttävien kuvien generointiin.

Kaikki tähän jakamani kuvat ovat vaakatasossa olevia blogitekstin selkeyden vuoksi (koska nämä generoidut pystykuvat eivät skaalaudu täysin samaan leveyteen tässä teemassa kuin vaakakuvat), mutta laitan luultavasti jonakin toisena päivänä postauksen missä on pelkästään pystykuvia. Mahdollisesti tulen julkaisemaan jossain vaiheessa myös postauksen joissa on kuvia jotka eivät noudata fysiikan tai realismin rajoja.

Pidemmittä puheitta laitan tähän alle joitain tämän illan generoiduista kuvista josta voi itse kukin arvioida onko laatu millainen.

November 28, 2025