Olen aikaisemmin täällä blogissani kirjoittanut Ace-Step-ohjelmistosta jolla voi generoida musiikkia AI:lla (lue täältä). Kuten monet muutkin tekoälytyökalut, myös Ace-Step on ottanut harppauksia eteenpäin sen jälkeen kun olen siitä lähes vuosi sitten kirjoittanut, joten on aika kirjoittaa tämä lyhyt postaus missä jaan kappaleita joita on generoitu uudemmalla mallilla.
Uusin malli jonka sain omalle koneelleni pyörimään on Ace-Step 1.5 XL Turbo jolla tämän blogipostauksen kappaleet on generoitu. Omaan korvaani kehitys on kehittynyt merkittävästi, sillä nyt monet tällä generoidut biisit kuulostavat omaan korvaani hyvältä.
Ace-Step osaa generoida monia eri musiikkityylejä ja laulaa myöskin usealla eri kielillä. Käyttöliittymässä on painike millä saa kirjoitettua tyylilajin ja sanoitukset jos haluaa antaa AI:n generoida kaiken. Tämä onkin oikein kätevä ominaisuus, sillä tätä kautta löytää uudenlaisia tyylilajeja ja näkee miten niitä pitäisi promptata jotta samankaltaisella tyylillä sitten voi generoida lisää biisejä mutta erilaisilla sanoituksilla.
Yksi akilleen kantapää tässä yhä on. Metallimusiikin generointi ei tunnu tuottavan haluttua tulosta. Kepeää metallin kaltaista musiikkia saa toisinaan ulos, mutta oikeaa eli kunnollista metallia ei kyllä tunnu saavan ulos kirveelläkään. Oikealla kunnollisella metallilla tarkoitan tietenkin sellaista mikä ei kuulosta radiopopilta.
Alla muutamia kappaleita joita tällä generoin.
Kultainen kääre (versio 2) – Suomeksi laulettu laulu. Sanat on generoitu Gemma 4: 31B:llä.Big Band Jazz tai jotain sellaistaVenäläistä Dark PoppiaJonkinlaista countryäMitä lie poppiaKorea-poppia ja EDM:ää yhdisteltynäShoegaze-vivahteista fiilistelyäTeatreelista settiä. Harmi että en ottanut prompteja talteen.Positiivista korealaista musiikkia
Z-Image Turbolla generoitu kuva jota käytetty testaamiseen
Lähiaikoina olen käyttänyt enemmän tai vähemmän jälleen qwen-image-2509:ää kuvien muokkaamiseen. En ole aikaisemin siitä tänne kirjoittanut, joten laitan lyhyen postauksen siitä mitä tällä työkalulla on mahdollista tehdä jotta vähemmän teknologiaa seuraavatkin voivat kuulla mitä kaikkea nykyajan AI-härpättimillä voidaan tehdä jo kotikoneella.
Lyhesti kerrottuna kyseessä on tekoälymalli jolla voi muokata olemassa olevia kuvia. Erinomaista siinä on sen laatu, sekä se, että sitä voi ajaa omalla koneellaan ainakin ComfyUI käyttöliittymässä mikäli koneessa riittävät tehot.
Omassa koneessa on 32 GB RAMia ja näytönohjaimena on 16 GB VRAM:illa varustettu NVidia RTX 4060 Ti jolla ainakin pikaisella 4 Step LoRA:lla yhden kuvan saa muokattua muutamassa minuutissa, tosin vaihteluväliä on paljon aina 53 sekunnista 134:ään sekuntiin.
Mikäli laatua haluaa paremmaksi, pitää nopeuttavat LoRA:t jättää työnkulusta pois jolloin laatu ainakin joissain tapauksissa paranee mutta generoinnissa kestää merkittävästi kauemmin. Muutaman testin perusteella tähän meni aikaa noin 8,5 minuuttia per kuva.
Generoin tämän blogipostauksen alussa nähtävän hevoskärrykuvan ensin Z-Image Turbolla jonka jälkeen käytin qwen-image-edit-2509:ää seuraavien kuvien muokkaamiseen joista saa jonkinlaisen käsityksen mitä tällä voi tehdä.
Qwen-image-edit-2509:n näkemys samasta hevoskärrystä jos se olisi kuvattuna edestä.Sama kärry kuvattuna takaa.
Yhdestä kuvasta pystyi tällä työkalulla siis generoimaan useamman kuvan eri kuvakulmasta. Tästä oli hyötyä lyhyessä AI:lla tekemässäni videossa.
Olen käyttänyt qwen-image-edit-2509:ää myös laajentamaan kuvia. Alkuperäisessä kuvassa on ollut henkilö osittain näkyvissä jonka jälkeen tällä mallilla on voinut luoda henkilöstä kokovartalokuvan kuten alla olevista kuvista voi nähdä.
Alkuperäinen Z Image Turbolla generoitu kuvaQwen-Edit-2509:llä laajennettu kuva, eli puolivartalokuvasta saa tehtyä kokovartalokuvan.Myös hahmon pyöräyttäminen onnistuu tässäkin tapauksessa kumpaan suuntaan tahansa
Kuvan muokkausta voi käyttää myös kohteiden sijoittamiseen uuteen taustaan kuten alla olevista kuvista näkee.
Alkuperäinen Z Image Turbolla generoitu kuvaHahmo siirrettynä uuteen taustaan käyttäen qwen-image-2509:ääMaiseman vaihdon lisäksi myös vaatteiden vaihto, käsien asennon muutos sekä ilmeen vaihdos onnistuu. Lisäksi kädessä olleet pelikortit on jätetty pois.
Kuten yllä olevista esimerkeistä voi huomata, tekoälymallilla on mahdollista muokata kuvia jo tätä nykyä omalla kotikoneella erittäin monipuolisesti. Kuvissa nähtävien taustojen ja esineiden vaihto tai poisto, ilmeiden ja kehon asennon muutokset, eri kuvakulmista kohteen näyttämiset sekä valaistuksen muutokset ja monet muut tarpeet onnistuvat kohtalaisen nopeasti.
Kuvan laatu on omiin tarpeisiini hyvä jo nopealla 4 Step LoRA:lla jolloin myös kuvan generointiaika pystyy maltillisena.
Virheitä muokkauksiin kyllä tulee ja toisinaan olen jättänyt asian tekemättä jos tarpeeksi monella yrittämällä en ole saanut tulosta joka olisi edes sinne päinkään sitä mitä koetan saavuttaa, mutta näiden tapausten määrä on merkittävästi vähäisempää kuin onnistuneiden muokkausten tekeminen. Useasti tulee kuitenkin samasta kuvauksesta generoitua monta kuvaa ennen kuin tulos tulee sellaiseksi kuin haluaa.
Esimerkiksi vielä loppuun laitan kolme kuvaa joista kaksi ensimmäistä on lähdekuvat ja viimeisenä on kuva jossa olen yhdistänyt viulua soittavan naisen käyttämään toisessa kuvassa nähtyä avaruuspukua. Näitä kuvia generoin ensin seitsemän kuvaa jotka ei onnistuneet siinä mitä koetin tavoitella, mutta kahdeksas kerta tuotti haluamani lopputuleman.
Alkuperäinen Z Image Turbolla generoitu kuva naisesta soittamassa viulua.Alkuperäinen Z Image Turbolla generoitu kuva astronautista hyppimässä avaruudessa planeetalla.Lopullinen qwen-image-2509:llä generoitu kuva jossa on yhdistetty henkilö ja asu yllä nähdyistä kuvista
Omalla koneella pyörivän kappaleiden generoijan ACE-Stepin käyttöliittymä on yksinkertainen mutta tehokas.Testibiisi menevää musiikkia järjettömillä sanoituksilla
Eilen illalla törmäsin YouTube-videoita katsellessa mielenkiintoiseen tekoälytyökaluun nimeltään ACE-Step (koodit löytyy GitHubista).
Työkalu on avoimen lähdekoodin tuotos ja sillä pystyy luomaan kokonaisia musiikkikappaleita ilman että käyttäjän tarvitsee osata tehdä muuta kuin painella muutamia nappuloita käyttöliittymästä. Käyttäjä pystyy itse myös kirjoittamaan sanoitukset joita tekoäly sitten lauleskelee parhaan kykynsä mukaan, toisinaan hyvällä ja toisinaan vähemmän hyvällä menestyksellä.
Mikäli sanoitusten kirjoittaminen ei luonnistu, voi tietenkin käyttää muita tekoälytyökaluja sanoitusten kirjoittamiseen. Itse käytin muutamissa näissä tässä postauksessa kuultavissa kappaleissa sanoitusten tekoon Gemma 3:n 4b mallia mitä ajoin myöskin omalla koneellani käyttäen LM Studiota.
Kappaleet syntyvät tekoälyllä myöskin suhteellisen nopeasti, eli konetehoa ei aivan järjettömiä vaadita. Omassa koneessani on NVidia RTX 4060 Ti jossa on 16 GB VRAMia ja tällä kappaleet yleensä tulee muutamissa minuuteissa.
On hyvä mainita myös että ACE-Steppiä parempia ja kehittyneempiäkin tekoälytyökaluja on kyllä tarjolla, tai näin ainakin olen käsittänyt. Suno on yksi sellainen, mutta omakohtaista kokemusta itselläni ei sen käytöstä ole. Syynä tähän on se, että en ole erityisemmin kiinnostunut tekoälytyökaluista joita en voi ajaa omalla koneellani vailla rajoituksia käytölle.
Laitan tähän muutamia testauksia joita tällä olen generoinut. Näissä huomaa kyllä vielä virheitä, paikoitellen jopa kauhean kuuloisia kaikuja ja muita häiriötekijöitä mutta nämä on valittu muutaman generoinnin perusteella tehdyistä kappaleista. Mikäli tällä työkalulla haluaa tehdä parempilaatuisia kappaleita täytyy niitä vain generoida useampia kunnes työkalu sylkäisee ulos enemmän korvia hivelevän vaihtoehdon.
Lisäksi tässä työkalussa on mahdollista muuttaa osa kappaleesta jota voi koettaa josko se korjaisi ongelman. En ole itse sitä ominaisuutta kuitenkaan vielä testannut.
Haikea kappaleTekoälyn näkemys Hip-HopistaKepeää metallia
Kaikenkaikkiaan ensikokemukset ACE-Stepistä vaikuttavat mielenkiintoisilta. Tekoälyn kehitys on ottanut huikeita askeleita muutaman viime vuoden aikana, joten on mielenkiintoista seurata mitä tulevaisuudessa tapahtuu seuraavien vuosien aikana.
Halusipa tai ei, tekoälyn kehitys menee mitä luultavamminkin eteenpäin ellei jotain isompaa yhteiskunnallista kriisiä tule sen kehitystä estämään – ja silloinkin kehitys luultavasti menisi eteenpäin, ainakin aseteollisuudessa.
On helppoa ymmärtää mikäli monella taidetta tai muuten luovaa työtä tekevällä on negatiiviset näkemykset tekoälyn kehityksestä. AI:llä voidaan tuottaa tekstiä, musiikkia, videoita, valokuvia ja erilaisia ääniä jo nyt ilmaisilla työkaluilla moneen käyttöön tarpeeksi riittävällä laadulla joka on tietenkin uhka monen luovan alan työntekijälle nyt ja tulevaisuudessa.
Näiden työkalujen yhteiskunnallisten puolien mietintä jääköön toiseen kertaan, sillä tämän tekstin tarkoituksena on ainoastaan kertoa tätä blogia lukeville tavallisille ihmisille että minkälaisia työkaluja on jo olemassa että tietää miten maailma parhaillaan makaa.