Lyhyesti projektista

Mainitsin viime viikolla olleessa blogitekstissä Hyvää kuvaa etsimässä lyhyesti että olen aloittanut vähitellen omien vanhojen valokuvien läpikäymisen tarkoituksena laittaa kuva-arkistoni kuntoon.
Koska tämä on erittäin pitkä ja monivaiheinen prosessi, kirjoitan sen etenemisestä vähitellen asioiden edetessä myös tänne blogiini.
Toivon mukaan tästä prosessin etenemisestä ja siihen liittyvistä blogipostausten sarjasta on jotain iloa myös muille valokuvaamista harrastaville joille on sama ongelma kuin itsellänikin – kuvia on kertynyt vuosien mittaan paljon, mutta niiden löydettävyys on huono ja hyvät otokset hukkuvat keskinkertaisten ja täyttä roskaa olevien kuvien sekaan.
Kuten edellisestä virkkeestä voi päätellä on onnistuneiden, hyvien tai muuten säästämisen arvoisten kuvien löydettävyys merkittävin syy kuva-arkiston kuratoinnille, mutta muitakin syitä voi löytää.
Miksi hyvin organisoitu kuva-arkisto on vaivan väärti
Tämän kirjoittamisen hetkellä valokuva-arkistossani on 178.839 kpl kuvia. Aikaisemmin kuvia on ollut enemmänkin, mutta olen kerennyt jo siirtämään 100 % duplikaatit muualle (tästä myöhemmin lisää tässä tekstissä).
Näin suuresta ja huonosti organisoidusta datamäärästä on monien kuvien nopea löydettävyys täysin epärealistinen tavoite, ellei ole muistikuvaa vuodesta miltä vuodelta kuvaa kannattaa edes etsiä.
Tietenkin löydettävyys on nopeaa mikäli muistaa eksaktisti päivän, kuukauden ja vuoden milloin kuva on otettu. Tämä on realismia kuitenkin äärimmäisen harvoin ainakin itselläni, sillä en yleensä muista minä vuonna tai minä kuukautena kävin henkilön X tai Y kuvailemassa paikassa Z.
Suurin ja merkittävin syy kuva-arkiston kuratoinnille onkin itselläni ehdottomasti se, että tavoitteena on luoda uusi Lightroom Classic -kirjasto, missä on vain ja ainoastaan ne kuvat jotka ovat jollain määrää säästämisen arvoisia. Pidän jatkossakin kaikki muutkin yhä kovalevyillä tallessa, mutta uuteen Lightroomin kirjastoon on tarkoitus tuoda vain rajatumpi ja hallittavampi otosmäärä.
Kun kuvien parhaimmisto – tai ainakin muuten vain säästämisen arvoiset otokset – on saatu siirrettyä uuteen kirjastoon, on niihin realistista kirjoittaa otsikot, kuvaukset sekä avainsanat jotka auttavat jatkossa niiden löytämistä. Tämä on tämän koko pitkän prosessin tärkein päämäärä.

Toinen hyvä syy miksi kuratointi kannattaa tehdä on se, että kun merkittävimmät kuvat ovat uudessa kirjastossa on niiden varmuuskopioiminen eri paikkoihin inhimillisempi operaatio.
Jos heitän hatusta että kuvista jäisi 25 % jäljelle, tarkoittaisi se nykyisellä kuvamäärällä että kuvia olisi enää alle 45.000 kpl ja jos kuvia jäisi vain 10 % uuteen kirjastoon olisi kuvia alle 18.000 kpl.
Näistä määristä olisi vielä helpompaa karsia esimerkiksi johonkin pilvipalveluun varmuuskopiointia varten vielä merkittävästi suppeampi joukko, jolloin sinne voisi varmuuskopioida esimerkiksi henkilökohtaisen elämän kannalta merkityksellisemmät kuvat.
Määrällisesti nuokin lukemat kuulostavat suurilta, mutta kuitenkin kun ottaa huomioon että kuvia on kertynyt 21 vuoden ajan ei määrä kuulosta enää niin suurelta.
Jos kuvia jäisi esimerkiksi 25 % eli 45.000 kpl olisi se vuotta kohden ainoastaan alle 2150 kuvaa eli n. 6 kuvaa per päivä. Jos kuvia jäisi vain noin 18.000 kuvaa eli noin 10 %, tarkoittaisi se että kuvia olisi vuosikohtaisesti vain alle 860 kpl eli noin kolme kuvaa päivässä (koska 2,3 kuvaa ei ole tasaluku pyöristän sen ylöspäin koska se on realistisempaa tässä käyttötarkoituskessa).
Tietenkin joinain kuvaamisen alkuvuosina jäljelle jäävien otosten määrät ei tule olemaan edes 500 kpl/vuosi, mutta lähivuosilta 500 kuvaan on epärealistista edes pyrkiä jos samana vuonna on ollut useita häitä ja muita tapahtumia.
Tässä onkin yksi olennainen huomio tämän projektin kannalta – en tee etukäteen minkäänlaista rajaa siihen paljonko kuvia tulen lisäämään uuteen kirjastoon. Määrä voi olla 100 kpl, tai se voi olla vaikka 15.000 kpl. Etukäteen määrätyn maksimimäärän asettaminen ei palvele tarkoitusta omalla kohdallani, sillä toisina vuosina tapahtumia on enemmän ja otosten määräkin sen myötä suurempi kuin hiljaisempina vuosina.
Käytännössä jäljelle jäävän joukon kokoa tulee kuitenkin ohjaamaan realismi – kuinka moneen olen valmis kirjoittamaan metadatat? Metadatan lisääminen on ehdoton osa prosessia, joten on sanomattakin selvää että se tulee myös ohjaamaan käytännön tasolla valittujen otosten määrää.
Ensimmäinen työvaihe – Duplikaattien poisto

Aloitin projektin ensin tekemällä esikarsinnan vuoden 2004 kuville (myöhemmin kirjoitan tästä lisää alempana). Kuitenkin kun siirryin vuoden 2005 kuviin havaitsin että duplikaattikuvat ovat ongelma joka on parempi taklata ennen kuin tuhlaa aikaansa enempää samaan kuvaan monta kertaa.
Koetin muutamia duplikaattien tunnistajaa, mutta omaan käyttööni soveltui maksuton DupeGuru (katso täältä). Alussa asetukset oli pielessä ja se tunnisti duplikaatiksi sellaisiakin jotka olivat hieman erilaisia mutta lähes identtisiä. Kuitenkin kun asetukset sääti kohdalleen eli teki tarkistuksen EXIF-metadatan pohjalta ei turhia tuloksia enää tainnut tulla.
Myöhemmin havaitsin kuitenkin että monia RAW-kuvia on duplikaatteina yhä joten ajoin DupeGurun uudelleen jokaiselle vuodelle, mutta tällä kertaa tein hitaamman mutta varmemman tarkistuksen mikä vertaa tiedoston sisältöä ja ilmoittaa identtiset tiedostot.
Kun olin löytänyt kaikki duplikaatit, siirsin ne kokonaan uuteen kansioon nimelle Photos Potential Dupes. Haluan olla 100 % varma että en poista mitään oikeasti uniikkia kuvaa joten mieluummin siirsin ne vain toiseen kansioon siten että ne eivät tule enää vastaan kun käyn esikarsintaa kuville.
Prosessin aikana olen kuitenkin huomannut että monia duplikaatteja löytyy yhä, sillä monet duplikaatit eivät ole teknisesti ottaen sellaisia vaan sisällöllisesti. Tarkoitan siis sitä, että osa kuvista jotka ovat kaksoiskappaleita saattavat ollla vaikkapa resoluutioa 1500×1400, mutta duplikaatti onkin 1400×1500 ja ilmeisesti metadatassa on kuvan pyöräytystieto jolloin kuvat näyttävät katsottuna samalta, mutta eivät teknisesti sitä ole.
Lisäksi duplikaatteja on tullut vastaan myös siten että samasta kuvasta on editoitu versio ja editoimaton versio koneella eli mikäli tällaisia samankaltaisia kuvia haluaa poistaa täytyy asetuksia säätää lisää tai käyttää muita duplikaattien poistoon tarkoitettuja työkaluja.
Omassa tapauksessani tämä ei ole vielä ollut kovin suuri ongelma vaan itselleni on riittänyt että suurin osa tuplakuvista on saatu poistettua selattavien kuvien listalta.
Toinen vaihe – Esikarsinta

Duplikaattien poiston jälkeen on vuorossa esikarsintavaihe, eli cullaus. Nykyään uusien kuvien kohdalla tämä vaihe osa on jo muodostunut normaaliksi osaksi prosessiani joka on jossain määrin yllättävää, sillä olen toiminut toisella tapaa jo parikymmentä vuotta mutta muutamassa viikossa tästä uudesta toimintatavasta on tullut jo luontainen osa prosessia. Vanhakin koira voi siis oppia uusia temppuja!
Esikarsintavaihe on nyt tapahtuvien kuvauspäivien kohdalla hieman erilainen prosessi kuin tämän projektini vanhojen valokuvien kohdalla. Kun nyt siirrän kuvia tietokoneelle teen esikarsinnan heti loppuun saakka FastRawViewerillä ja siirrän jäljelle jääneet Lightroomiin.
Uusien kuvien kohdalla prosessi menee siis niin, että käyn läpi päivän otokset ja annan suoraan niille arvosanan tähdillä merkkaamalla. Kuva joka on jossain määrin ok saa 2 tai 3 tähteä, hyvä kuva saa 4 tai 5 ja suurin osa kuvista ei saa yhtään tähteä.
Kun olen antanut tähdet kuville, suodatan näkyviin vain ne joilla on 3 tai enemmän tähtiä. Jos kuvia on kymmenittäin teen tämän kierroksen kerran tai pari uudelleen ja tiputan turhimmista otoksista tähtien määrää kahteen kunnes jäljelle on jäänyt järjellinen määrä kuvia siirrettäväksi Lightroom Classiciin.
Näiden vuosia vanhojen kuvien kohdalla prosessi on kuitenkin erilainen. Käyn kuvat läpi kyllä yksi kerrallaan, mutta ensimmäisellä katselukierroksella annan kuvalle vain värikoodatun merkinnän. Jos kuva on mahdollisesti säilyttämisen arvoinen, annan sille keltaisen värin. Olen säätänyt FastRawViewerissä tämän pikanappiin 7, eli kun selaan kuvia nuolilla eteenpäin painan näppäimistöltä numeroa 7 jos kuva on “ok” tai “ehkä ok” mikä nopeuttaa tätä vaihetta huomattavasti.
Tämä esikarsinta on siis vaihe, joka tapahtuu mahdollisimman nopeasti eikä sen aikana tule annettua tähtiä juuri koskaan. Poikkeuksia kuitenkin on, sillä joskus yksittäinen kuva silloin tällöin saattaa saada syystä tai toisesta tähtiarvostelun suoraan, mutta näin on käynyt äärimmäisen harvoin.
Kun olen käynyt vanhojen vuosien kuvia läpi esikarsinnassa ja merkinnyt jatkokierrokselle menevät keltaisella lipulla, en aloita näiden uudelleen selaamista tässä vaiheessa vaan siirryn seuraavan vuoden kuviin. Tämä on siis selkeä ero uusien kuvien kohdalla ja näiden vanhojen kuvien kohdalla.
Syynä tähän seuraavaan vuoteen siirtymisessä heti saman vuoden kuvien uudelleen läpikäymisen ja tähtien antamisen sijaan on se, että haluan tehdä tämän ensimmäisen vaiheen kaikkien vuosien osalta mahdollisimman nopeasti.

Tähtien antaminen on merkittävästi hitaampi prosessi kuin tämä ensimmäinen fiilispohjainen “talteen” vs. “ei talteen” karsinta joka tapahtuu yleensä noin sekunnissa tai parissa, joten kokonaisprosessin sujuvuuden kannalta on tärkeää edetä vuosi kerrallaan ja katsoa seuraavaa kierrosta myöhemmin.
Lisäksi kun olen tehnyt esikarsinnat kaikille vuosille osaan sen jälkeen arvioida kumpaa metodia tulen käyttämään – teenkö esikarsitulle materiaalille vielä toisen esikarsintakierroksen vai siirrynkö suoraan antamaan tähtiarvosteluita.
Jos kuvia on esikarsinnan jälkeen paljon, on luultavaa että teen toisen esikarsintakierroksen joka tapahtuu ainoastaan niistä kuvista jotka on selvinnyt ensimmäiseltä esikarsintakierrokselta. Tällöin toisella kierroksella poistan keltaisen lipun jos kuva ei olekaan tarpeeksi hyvä että sitä kannattaa tähtien antamisen kierrokselle säästää. Jos jäljelle jääviä kuvia taas on kokonaisuutena maltillisempi määrä, on sama siirtyä suoraan antamaan tähtiarvosteluita kuville jotka ovat selviytyjiä esikarsintakierrokselta.
Tämän teksti kirjoittamisen aikaan olen tässä esikarsintavaiheessa. Seuraava vuosi jolle esikarsintaa on tarkoitus tehdä on vuoden 2018 kuvat, eli vuodet 2004-2017 olen jo saanut käytyä läpi. Tähän on mennyt useita tunteja lähes jokaisena iltana noin viikon ajan. Vuodesta 2017 saakka on kuvia tallessa merkittävästi suuremmat määrät kuin aiempina vuosina, joten vuosien 2018-2025 läpikäymiseen tulee menemään tällä tahdilla arvioilta ainakin muutamia viikkoja.
Vuodelta 2018 kuvia on tallessa 8929 kappaletta, eli mikäli jokaista kuvaa katsoisin vain sekunnin ja tekisin siinä ajassa esikarsintavaiheen valinnan saako kuva keltaisen lipun jatkokierrosta varten vai ei, menisi aikaa 8929 sekuntia mikä on noin 2,5 tuntia. Oletettavaa on että monen kuvan kohdalla en tee valintaa sekunnissa, joten jos kuvien katsomiseen menisi kaksi sekuntia per kuva, tarkoittaisi se jo viiden tunnin aikaa mikä pitää varata esikarsintakierrokselle tälle kuvamäärälle.
Myöhempinä vuosina on kuitenkin vuosia joissa määrät ovat kaksin- tai lähes kolminkertaiset tuohon vuoden 2018 kuvamäärään nähden, joten tästä syystä on realistista olettaa että seuraavaa postausta tähän aiheeseen liittyen saattaa joutua odottamaan kuukauden tai enemmänkin ellen jostain syystä innostu istumaan jokaisena iltana tuntikausia tekemässä kuvien läpikäyntiä vanhoille kuville.
Leave a Reply