Project Mamamuso Bikes
In swedish only.
För Mamamuso Bikes se här.
Bäst upplevelse på desktop.
1400 ord : 5-8 minuter
Vad är detta?
Mamamuso Bikes, påhittad tillverkare av landsvägscyklar från Banjul i Gambia, får liv genom en uppdiktad historia och AI-genererade bilder. Bilderna skapades med Open AIs verktyg Dall-E 3. Idéer, texter och redigeringar kommer från mina egna långsamma neuroner. De liksom Dall-E 3s digitala varianter är tränade på omvärlden. Vilka idéer är ens egna och unika? Vilka är endast kopior?
Strävan har varit att försöka få till vackra, dramatiska och mystiska bilder med en någorlunda konsekvent stil.
Genom att blanda landsvägscyklar, afrikanska kvinnor, brunt omslagspapper och ibland också smältande choklad uppnås kanske något unikt. I varje fall något udda. Två egenskaper vilka båda eftersträvades. I bilderna konstrateras typ hetsig högteknologisk elitism (cykeln) mot den lugna naturnära urmodern.
Felen är så många att jag inte orkar räkna upp dem. T.ex. rent tekniskt vad gäller postprocessing behövs åtminstone justering av exponering, färgkorrigering, vitbalansjustering, retuschering och bättre montage.
Jag har varken kunskaperna eller lusten att göra allt rätt.
Trots brister är det nog flera år sen jag kände mig lika engagerad i ett litet fritidsprojekt. Utan att kunna sluta har jag suttit in på nätterna och haft roligt. Det är en intressant skapandeprocess. Ett attraktivt alternativ till nattliga jobbtankar. Jag får känna glädje och tacksamhet i att bli uppslukad av något annat än jobbet. Befriad från komplexiteten i design- och implementationsarbetet av mjukvara på jobbet. Projekt med tydliga slut är lugnande.
Denna text är helt AI-fri och jag har motstått frestelsen att låta ChatGPT kontrollera och redigera den.
Därför behåller den också alla sina fel. Vilket samtidigt kanske är en av människans viktigaste karaktärer.
Vad är Dall-E 3? Vad är AI-bildgenerering?
Dall-E 3 är ett tillägg till ChatGPT, en LLM, alltså Large Language Model, en form av avancerad auto-complete tränad riktigt stora mängder text och bilder. Genom att beskriva en bild i ord kan Dall-E 3 skapa den. Ibland blir det nära det man tänkt sig, ibland inte. Sedan får man variera sin prompt eller ge den andra bilder att relatera till (jag har inte givit den andra bilder). Man får aldrig samma bild två gånger.
Arbetsprocess
Dall-E 3 är bra på att kombinera ovanliga eller omöjliga saker. T.ex. "Ett tiny house som är en avocado" eller "En häst som är en husbil". Efter att ha experimenterat lite med ovanliga kombinationer ville jag sammansmälta två för mig kära områden, landsvägscyklar och mat. Vilken mat kan utgöra intressanta tillverkningsmaterial för en cykel? Efter lite funderade satte jag ihop en lista med mat och initiala prompter. Speciellt bra tyckte jag att en cykel i smältande choklad blev. Jag sorterade alla matcyklar i färgordning och gillade speciellt de bruna av choklad, kaffebönor och pepparkaka med glassyr. Varför inte göra ett kollage med fyra bilder, alla med bruna cyklar? Men vad ska vara den fjärde? Nya produkter omges ofta av mystik. Genom att låta den fjärde cykeln helt eller delvis vara okänd kan det uppnås. Vi täcker den. Brunt omslagspapper passar vår tidigare färgskala och bör vara frekvent i träningsdatan.
Därefter försökte jag hitta på fyndiga och roliga namn, t.ex. "Chocolate Climber C2" och "Arabica Tailwind" för lite substans.
Ur ivern att bygga vidare på cyklarna kom idén till ett cykelmärke. Där finns mycket man kan jobba med samtidigt som det ger en tydlig linje och begränsning. För att göra det mer levande och organiskt ville jag sätta någon på cykeln. Vem? Färg. Unikhet. En afrikansk kvinna? Ja. Det ger kontrasterna. Det högteknologiska möter naturen. En mer ovanlig situation. Vad ska kvinnan ha på sig? Cykelkläder? Nej. Vi återanvänder idén med omslagspapperet på cykeln och tar det till kvinnan. Böljande papper kan också ge en känsla av mjukhet, flöde och fart. Att vara klädd i omslagspapper ger en "arty feeling" och levererar symboliska undertoner. Vi låter färgen brun, omslagspapper och choklad binda samman cyklar, kvinnor och saker över alla bilder. Det ger en röd tråd och underlättar skapandet av bilder med liknande stil över olika objekttyper. Dall-E 3s natur gör det typ omöjligt att sätta samma kvinna i flera bilder. Låt oss bilda ett cykellag istället. Vi vänder ryggen mot kameran i några bilder i flera syften. Det är förlåtande (t.ex. undvika The Uncanny Valley), illusionen om en person i flera bilder kan möjligen upprätthållas samt det bidrar till mystiken.
Efter många produktbilder på kvinnor i profil på cykel var det dags för "verkstadsbilder". Här sökte jag efter enkla rena scener. Ett cykelhjul. Ett eller få verktyg. Med en kvinna som arbetar. Efter denna serie försökte jag skapa bilder som uttrycker vila eller återhämtning. Balansera upp arbete (cykling) med vila. Några av dessa bilder försökte jag få mer dramatiska. Ett av adjektiven jag använt i de flesta bilder är självsäkerhet. Det blir för omfattande att gå in på detaljer, varianter och steg. Iaf. Slutligen försökte jag kombinera bilder i grupper och skapa ett sammanhang, skriva texter och knyta ihop det hela. Det glappar förstås både här och där. Det skulle bl.a. behöva göras mer fylligt. Föresten... Just det. Jag kanske iaf också ska säga något om namnet Mamamuso och loggan. Sona Jobarteh från Gambia är den första kvinnan som spelar instrumentet Kora, tidigare endast för män. Både hennes far och farfar var/är skickliga Koraspelare. Hennes låt Mamamuso, vilket betyder mor-/farmor, är en favorit. Jag lät Dall-E 3 skapa ett trettiotal olika logotyper utifrån rätt snäva beskrivningar. Den valda associerar för mig till traditionella stammar och ger den urkänsla jag sökte. Skivan i bakgrunden kan ses både som en sol och en cykelklinga (krans/kugghjul). Symbolerna framför kan ses både som uråldriga skrivtecken och länkar i en cykelkedja. Perspektivlinjerna ger en illusion av väg och riktning. Den böjda texten återknyter till hjulets runda form och ger liv och rörelse. Bilden i sin helhet ger också intrycket av en figur som tittar på en.
Ofta får man inte det man önska sig utan får göra det bästa av det man får. Så är det i livet. Så är det med Dall-E 3. T.ex. kan man ofta endast använda en del. Eller så inser man att en återvändsgränd är nådd och det är dags att välja ett annat spår. Många gånger är det Dall-E 3 förtjänst att arbetet tar en ny spännande riktning.
Jag skulle tro att jag lagt omkring 25 aktiva timmar för att få ihop det hela. För att få fram tjugotalet bilder har jag skapat flera hundra bilder och kanske ett femtiotal olika prompter har skrivits. En stor del av tiden går till att fundera och experimentera.
Jag har inte givit Dall-E 3 några andra bilder att utgå ifrån. Det finns därför inga direkta upphovsrättsliga kopplingar.
Är det inte fusk? Gör inte AI allt?
Om jag som varken är fotograf eller kan rita med några mening kan skapa professionella bilder (nåja, de innehåller massor av fel) så är det enkelt. Faktum är att enskilda bilder ofta är väldigt enkelt. När sedan man ska pricka något mer specifikt och skapa en helhet blir det svårare. Man får aldrig exakt det man vill ha. Men man kan få något väldigt bra och nytt.
Det är svårt och farligt att jämföra saker. Bildskapande med prompter är svårt att relaterat till något annat. Bäst är nog att låta bli jämförelser.
Precis som för en fotograf kvarstår många val även om objektet är känt och tillgängligt. Fotografen väljer vinklar, objektiv, tekniska kameraegenskaper, ljussättning, påverkar sitt objekt, etc. På samma sätt kan AI-promptskrivaren agera på olika sätt för att styra resultatet. Båda måste välja och hitta objekt och dess kontext.
Det finns många parametrar att skruva på innan man får en lyckad och unik bild.
När väl bilderna är klara behöver både fotografen och AI-promptskrivaren postprocessa bilderna samt välja ett sätt att paketera/presentera dem.
Brister
Du får svårt att här hitta en bild utan logiska eller stilistiska brister. Samtidigt är knasigheten en del av charmen.
Jag hoppas att ingen upplever kvinnorna som objektifierade. Speciellt tveksam har jag varit till bilden med det chokladtäckta ansiktet. Eftersom samtidens fixering vid sensualism och sex tränger in i träningsdatat risker den också att synas i bilderna.
Maskinen kommer aldrig att kunna ersätta förståelsen för objektet, erfarenheten, kontextet, mottagarens känslor, osv. hos en professionell fotograf eller grafiker. Den goda smaken - vilken jag inte gör anspråk på för egen del - förblir människans unika förmåga.
Verktyg
OpenAI Dall-E 3, MS Paint(!), MS Anteckningar(!), rå html+css.
Jag har inte använt några verktyg eller färdiga mallar för form eller stil. Därför respekteras inte stilistiska principer för balans och annat (annat än inbyggt i html+css). Hemsidan är alltså skriven direkt i html+css.
Johan Lindström 2023-12-31