queen and king in | Ai

two AI portals with the same input prompt.

#AI made huge progress during spring and summer 2022. there are a handful portals based on big scale training of neural networks and then offering a text to image workflow. in the example(s) above the same input prompt was used:

“A detailed portrait of Queen Elisabeth II and Charles III. Painted by a Ming Dynasty painter. Highly detailed dress and suit. A crown of ketchup for both.”

please keep in mind that the AI “diffusion” process offers an unlimited amount of outputs for our simple text. for a start, DALL E2 offered four variations, as did midJourney.

i find the simularities striking, because often the two systems create totally different scenarios. both respect the aesthetics of the ming dynasty (1368 to 1644). both mix the “real” queen and king faces with possible chinese counterparts. we see detailed structures of gold, red and black in the couple’s outfit. both systems have improved as to eyes and hands.

eye problems

there are still minor irritations in the eyes. DALL E2 does a good job with one hand, but not with the right hand of the queen. midJourney shows no hands at all, only glimpses of misplaced fingers of the queen. midJourney seems to not have learnt the concept of sleeves and leaves them empty. and it does not know anything about mother and son. probably because charles became king just recently, and there were not enough training data available.

both backgrounds are exellent. they not only respect my input-wish for portraits (no distracting background) but also introduce a humble blend of colours: a dark brown and a dark turquoise. both systems disrespect my wish for ketchup crowns – maybe out of respect for the royals?

thanks to michael interbartolo III who created the midJourney version with my prompt!

elektrisch | laden sept. 22

waldschrat (unten links)

wir wohnen in der großstadt und sind umgeben von elektro-ladesäulen für e-autos. als wir bis vor kurzem noch einen benziner fuhren, war uns das nicht bewusst. die meisten ladestellen sind unauffällig in parkbuchten untergebracht. wir wussten auch nichts von den beitreibern und lade-karten und lade-apps. aber das ist eine andere geschichte.

unser elektro-vehicle (EV) der mittelklasse hat einen akku mit 60 kilowattstunden (kWh) energie. in einem mischbetrieb aus stadt, land und autobahn verbraucht er etwa 15 kWh auf 100 km. in der stadt sind es deutlich (!) weniger, bei 150 km/h auf der autobahn deutlich mehr. auch die jahreszeit, sprich die umgebungstemperatur spielt eine rolle. angeblich sind die 15 kWh / 100 km ein mittelwert übers ganze jahr. wir fahren meist in der stadt, wo der verbrauch bei 12 kWh liegen mag, und auf autobahnen bleiben wir meist bei 130 km/h, wodurch wir vielleicht auf 17 kWh kommen.

diese rechnung ist quasi die „währung“, die wir von verbrennern kennen: der benziner braucht sagen wir mal 7 liter auf 100 km. diese 7 liter kosten im moment etwa 14 €. was kosten denn die 15 kWh des elektrischen autos, mit denen es 100 km weit fährt? dazu folgende grafik von einem ladevorgang dieser woche:

ladevorgang

wir haben 24 kWh geladen, wofür wir 10 € zahlten. 24 kWh entsprechen etwa 180 km reichweite. der preis liegt also bei 6 € pro 100 km – und damit bei weniger als der hälfte eines benziners. der wirkungsgrad des verbrenners ist im verhältnis zum EV katastrophal schlecht, die CO2-bilanz sowieso. (auch wenn ich natürlich über den ökologischen rucksack des akkus bescheid weiß.) das elektrische fahren mit einem mittelklassevehikel ist unvergleichlich angenehmer und ansprechender als mit einem verbrenner.

zurück zu den zahlen. ich erhalte für einen euro 2,3 kWh energie. eine kWh kostet in meinem beispiel 50 cent. diese preise können sich erhöhen. einige anbieter, wie aldi und lidl haben schon eine deutliche erhöhung vollzogen.

beim elektrisch laden gibt es außer den kilowattstunden und euros eine weitere “währung”, die der verbrenner allerdings nicht kennt: die zahl 33 minuten in der rechnung oben. dies ist die ladegeschwindigkeit. grundsätzlich gilt: je langsamer, desto billiger und desto schonender. wir haben schon für 30 cent, aber auch für 80 cent elektrisch getankt. das beispiel oben ist ein ladevorgang mit CCS. das heißt: gleichstrom und relativ schnell. und es heißt auch: anders als bei benzin und diesel lohnt sich beim elektrisch “tanken“ der preisvergleich. die preisunterschiede sind erheblich.

1950s AI | car race

#AI image from text

my text input for the image above was this:

“A Citroen 2CV car is filled with 10 people. Lots of heads, arms, feet and hands are sticking out of the windows. The car is running at high speed through a french village. We see motion blur in this cinematic 1960s photograph.”

the AI ignored several wishes i had, but all in all it created a convincing image. motion blur certainly helps to convey the idea of the small car filled with lots of people. the #DALLE_2 system offers the extension of an image. it creates four variations to a new text input, and i chose one for the left and one for the right “outpainting”. in the right part i wanted the car race to end in an open field of grass. in the left part i wanted to see more of the french village, with the ruin of an old church. AI followed the black and white blurred grass style on the right. on the left it ignored the black and white photo aesthetics and the motion blur. but it extended the village street quite nicely:

AI extensions on the right and on the left.

reverse | engineering AI

the image on the very left is the only true photograph in this collection. i got it from somewhere on facebook and had to blur the background because it contained human faces. without the faces directly visible i asked #DALLE 2 to create variations. interestingly all four #AI variations seemed to understand the misshaped real photo and put things back correctly. we could call this quite intelligent process reverse engineering.

“jugo”urlaub | september 1980

rab, jugoslawien, 16.9.1980

“Die paar jugoslawischen Worte, die nach einer Weile hängenblieben und die wir nach einer Weile gezielt einsetzen, sind – böse betrachtet – der Gipfel der Frechheit gegen dieses Land. Wir nehmen uns, was wir brauchen, und wenn wir gehen werfen wir’s weg.”

EV | charging hickups

waiting at a charging station.

i‘m a newcomer to electric charging my car. but i‘ve learnt a lot. what‘s easy is using my “internalized“ map: i know where and how to charge the vehicle close to my home. on the road it‘s different, and on long distance rides even more complex. if you stick to the same provider who has a decent network of charging parks near the autobahn, you‘re fine. that‘s one of the things i‘ve learnt.

when parking my car at a charging station which is new to me, things might work out well. but often they don‘t. the EV phase we’re living in may remind automobile historians of the early days of combustion engines when the chauffeurs had to buy petrol at the drug store. of course, not all drug stores had petrol for cars, and obviously the petrol mixes varied from store to store.

with EVs these days here are three major “issues“:

there are RFID cards, “contactless“ smartphones, apps. often they interfere with each other. example: yesterday i used the app of a certain meta-provider. the app wanted me to start charging by pressing “charge now“. at the same time the display of the charging station asked me to confirm the charging process by pressing a physical button. which i did. — charging stopped immediately.

if you have, say, 3 cards or apps which are compatible with a certain charging station, you have to compare prices. this is a tedious process. example: i used card A for charging and later found out that card B would have been better. contactless smartphone check-in with google pay would have been more expensive.

different charging stations demand different sequences of using the app/card and plugging in the cable. some need the cable to be connected before starting the whole process. others want to start with the card or app. if you restart the registration you might need to unplug the cable from your car, so the car knows the charging process failed.

interesting times. we‘re already in a consolidation process. in five years time there will be standards like for petrol stations these days.

#AI extending an | image

in september 2022 openAi.com introduced the beta version of image extension using #DALL-E2. this “outpainting” process is costly. it’s easy to burn 10 or 20 of your credit points without really good results. in my example below, which i created via different text inputs, you see stylistic discrepancies on the left and right. the atom structure on the left with its colour ramps does not follow the main theme with its beauty of a cartoon sketch. the wheat grain breaks again with the style. on the right we see the bowl with fruits which by itself is okay, but it does not fit in the whole image.

starting image
after 5 extensions

in the image below the extension at the bottom left was quite successful. all my efforts to get a nice outcome for the bottom right failed. for unknown reasons DALL-E2 insisted on placing weird text fragments there.

there are many amazing examples of large images created with this process. however, if openAi wants us to beta test the “outpainting” feature we need free credits to do so.

autoladen für | 1,01 €

ein bisschen übung haben wir im aufladen des neuen elektro-autos. hier ein beispiel, bei dem über einen minutenpreis, nicht nach energiemenge abgerechnet wird. eine fast gemütlich langsame ladestation, die angesichts der fast vollladung, von der ich startete, nur noch im schleichmodus laden durfte. noch vor einigen jahren, als das innenleben von lithium-ionen-akkus nicht so gut bekannt war, lud man von anfang bis ende einigermaßen schnell. heute drosselt das fahrzeug die energiemenge ab etwa 80% akkuladung auf ein minimum. von 20 auf 30% kann locker in 5 minuten geladen werden, von 91 auf 100% dauert es etwa eine halbe stunde. hier also eine typische abrechnung:

von unten nach oben: der tarif ist 4 cent pro minute. ich habe 24 minuten aufgeladen und dabei eine energie von 7 kWh in den akku des wagens einfließen lassen. das kostete mich 1,01 €. oben stehen die werte etwas präziser.

der stromvermittler war in diesem fall chargemap. chargemap leitet pro ladevorgang einige cent für sich ab. unsere erfahrung mit dieser ladekarte (karte nötig, app reicht nicht) ist gut. eine vielzahl verschiedenster stromanbieter akzeptierten die karte.

autobahn with | snow

in computer graphics, snow is problematic. not for AI. the neural network makes “mistakes”. the image below is full of artifacts and misconceptions: one car has only a single tire. there’s something odd about the trees etc. but all in all AI did a remarkably precise job. just look at the shadows, the colour of the snow, the stranded vehicles on the right side. they even have tracks behind them. what the AI also seems to “understand” is the concept of right hand autobahn traffic.

DALL-E 2-image via my personal prompt

london rain | with bus

all image sequences come from the same prompt and were created in #AI within a few seconds. i only exchanged the painter’s name. we start with the style of two 19th century japanese painters. the third image sequence is in the style of the dutch 17th century painter jan vermeer. and i end with four contemporary pencil drawings and a more abstract wassily kandinsky version.

style: ukao uchiyama

style: Jan Vermeer

style: pencil drawing
style: wassily kandinsky

AI art and | realism

four more examples from my test-to-image-AI adventures. click on the image to see it in full resolution. the snails were supposed to race against a rabbit. AI seemed to ignore both the rabbit and the race. i wanted a dark red racetrack with white stripes. well then.

the second image was about two women rushing to the theatre before the doors close. wonderful aesthetics, from just two brief sentences.

the truck: i wanted the driver to sit on top of the truck. no driver visible. check out the tires. AI has problems with human eyes – and obviously with tires.

in the fourth image my prompt was about a woman turning her head away from the camera, in a 1920s scene with cars and horses. and heavy wind in the street. great.

nicht-tesla an | supercharger

tesla baute für seine elektroautos ladestationen auf, zunächst in den USA, dann auch im rest der elektromobilen welt. die “supercharger” sind üppig ausgestattet, sowohl von der anzahl der ladesäulen, als auch von der ladegeschwindigkeit. übrigens nur ein steckertyp, nämlich CCS, also der gleichstrom-doppelstecker. die EU verpflichtet tesla nun, die stationen auch für nicht-tasla-fahrzeuge zu öffnen. das ist zum beispiel in belgien und frankreich passiert, in deutschland aber fängt es erst an. und es geht so:

renault e-auto an tesla ladesäule

an den säulen gibt es kein display, also auch keine möglichkeit, eine karte oder das smartphone dranzuhalten, um sich zu legitimieren und den ladevorgang zu starten. ein teslafahrer lädt hier einfach, indem er das kabel in den wagen einsteckt. die ladesäule erkennt das auto, die kontonummer des fahrers.

um einen nicht-tesla aufzuladen, benötigt man die tesla app. diese unterscheidet klar zwischen den tesla-only und den für andere offenen stationen. um auszuprobieren, ob das funktioniert, fuhr ich heutemorgen ins nicht weit entfernte erftstadt und stellte mich nah an eine der vielen – angeblich auch für einen nicht-tesla verfügbaren – ladesäulen. die app ist zwingend notwendig und begrüßt uns, nach eingabe von konto- oder kreditkartennummer und adresse so:

die tesla-app

a) das ist die ladegeschwindigkeit. da gibt es nichts zu meckern.

b) es waren, als ich am morgen nachsah, fast alle der 28 ladeplätze frei. als ich ankam, standen etwa 7 teslas und ein nicht-tesla da. also noch genug platz.

c) der tesla-ladepreis ist fast doppelt so hoch wie zum beispiel bei aldi.

d) die blockiergebühren sind üppig. wenn man den voll geladenen wagen vergisst, kann die stunde mit 60 € zuschlagen. andere anbieter berechnen typischer weise 10 cent pro überzogener minute.

e) hier steht, wie man zu laden beginnt: erst (mit einem kleinen ruck) den stecker aus der säule ziehen und über das sehr kurze kabel ins auto stecken. dann die nummer der ladesäule wählen.

nach ein oder zwei minuten nachdenken beginnt der ladevorgang. die app sieht dann zum beispiel so aus:

transparente ladekosten beim ladevorgang

hier ist eine laderate von 43 kW angegeben. diese steht im widerspruch zu den oben beworbenen 250 kW. ein scheinwiderspruch, weil der akku meines wagen, als ich ankam, noch 67% voll war und das system dann nicht schnell laden darf. beim akkustand von 20% sähe das anders aus.

AI | electric car

original photo (with blurred number plate)

i fed this photograph into a neural network (openAI.com, DALL-E2). i then asked for variations and got three, one of which is the image below. i guess AI did not read the number plate (with the E at the end; in germany it stands for electric vehicle). but it identified the car properly as an electric car. that‘s why we see some kind of wallbox in the AI garage. again: good work with semantic understanding.

AI generated variation with wallbox.

AI | people

threefold contemplation
deeply in love, deeply devoted
elderly woman, veronese bronze, tongue, smartphone
elderly man, veronese bronze, tongue, smartphone
young man, veronese bronze, tongue, smartphone
young woman, veronese bronze, tongue, smartphone
barkeeper with lots of mini lights
gee, someone stole my data!
plato and socrates discuss politics
grainy parents in love

AI for | Klettenbergpark

this time i entered a german location in german language as the prompt: “Köln Klettenbergpark … 4K cinematic shot, wide angle, from above.” the AI seems to understand the concept and offers 4 variations for each text input. in one case my phrase contained the instruction “in bright summer sunlight”, in another “evening fog”. i needed to add “lake” to the phrase in order to change the park to a park with a lake.

click on the image below, and wait 10 seconds for the next set of four appearing. enjoy!

DALL-E 2 works on a park in cologne, germany.

proper | face

DALL-E 2 creates amazing images from text. midjourney does it in more or less the same way. the two systems differ in terms of the learned data. that‘s maybe the reason of a better handling of human faces.

flat | earth

AI seems to find it hard to follow the conspiracy theory of a flat earth. here i entered this as text: “flat earth, surrounded by red rivers. in the middle a half finished cathedral with 5G antennae.“ the image was created by #midjourney.

shake | hands

in this AI from text to image task i wanted lenin to shake hands with marx. #midjourney AI seems to not know how to shake hands properly. and: who is marx in this rendering?