Het leven als een optimalisatieprobleem

12 december 2025

Een speelse denkoefening met filosofie, AI en het dagelijks leven

Het leven gaat snel. We zijn voortdurend aan het rennen, werken, zorgen voor anderen, of tijd aan het doorbrengen met de mensen van wie we houden. Elke dag maken we tientallen keuzes over waar we onze aandacht en energie aan besteden. Vroeg in ons leven worden we voorbereid op het “werkende leven” en proberen we carrière en privé zo goed mogelijk in balans te houden. Maar doelen veranderen.
Sommige mensen willen trouwen, een huis kopen of kinderen krijgen. Anderen willen de wereld rondreizen of een eigen bedrijf starten.

Het is veel om te combineren, en elke levensdecade herschikt opnieuw wat belangrijk is. Ik wil laten zien dat we dit alles kunnen begrijpen via een vereenvoudigde lens:

Het leven gedraagt zich als een optimalisatieprobleem; of we het ons nu realiseren of niet. We zijn altijd aan het optimaliseren.


De drie levensvaluta’s

Een nuttig startpunt is erkennen dat het leven is opgebouwd uit drie fundamentele valuta’s. Dit zijn de middelen die je je hele leven lang uitgeeft, uitwisselt en investeert:

  • tijd
  • kennis
  • geld

Deze valuta’s beïnvloeden elkaar en zijn tot op zekere hoogte onderling inwisselbaar:

  • Om geld te verdienen, besteed je tijd en pas je kennis toe
  • Om kennis te vergaren, investeer je tijd of geld (opleidingen, mentoren, ervaring)
  • Om meer tijd te creëren, geef je geld uit (delegeren) of gebruik je kennis (slimmer werken)

Deze uitwisselingen vormen in stilte vrijwel elk resultaat in je leven. Ze bepalen welke deuren vandaag voor je opengaan en welke over tien of twintig jaar. Hoe snel je valuta’s groeien of juist afnemen hangt af van je gedrag (inkomen versus uitgaven, leren versus stagnatie).


Valuta’s voeden doelen

Het leven draait niet alleen om het verzamelen van valuta’s. Valuta’s zijn inputs. Waar we werkelijk om geven zijn de uitkomsten die ze mogelijk maken. Wanneer je alle ruis en trends wegdenkt, ontdekken de meeste mensen dat ze in essentie dezelfde vijf universele doelen proberen te optimaliseren:

  • Healthspan
  • Betekenisvolle relaties
  • Meesterschap en groei
  • Autonomie en vrijheid
  • Doel en impact

Healthspan (niet alleen lifespan) gaat over zo lang mogelijk gezond blijven. Het omvat fysieke gezondheid, mentale veerkracht en voldoende energie om te leven zonder voortdurende pijn of uitputting. Een lang leven is betekenisloos als je niet gezond genoeg bent om ervan te genieten.

Betekenisvolle relaties bestaan uit meerdere lagen: intimiteit met een partner, verbondenheid met familie en vrienden, en het gevoel van verbinding dat ontstaat door bij te dragen aan een gemeenschap. Mensen zijn sociale wezens; relaties zijn geen optie maar een fundament. Relaties groeien door herhaalde acties: geuite liefde, gegeven aandacht, geoefende empathie.

Meesterschap en groei gaan over beter worden in de dingen die je belangrijk vindt.
Vooruitgang in vaardigheden, competentie en begrip geeft een gevoel van momentum.
Een goed leven heeft een leercurve — eentje die je trots maakt op wie je aan het worden bent.

Autonomie en vrijheid geven je controle over je tijd en je keuzes.
Niet iedereen kan de baan of levensstijl kiezen die hij wil, maar bijna iedereen verlangt naar meer optionaliteit. Financiële stabiliteit — en uiteindelijk vermogen — vergroot deze vrijheid aanzienlijk.

Doel en impact komen voort uit de drang ertoe te doen. Voor sommigen betekent dit nalatenschap; voor anderen simpelweg weten dat hun inspanningen iemand helpen. Doel begint vaak met één stille vraag:
“Deed wat ik vandaag deed er eigenlijk toe?”

Samen vormen deze vijf doelen de ruggengraat van een goed geleefd leven.


Hoe doelen levensdoelen worden

Elk van de vijf doelen correspondeert met een diepe menselijke vraag:

  • Healthspan: “Kan ik een lang, energiek leven leiden zonder pijn?”
  • Relaties: “Ben ik geliefd, verbonden en gesteund?”
  • Meesterschap: “Groei ik uit tot de persoon die ik wil worden?”
  • Autonomie: “Heb ik controle over mijn leven, of controleert mijn leven mij?”
  • Doel: “Doet dit alles ertoe?”

Je levensdoelen zijn simpelweg jouw persoonlijke prioritering van deze universele doelen. Bijvoorbeeld:

  • Een 22-jarige optimaliseert vaak voor meesterschap en autonomie
  • Een 45-jarige voor healthspan en relaties
  • Een 70-jarige voor doel en rust

Onze doelen verschuiven mee met wie we worden.


Waarom we geen supermensen worden

Zelfs als we de drie valuta’s en de vijf levensdoelen begrijpen, lopen we tegen een onvermijdelijke waarheid aan:

Het leven heeft grenzen. En die grenzen bepalen de vorm van onze strategie.

We kunnen niet alles tegelijk optimaliseren. Iedereen opereert binnen een set beperkingen — grotendeels universeel, deels persoonlijk:

  • Tijd is vast: 24 uur per dag, en ons subjectieve tijdsgevoel versnelt met de jaren
  • Sterfelijkheid legt een harde, onbekende bovengrens op het spel
  • Biologie bepaalt onze genetica, ons herstelvermogen en het tempo van veroudering
  • Psychologische bandbreedte begrenst hoeveel aandacht, discipline en emotionele belasting we aankunnen
  • Economie legt beperkingen op via inkomen, verplichtingen en realistische trade-offs
  • Relaties bepalen wat mogelijk is, omdat niemand een leven optimaliseert in isolatie

Deze grenzen maken het leven niet slechter; ze geven het vorm en maken het strategisch. Een leven zonder beperkingen zou niet vrij zijn, maar betekenisloos. Beperkingen maken strategie noodzakelijk en betekenis mogelijk.


De dagelijkse state die alles bepaalt

We hebben nu alle hoofdonderdelen: de drie valuta’s, de vijf doelen en de beperkingen die ons kaderen.
Maar er ontbreekt nog één cruciaal ingrediënt:

Je interne state —
het element dat elke dag verandert.

Zelfs met dezelfde middelen presteren mensen verschillend, afhankelijk van hun toestand.
Je slaap, stress, voeding en emotionele stabiliteit bepalen hoe effectief je tijd, geld en kennis omzet in betekenisvolle uitkomsten.

Deze interne state-variabelen fluctueren voortdurend:

  • Slaapkwaliteit
  • Stressniveau
  • Emotieregulatie
  • Focus en cognitieve bandbreedte
  • Voedingsstatus
  • Herstel en vermoeidheid
  • Stemmingsstabiliteit

Dit zijn de inputs die de doelen voeden. Het zijn geen doelen op zich, maar modifiers.

Goede slaap, stabiele emoties en gebalanceerde stress kunnen je effectiviteit versterken. Slechte slaap, emotionele onrust of uitputting kunnen je prestaties dempen — in extreme gevallen bijna tot nul.

Dit leidt tot een belangrijk principe:

Je dagelijkse state bepaalt de efficiëntie waarmee je je langetermijndoelen kunt nastreven.
Ze kan je inspanningen versterken of volledig ondermijnen.

En hier begint het leven te lijken op een optimalisatiefunctie.

OMG, wiskunde (maar geen zorgen)

De uitwisselingen die je elke dag maakt vormen de structuur van je leven. Ze bepalen welke opties je nu hebt en welke er over tien of twintig jaar zullen bestaan. Om dit scherp te maken hebben we een klein beetje wiskunde nodig; niet om te intimideren, maar om te verduidelijken.

De inputs: levensvaluta’s

Op elk moment heb je slechts controle over drie fundamentele middelen:

r=[tijd,geld,kennis]\mathbf{r} = [ \text{tijd}, \text{geld}, \text{kennis} ]

Deze resource vector representeert wat je elke dag kunt besteden. Alles wat je doet (werken, rusten, leren, zorgen, creëren) is een allocatie van deze drie valuta’s.
Maar hier is het cruciale punt:

Middelen zijn inputs, geen uitkomsten.

Je kunt de dingen die er in het leven het meest toe doen niet direct kopen.

De outputs: levensdoelen

Waar we daadwerkelijk om geven zijn vijf uitkomsten:

O=[Health, Relationships, Mastery, Autonomy, Purpose]\mathbf{O} = [\text{Health},\ \text{Relationships},\ \text{Mastery},\ \text{Autonomy},\ \text{Purpose}]

Maar — en dit is belangrijk:

Je kunt doelen niet direct “kopen”.
Je moet middelen omzetten in doelen via inspanning, keuzes en actie.

Deze doelen zijn niet te koop. Ze moeten worden verdiend door consistente actie over tijd. Elk doel groeit via een ander conversieproces. Formeel:

Oi=fi(r)O_i = f_i(\mathbf{r})

Gezondheid verbetert wanneer je tijd en kennis investeert via slaap, beweging en herstel. Relaties groeien wanneer je tijd, aandacht en emotionele energie investeert. Meesterschap groeit door tijd besteed aan oefenen en leren. Autonomie groeit door geld dat opties creëert en kennis die leverage oplevert. Doel groeit door tijd en inspanning gericht op betekenisvolle bijdrage.

Dezelfde middelen kunnen dus zeer verschillende uitkomsten opleveren, volledig afhankelijk van hoe ze worden toegepast. Dit conversieproces is waar het leven interessant wordt.

Nu we het vocabulaire, de valuta’s en de doelen hebben gedefinieerd, kunnen we het idee omzetten naar een wiskundig model. Dit is het punt waarop het leven begint te lijken op een optimalisatiefunctie, omdat middelen via actie moeten worden omgezet in uitkomsten, en de effectiviteit van die omzetting afhangt van factoren die we nog niet hebben gemodelleerd.

De verborgen multiplier: je dagelijkse state

Zelfs met identieke middelen behalen mensen niet dezelfde resultaten. De conversie-efficiëntie verandert van dag tot dag. Je slaap, stress, voeding, stemming en cognitieve belasting bepalen hoe effectief middelen worden omgezet in vooruitgang. We modelleren dit met een efficiëntiecoëfficiënt:

η(State)[0,1]\eta(\text{State}) \in [0, 1]

Wanneer je uitgeput of overweldigd bent, nadert η\eta nul. Wanneer je uitgerust, gefocust en emotioneel stabiel bent, nadert η\eta één. De meeste dagen zitten daar ergens tussenin.

Deze coëfficiënt kan je inspanningen zowel versterken als afzwakken. Hij verandert je doelen niet; hij verandert hoeveel waarde je uit dezelfde inspanning haalt.

Je dagelijkse state bepaalt de efficiëntie van je life engine.

Dagelijkse waardecreatie

We combineren nu middelen, efficiëntie en je verschuivende levensprioriteiten.
Niet alle doelen zijn op elk moment even belangrijk. Hun relatieve gewicht verschuift per levensfase. Vroege levensfasen leggen de nadruk op meesterschap en autonomie. In de middenfase krijgen gezondheid en relaties meer gewicht. Latere jaren benadrukken vaak doel.

We modelleren dit met gewichten die afhangen van leeftijd en context:

wi(age),i=15wi=1w_i(\text{age}), \quad \sum_{i=1}^{5} w_i = 1

Alles samengenomen wordt de waarde die op één dag wordt gegenereerd:

Vdaily=η(State)i=15wi(age)fi(r)V_{\text{daily}} = \eta(\text{State}) \cdot \sum_{i=1}^{5} w_i(\text{age}) \cdot f_i(\mathbf{r})

Waarbij:

  • wi(age)w_i(\text{age}) de belangrijkheid van elk doel in je huidige levensfase weergeeft
  • fi(r)f_i(\mathbf{r}) beschrijft hoe je valuta’s worden omgezet in vooruitgang op dat doel
  • η(State)\eta(\text{State}) fungeert als de versterkende of dempende factor van vandaag

Deze vergelijking vangt iets diep intuïtiefs. Dezelfde inspanning levert meer vooruitgang op wanneer je interne state sterk is. Dezelfde inspanning levert minder betekenis op wanneer je prioriteiten niet zijn afgestemd. En zelfs goed gekozen prioriteiten vallen in elkaar wanneer je state uitgeput is.

Dit is de kern van de engine. Elk doel draagt op een andere manier bij aan je totale life score, afhankelijk van je levensfase. Die bijdragen worden weergegeven door gewichten: getallen tussen nul en één die uitdrukken hoe belangrijk elk doel op dit moment is. In de vroege volwassenheid domineren meesterschap en autonomie. Later in het leven krijgen gezondheid, relaties en doel meer gewicht in de vergelijking.

Deze gewichten zijn niet vast. Ze verschuiven naarmate je prioriteiten veranderen. Wanneer je leven verschuift, verschuiven de gewichten mee. Wanneer je state fluctueert, fluctueert je efficiëntie. De interactie tussen die twee bepaalt de waarde van een enkele dag.

Constraints: de muren van het systeem

Zoals elk optimalisatieprobleem heeft ook het leven grenzen. Je kunt middelen niet vrij alloceren, omdat je opereert binnen een vaste container van menselijke beperkingen.

De meest fundamentele beperking is tijd:

rtime24hmaintenance\mathbf{r}_{\text{time}} \le 24h - \text{maintenance}

Maintenance omvat de onvermijdelijke kosten van leven: slaap, voeding, hygiëne, reizen en logistiek. Dit is waarom de meeste “perfecte schema’s” falen; ze negeren maintenance. Wat overblijft is je bruikbare tijdbudget — je echte beslissingsruimte.

Er is ook een psychologische beperking:

stress(r)psychological bandwidth\text{stress}(\mathbf{r}) \le \text{psychological bandwidth}

Ga je voorbij je bandbreedte (bijvoorbeeld door te veel taken, te veel emotionele belasting of te veel druk), dan verschijnt de straf de volgende dag:

ηtomorrow\eta_{\text{tomorrow}} \downarrow

Je efficiëntie stort in. Taken voelen zwaarder. Vooruitgang vertraagt. Motivatie vervaagt. Je zet middelen veel minder effectief om in doelen. Zelfs eenvoudige taken voelen trager, zwaarder of emotioneel lastiger.

Biologie en sterfelijkheid verschijnen niet als expliciete constraints omdat ze op een dieper niveau van het systeem opereren. Biologie vormt de conversiefuncties zelf: herstelsnelheid, blessurerisico, cognitieve stamina en basisenergie beïnvloeden hoe middelen worden omgezet in uitkomsten. Sterfelijkheid definieert de bovengrens van de integraal. Het is de horizon van het optimalisatieprobleem, niet een variabele erin.

Constraints maken het leven niet slechter. Ze geven het structuur. Ze bepalen de vorm van het leven.
Ze zijn de muren van het optimalisatieprobleem dat je probeert op te lossen.
Ze zijn wat bestaan verandert in strategie.

De cumulatieve score: wat een leven werkelijk is

Geen enkele dag definieert een leven. Het leven is de som van duizenden dagelijkse waarden, minus entropie.

LifeScore=0T[Vdaily(t)entropy(t)]dt\text{LifeScore} = \int_{0}^{T} \left[ V_{\text{daily}}(t) - \text{entropy}(t) \right] dt

De bovengrens TT is vooraf onbekend. Die onzekerheid is sterfelijkheid.

Entropie staat voor veroudering, willekeur, verval van vaardigheden wanneer ze niet worden gebruikt, het verliezen van relaties wanneer ze worden verwaarloosd en de achteruitgang van gezondheid over tijd. Entropie is wat er gebeurt als je jarenlang leg day overslaat.

Entropie kan niet worden geëlimineerd, maar wel consistent worden tegengewerkt door beter state-management en betere allocatie van middelen. Entropie wordt hier niet veroorzaakt door inspanning, maar door verwaarlozing en tijd.

De integraal is simpelweg een manier om te zeggen dat een leven niet wordt bepaald door één dag, maar door de optelsom van duizenden dagen — elk met zijn eigen state, constraints, beslissingen en entropie. Kleine verbeteringen stapelen zich op. Kleine verwaarlozing ook. Je life score is de som van alles wat je deed, alles wat je onderhield en alles wat je liet vervallen.

De simpele versie (weer met beide benen op de grond)

Als dit alles abstract aanvoelt, dan is hier de intuïtieve vorm van het model:

LifeScore=ω1Healthspan+ω2Relationships+ω3Mastery+ω4Autonomy+ω5Purpose\text{LifeScore} = \omega_1 \text{Healthspan} + \omega_2 \text{Relationships} + \omega_3 \text{Mastery} + \omega_4 \text{Autonomy} + \omega_5 \text{Purpose}

De enige truc is dat de gewichten in de tijd veranderen.

De meeste mensen falen niet door luiheid of een gebrek aan discipline. Ze falen omdat ze hun huidige leven optimaliseren met een verouderde gewichtsfactor. Ze optimaliseren hun veertiger jaren met de prioriteiten van hun twintiger jaren.

Die mismatch — en niet een gebrek aan inzet — is de reden dat veel mensen vastlopen. Op twintig domineren meesterschap en autonomie. Op veertig moeten gezondheid en relaties voorrang krijgen. Op zeventig wordt doel vaak centraal.

De optimale oplossing verschuift altijd.

Travel hack

Een van mijn persoonlijke doelen is natuurlijk reizen. Ik hou ervan deze planeet te verkennen en te zien hoe andere mensen leven. Binnen het levensmodel dat we hebben opgebouwd, heeft reizen een bijzonder interessante eigenschap:

Reizen is een van de zeer weinige acties die bijna elk doel tegelijk kan verbeteren

Het verbruikt alle drie de valuta’s (tijd, geld en kennis) en levert toch op de een of andere manier veel meer op dan het kost.
Reizen genereert vaak winst over de volledige doelruimte:

  • Health (je beweegt meer, je rust anders, je verbreekt routines)
  • Relationships (gedeelde herinneringen, diepere banden)
  • Mastery (nieuwe perspectieven, ideeën en mentale modellen)
  • Autonomy (vrijheid van beweging en keuze)
  • Purpose (de wereld vergroot je gevoel voor betekenis en context)

Conceptueel ziet dit er zo uit:

travel(time,money,knowledge)[H,R,M,A,P]travel(\text{time}, \text{money}, \text{knowledge}) \rightarrow [H, R, M, A, P]

In optimalisatietermen ligt reizen uitzonderlijk dicht bij een multi-objective optimizer.
Dit is wat ik graag the travel hack noem.

Dit is niet universeel waar en ook niet universeel positief. Het effect varieert sterk per persoon, levensfase en omstandigheden. In de taal van het model wordt dit effect bepaald door individuele coëfficiënten.


Travel toevoegen aan de LifeScore

Om het effect van reizen te modelleren, kunnen we reizen behandelen als een additieve bonus over de vijf kernobjectieven:

TravelBonus=λ1H+λ2R+λ3M+λ4A+λ5PTravelBonus = \lambda_1 H + \lambda_2 R + \lambda_3 M + \lambda_4 A + \lambda_5 P

Waarbij:

  • Elke λi\lambda_i aangeeft hoe sterk reizen dat specifieke doel versterkt
    (bijvoorbeeld: λ2\lambda_2 kan hoger zijn als je meestal met dierbaren reist)
  • De λ\lambda-waarden jouw persoonlijke bias vastleggen; reizen beïnvloedt iedereen anders
  • H,R,M,A,PH, R, M, A, P hier staan voor de incrementele doelwinsten die door reizen worden gegenereerd

Omdat reizen episodisch is en niet continu, kan het niet simpelweg één keer aan het einde worden toegevoegd.

Het beïnvloedt de dagelijkse waarde van het leven — en vaak aanzienlijk. Het effect is geconcentreerd in specifieke periodes en vaak intens. De juiste plek om het op te nemen is daarom binnen de integraal, als onderdeel van de moment-tot-moment beloning:

LifeScore=0T[Vdaily(t)entropy(t)+TravelBonus(t)]dtLifeScore = \int_{0}^{T} \left[ V_{\text{daily}}(t) - entropy(t) + TravelBonus(t) \right] dt

Hierbij geldt:

  • TravelBonus(t)TravelBonus(t) is alleen positief tijdens periodes van reizen
  • Op niet-reisdagen geldt simpelweg TravelBonus(t)=0TravelBonus(t) = 0

In dit model is reizen geen doel op zichzelf. Het is een tijdelijke multi-objective optimizer die je score laat pieken wanneer het plaatsvindt.

Met andere woorden:

Reizen voelt niet alleen goed. Wiskundig gezien kantelt het het systeem in je voordeel — kortstondig, maar betekenisvol.


De echte twist: het leven is een reinforcement learning-probleem

Als we een stap terug doen en het volledige model bekijken — valuta’s, doelen, beperkingen, state, reizen en de LifeScoreLifeScore-integraal — ontstaat er iets interessants:

Het leven gedraagt zich exact als een reinforcement learning-systeem.

En zodra je dit ziet, kun je het niet meer ont-zien. Je kent de echte reward function nooit vooraf. Je onderneemt acties, observeert feedback en past je overtuigingen aan. Je balanceert voortdurend tussen exploration en exploitation. Sommige gedragingen versterken zichzelf en verharden tot gewoontes. Als vroeg succes je leert dat overwerken gelijkstaat aan beloning, kan die policy blijven bestaan lang nadat ze je gezondheid en relaties begint te schaden. Andere gedragingen verdwijnen. In de loop van de tijd worden bepaalde policies “sticky” — niet omdat ze optimaal zijn, maar omdat ze vroeg en vaak zijn bekrachtigd.

Je bent voortdurend bezig met online learning in een omgeving die zelf langzaam verschuift. En om het probleem nog lastiger te maken: je eigen lichaam verandert de regels terwijl je ouder wordt.

Wanneer we het leven computationeel modelleren, gebeurt er iets subtiels maar belangrijks. De LifeScoreLifeScore-functie begint zich te gedragen als een reinforcement learning reward signal. Je kent haar niet in gesloten vorm. Je leidt haar geleidelijk af, via ervaring.

Jij bent de agent.
Je onderneemt acties.
Je ontvangt feedback.

Maar die feedback is ruisachtig en vertraagd. Ze komt niet binnen als heldere labels zoals “+10 reward” of “−30 penalty”. In plaats daarvan verschijnt ze als sensaties en signalen: vreugde, spijt, trots, pijn, verbondenheid, burn-out. Je probeert iets. Het voelt beter of slechter. Je past je gedrag aan.

Na verloop van tijd convergeer je naar een policy: je gewoontes, routines, voorkeuren en standaardreacties. Zo ontstaat identiteit. Niet door afzonderlijke beslissingen, maar door de langzame opstapeling van bekrachtigd gedrag. Niemand levert je ground truth aan. Dit is geen supervised learning. Dit is reinforcement learning.

En op een dieper niveau is het reinforcement learning with human feedback (RLHF):

Je bent zowel de agent als de menselijke trainer.
Degene die handelt en degene die evalueert.

Je interne signalen — emotie, betekenis, vervulling, spijt en trots — vormen het reward-landschap dat je toekomstige gedrag traint. Elke dag update het model een beetje. Elke keuze verschuift de policy. Elke ervaring verplaatst de gewichten.

Deze analogie heeft natuurlijk haar grenzen. Mensenlevens zijn geen Markovian systems en betekenis laat zich niet reduceren tot één enkele scalare beloning. Maar de structuur houdt stand: wat je herhaaldelijk bekrachtigt, wordt wie je bent.

Dat is de echte implicatie van dit model.

Je bent altijd iets aan het trainen.
Niet richting perfectie, maar richting consistentie.
Niet richting een eindantwoord, maar richting een stabiele manier van zijn.

Je kunt niet stoppen met leren. Je kunt alleen kiezen wat je blijft bekrachtigen.

Groei is in die zin geen fase. Het is het voortdurende proces van het vormen van de policy waarnaar je leeft.