Spelteori –
folkteorem och organisationer av anhängare
Spelteori handlar om att analysera valmöjligheter
matematiskt, i fall där flera aktörer är inblandade. Spelteorin är därmed en
viktig utgångspunkt för försök att konstruera teorier om vilka val som är
rationella i olika situationer. Institutionella ekonomer hänvisar till exempel
till spelteori för sin grundläggande beskrivning av hur organisationer uppkommer.
Jag använder mig här av en introduktion till ämnet av Ken
Binmore, ”Kort om spelteori”, Fri tanke 2012, (Game theory, a very short introduction, Oxford UP, 2007) samt en artikel av John Joseph Wallis från 2010 som lyfter fram de spel som kallas folkteorem i en analys av hur organisationer uppkommer.
Kenneth "Ken" Binmore (född 1940) är professor emeritus vid University London College i matematik, ekonomi och spelteori.
Olika fallstudier inom spelteorin får roliga namn som ska
beskriva vilket spel som avses. Ett enkelt spel är ”bilkörningsspelet”, där
bägge spelarna vinner om bägge antingen väljer strategin att köra på vänster
sida eller höger sida, men förlorar om de väljer att göra olika (då de krockar
eller måste väja om de möts). En så kallad ”blandad strategi” är inte heller så
smart i detta spel, dvs att ibland köra på vänster och ibland köra på höger
sida. Ken Binmore noterar att de inte finns något rationellt skäl för att välja
vänster eller höger, det rationella här är bara att alla måste göra lika. Lösningen
för att välja vänster eller höger är att upprätta en konvention, i detta fall
en trafikregel som godtyckligt avgör vilken sida som ska gälla. Just denna trafikregel
är rätt lätt att få efterföljd på eftersom kostnaden för att göra rätt är så
låg. Andra trafikregler kan vara svårare att få spelarna att följa.
Ett annat spel uppkommer när vägen smalnar av så att man
måste mötas, en trafikteknisk lösning som blir allt vanligare i Uppsala. Detta
spel kallas ”chicken race”, även om
det i vanlig trafik inte förväntas vara en så prestigefull seger att komma
först (Att komma först motsvarar att komma närmast stupet när spelet spelas i
filmen Ung rebell.) Valet står mellan
att köra sakta eller fort. För ett enstaka spel är det rationellt om den ene
kör fort och den andre sakta. Det finns en lösning där båda kör sakta men då är
utfallet sämre för den deltagare som istället kunnat köra fort. Om båda väljer
att köra fort förlorar bägge.
Upprepar man mötet flera gånger får man ett bättre underlag
för vem som ska välja vilken strategi. Detta kallas evolutionär spelteori.
Enligt den matematiska modellen kommer den spelare som oftast kör fort att allt
oftare väja att köra fort tills han eller hon alltid gör det och omvänt, den
som kör långsammare bör då alltid göra det. Möjligheten att man kör varannan
gång fort och varannan gång sakta är liten. Detta illustreras av ett diagram på
sidan 38 i ”Kort om spelteori” som visar olika startpunkter för strategier och
hur de utvecklas mot ett jämviktsläge. Alla de startpunkter som leder till
samma slutliga jämvikt kallas ett attraktionsområde. Mellan dessa områden finns
en diagonal linje. Att det är osannolikt att man kör varannan gång formulerar
Ken Binmore som att ”attraktionsområdet för den blandade jämvikten består
enbart av diagonalen självt”. Tunt som ett streck, alltså.
De jämvikter som talas om här är så kallade Nash-jämvikter.
Spelteorins pionjärer var John Von Neumann (1903-1957, född i Ungern som János Neumann), Oskar Morenstern (1902-1977, född i Tyskland, uppväxt i Wien) och John Nash (1928-2015), alla tre verksamma vid Princeton University i USA.
Det mest kända spelet är ”fångarnas dilemma”. Ken Binmore
redogör för en lättbegriplig variant av spelet. Där är reglerna att två spelare
får välja på att antingen ge den andre spelaren två pengar eller själv få en
peng. De kan inte tala med varandra, de är fångar, dvs spelledaren håller dem
skilda åt. Bägge skulle tjäna på att de båda två gav bort två pengar men
eftersom de inte vet om den andre kommer att göra det så är den rationella
strategin att ta den enda pengen som man är säker på att få. En variant av
fångarnas dilemma med flera spelare är ”allmänningens tragedi”. Varje enskild
spelare tjänar på att överutnyttja allmänningen men den sammanlagda effekten är
att alla förlorar på att agera på det vis som för den enskilde är rationellt.
Ken Binmore insisterar på att man måste förstå att den
enskilde spelaren är rationell i dessa spel. Eftersom spelarna enligt reglerna
är fångar kan de inte se att det finns en gemensam lösning som är bättre än den
som var och en väljer. Detta har kallats ”rationalitetsparadoxen”.
Binmore menar att fångarnas dilemma beskriver ett fall som inte
är betydelsefullt för att förstå mänsklig samverkan. Han skriver att det är ett
spel som är maximalt vinklat för att undvika att samverkan uppstår.
Flera olika förslag att lösa rationalitetsparadoxen bygger
enligt Ken Binmore på önsketänkande. Han påpekar särskilt att han tycker att
Immanuel Kant aldrig lyckades motivera sitt kategoriska imperativ, dvs ange
skälet för att det skulle vara rationellt att göra mot andra det du vill att
alla andra ska göra mot dig. Som jag minns det så upphörde aldrig Kant själv
att förundra sig över sitt samvetes röst.
Altruism är dock inte uteslutet enligt spelteori. Men den
behandlas lite oromantiskt. I ett räkneexempel i "Kort om spelteori" sätts den altrustiske helige Franciskus av
Assisi till värdet 3 och hans motsats Attila till värde 9 i en skala som går mellan 3 till
9. (Detta sätt att analysera problem genom att tilldela spelarna olika typer
utvecklades av ungraren John Harsanyi.)
För att gå vidare med dessa frågor är det de så kallade
folkteoremen som är mest relevanta. Ett enkelt sådant spel är ”lilla
tillitsspelet”. Fallet är att en spelare betalar för något som den andra
spelaren sedan levererar. Ekonomer kallar detta ”hold up”-problemet. Spelarna
får i detta spel förhandla innan spelet genomförs men det finns ingen tredje
part som straffar en spelare ifall man inte följer det avtal man kommit överens
om, spelarna måste kontrollera sig själva. För ett enda spel är det rationellt
för den som tagit emot betalningen att inte leverera. I ett upprepat spel finns
det fler rationella lösningar, det som spelteoretikerna kallar fler
jämviktslägen. Dessa jämviktslägen uppnås genom att spelaren som betalar hotar
med en bestraffning i senare spel ifall inte spelaren som ska leverera följer
sin del av avtalet.
Det finns flera strategier för hur bestraffningen ska
utformas, även dessa har fått roliga namn av spelteoretikerna. Den tydligaste
är den så kallade GRIM-strategin, där en spelare erbjuder möjligheten att nå
jämviktsläge enda tills den andra spelaren avviker från avtalet, om så sker
tillgriper den betalande spelaren största möjliga bestraffning.
Vad är då det
värsta som kan användas som bestraffning i detta spel? På den frågan svarar Ken Binmore att ”det värsta är att avkräva
den andra spelaren dennes minimax-utfall."
Detta är vad som i vardagsspråk är ett utbyte av tjänster.
Jag gör dig en tjänst mot att du gör mig en tjänst, men om du inte gör det så
slutar jag göra dig tjänster eller erbjuder en otjänst. Jag behöver inte
använda GRIM-strategin. Även subtila sociala bestraffningar kan räcka för att
åter nå jämviktsläget, ifall hotet om värre bestraffningar finns i bakgrunden. En
tydlig strategi kallas LIKA FÖR LIKA, då bestraffningen inte är maximal utan så
fort den andra spelaren återgår till jämvikt så gör den bestraffande spelaren
det också.
Folkteoremen utgår från att en spelare kan observera att den
andra spelaren avviker. I en grupp där samma spelare möts upprepat fungerar
detta. På sidan 111 i ”Kort om spelteori” förklarar Binmore att en version av
folkteoremen gäller för det som kallas delspelsperfekta jämvikter. Delspel är
de spel som man går igenom när man reder ut vilken strategi som är bäst genom
baklängesräkning. Genom delspel kan man visa att den bestraffning som ska
utkrävas inte behöver genomföras av den förfördelade, utan det kan ske av någon
annan i gruppen. Binmore skriver att ”om man har ett ändligt antal aktörer är
den här sortens ansvarskedjor med nödvändighet slutna”.
Men i sammanhang där det är nya spelare som möts krävs
antingen att det går att få information om hur en viss spelare agerat i
tidigare spel eller någon form av tredje-parts kontroll. Folkteoremen säger
bara att det kan gå att uppnå samarbete i en upprepad situation, inte att det
måste ske. Spel med tredje parts-kontroll är en annan sorts spel, mera likt
spel med trafikregler och en polis (en typ av våldsspecialist) som kan stoppa
dig om du bryter mot reglerna.
Folkteoremen heter så för att spelteoretikerna hade klart
för sig följderna av upprepade spel även innan detta formellt publicerades av
Robert Aumann. Han tyckte därför att det skulle betraktas som en ”folklig
insikt”. Enligt Binmore hade redan David Hume år 1739 (A treatise on human nature)förklarat hur
ömsesidighet fungerar. I den mån det handlar om ”tjänster och gentjänster” kan
det nog anses vara en folklig insikt sedan urminnes tider. Binmore skriver att
det var först 1984, med utgivningen av Bob Axelrods ”Evolution of Cooperation” ”som idén slutligen upphörde att
upptäckas på nytt – ungefär på samma sätt som Amerika slutgiltigt upphörde att
upptäckas efter Columbus resa 1492”.
I en artikel av Roger B. Myerson (Game Theory: Analysis of Conflict, 1991, Harvard University Press.)
föreslås att folkteoremen ska kallas ”general
feasability theorems”. Folkteorem låter ju trevligare.
John Joseph Wallis artikel ”Institutions, Organizations, Impersonality, and Interests” får vara
ett exempel på hur referenser görs till folkteoremen. Wallis skriver (i min
översättning) att en startpunkt för en teori om organisationer är folkteoremens
intuition att två individer kan upprätthålla en relation över tid om båda
individerna erhåller en avkastning från relationen. (Avkastning är min översättning av ordet ”rent”). Wallis kallar sådana organisationer för
“adherent organizations”, de hålls ihop av det intresse som finns att vara med
I organisationen utan att det finns kontrakt som binder medlemmarna samman. Små
grupper av jägare och samlare, där alla känner alla och främlingar betraktas
med stor misstänksamhet, är exempel på sådana ”adherent organizations”. Tyvärr är översättning av "adherent" inte så enkelt, ordet betyder "anhängare". En synonym till anhängare är "vapendragare", vilket kanske ger lite mer av känsla av De
strategier som används i sådana små grupper för att reglera relationerna
varierar oerhört, ofta är de strikt ritualiserade. Det går att i Lasse Bergs
anda beskriva dessa grupper som i huvudsak internt fridsamma, men med en aktiv social kontroll genom att alla skvallrade om alla. Men folkteoremet
förutsätter att det fanns en bestraffnings-strategi. Ytterst tillgreps en
GRIM-strategi, som att någon blev utfrusen ur gruppen.
Så snart gruppen växer och möten med andra grupper ökar i
antal så måste man hantera relationer med människor man inte säkert har ett
upprepat spel med. Varje lokal grupp kommer att en begynnande hierarki för att
hantera sådana spel. Wallis beskriver då hur de ledande representanterna inom
varje grupp (Wallis kallar dem i artikeln våldsspecialister, men jag antar att
det även kan vara andra med auktoritet) kan finna former för regelbunden
interaktion enligt folkteoremen. En dominant koalition av våldsspecialister
från olika grupper kan på så vis skapa en ”adherent organization”. Detta ger
dem ökade resurser att skapa tydligare fördelar i sin egen grupp, och en ännu
mer hierarkisk ordning uppkommer. Dessa större grupper bygger på en
kontraktbaserad organisation, som inte ska beskrivas med hjälp av folkteorem. Kontraktbaserade
organisationer har en tredje part som kan se till att reglerna efterföljs. Den
dominerande koalitionen kan utnyttja sina kontakter för att skapa sådan
tredje-parts kontroll.
Vad har detta med 600-talet och 1200-talet att göra? Jo, det
Wallis beskriver är uppkomsten av det han kallar en naturlig stat (begreppet
har tagits fram tillsammans med North och Weingast, se t.ex. Violence and Social Orders). Den
naturliga staten är den typ av organisation av organisationer som funnits och
fortfarande finns i de flesta samhällen sen historiens början.
Ken
Binmore, ”Kort om spelteori”, Fri tanke 2012, (Game theory, a very short introduction, Oxford University Press, 2007)
John Joseph
Wallis, ”Institutions, Organizations, Impersonality, and Interests: The
dynamics of Institutions, February 2010, University of Maryland, and National Bureau of Economic Research.