HUEN

Kezdőoldal

Ökrös Tamás - 2022. január 17.

Good, Better, Best – Recenzió

2021-ben jelent meg a kanadai Master Point Press kiadásában Jan Eric Larsson könyve, amelynek sokatmondó címe: Good, Better, Best – A Comparison of Bridge Bidding System and Conventions by Computer Simulation (Magyarul: Jó, jobb, Legjobb – Licitrendszerek és konvenciók összehasonlítása számítógépes szimulációval.) Larsson könyvét érdekes, tanulságos, sőt, kifejezetten hasznos olvasmánynak tartom – annak ellenére, hogy véleményem szerint a vizsgálat hagy még kívánnivalót maga után.

A szerző nem tartozik a világ éljátékosai közé, pár soros önéletrajzában azt írja, hogy fiatal korában a svéd ifjúsági bridzsezők elitjéhez tartozott, később átlagos klubszinten játszott. Fontos azonban, hogy aktív éveiben a mesterséges intelligencia kutatójaként dolgozott a kaliforniai Stanford Egyetemen, így a címben vállalt feladathoz, a licitrendszerek és konvenciók számítógépes összehasonlításához szükséges informatikai kompetenciája aligha vitatható.

Az alábbiakban a következőkről lesz szó:

I. Milyen kérdésekre kereste a választ a könyv alapjául szolgáló vizsgálat?
II. Mi volt a vizsgálat módszertana, azaz, hogyan történt az összehasonlítás?
III. Milyen válaszokat adott Larsson a feltett kérdésekre, illetve általánosabban: milyen eredményeket hozott a vizsgálat és milyen következtetéseket vonhatunk le ezekből az eredményekből? Például:
IV. Mit jelent a gyakorlatban (értsd: IMP-ben vagy százalékban kifejezve), hogy egy rendszer jobb, mint egy másik?
V. Kritikai észrevételek a vizsgálattal és annak eredményeivel kapcsolatban.

I. Milyen kérdésekre kereste a választ a könyv alapjául szolgáló vizsgálat? 

Itt könnyű a recenzor dolga, mert Larsson ezeket a kérdéseket a könyv 59. oldalán tételesen felsorolja:

– Melyik a jobb rendszer: ami négyes majorokat is indít, vagy az, amelyik csak  minimum ötös hosszúságú majorokat?
– Jobb a 2/1 mint a SAYC?
– Melyik a jobb: a gyenge vagy az erős NT?
– Melyik a jobb: a természetes felépítés vagy az erős treff rendszer?
– A hatos hosszúságú színeket indító konstruktív gyenge 2-es indulás a jobb vagy a vad és obstruktív jellegű ötös színeket indító?
– Melyik konvencióval nyerhetsz sok pontot? Mi a helyzet a Bergen emelésekkel, a checkback Stayman, a Cole és a Gazilli konvenciókkal?
– Melyik a legjobb védekezés az 1 szan indulás ellen?
– Melyik a legjobb védekezés az erős egy treff ellen?

– Az olasz Blue Team rendszerei jók voltak vagy rosszak?
– Felülmúlják-e a relérendszerek a nem relé alapú rendszereket?
– Melyik a legjobb típusú rendszer a világon?
– Melyik a legjobb licitrendszer a világon? 

Akit Larsonnak a dőlt betűvel szereplő kérdésekre adott válaszai is érdekelnek, annak nem tudok mást ajánlani, mint hogy olvassa el a könyvet, a  többi kérdésre adott válaszokat a III. szakaszban ismertetem.  

II. Mi volt a vizsgálat módszertana, azaz, hogyan történt az összehasonlítás?

A rendszereket és konvenciókat először is le kellett programozni (implementáció), majd igen nagyszámú (több ezer) versenypartiban „játszatni” őket egymás ellen. (A partik száma a Larsson-féle alapösszehasonlításban 7200 volt.) Ezt így leírni egyszerű, a kivitelezés azonban igen bonyolult. Nem annyira maga a programozás, ami ugyan nagy munka, de elvi nehézségei nincsenek, hanem annak eldöntése, hogy egyáltalán pontosan mit is kell programozni: egy rendszernek melyik változatát és azt milyen mélységig?

Az előbbinél valamivel könnyebben megválaszolható kérdés, hogy pontosan mit is jelentsen az, hogy a rendszereket egymás ellen „játszatjuk”? Itt három lehetőség merült fel:
– Double-dummy elemzés (nyílt lapos, 52-lapos számítógépes elemzés) használata;
– valamely bridzsprogram „single dummy” módban való használatával ténylegesen játszatni egymás ellen az összehasonlítandó rendszerek által kilicitált felvételeket;
– korábbi, mesterszintű versenyek játszmáival való összehasonlítás. 

Nyilván a második lett volna leginkább realisztikus, de ez egy olyan programot igényelt volna, amely egyszerre játszik jól és „humán stílusban”. Larsson szerint (egyelőre) nincs ilyen bridzsprogram, ezért a double-dummy analízis mellett döntött – tudatában annak, hogy így nem érvényesül majd egyes licitrendszereknek az a szisztematikus előnye, hogy nem juttatnak a felvevő vonal számára felesleges, de az ellenjáték számára fontos információkat az ellenfélnek.

III. Milyen válaszokat adott Larsson a feltett kérdésekre, illetve általánosabban: milyen eredményeket hozott a vizsgálat és milyen következtetéseket vonhatunk le ezekből az eredményekből?

Melyik a jobb rendszer: ami négyes majorokat is indít, vagy az, amelyik csak minimum ötös hosszúságú majorokat?
Larsson vizsgálatai szerint az utóbbiak, ha csak kicsit is, de jobbak – ha természetes rendszerekről van szó. Az erős treff rendszerek esetében ezt a kérdést Larsson nem vizsgálta külön, de a végső rangsor elején (ld. alább!) négyes majorokat indító erős treff rendszerek állnak.

Melyik a jobb: a gyenge vagy az erős szan?
Larsson állítása – a vizsgálati eredmények alapján - az, hogy az erős NT egyértelműen jobb, és annak magyarázata, hogy a gyenge 1 szan egyáltalán életben marad, a mezőny ellene való védekezési képességének elégtelen voltában keresendő.       
 
Jobb a 2/1, mint a SAYC?
Egyértelműen igen.

Melyik a jobb: a természetes felépítés vagy az erős treff rendszer?
Egyértelműen az utóbbi. Ez tűnik Larsson eredményei közül a leginkább megalapozottnak és a rendszerek végső ranglistáját is három erős treff rendszer vezeti. (ld. alább!)

A hatos hosszúságú színeket indító konstruktív gyenge 2-es indulás a jobb vagy a vad és obstruktív jellegű ötös színeket indító?
A vizsgálati eredmények azt igazolják, hogy az utóbbi. Ugyanazok a rendszerek sokkal jobban szerepeltek az összehasonlításban az ilyen (vad és obstruktív) gyenge 2-es indulásokkal.  

Az olasz Blue Team rendszerei jók voltak vagy rosszak?
A válasz egyszerre igen és nem. A Roman Club valójában igen rossz volt, míg a Blue Club igazán, mondhatni kimagaslóan jó volt: ennek a rendszernek egy felújított (vad és obstruktív gyenge 2-es indításokkal ellátott) változata lett a végső ranglista második helyezettje.

Felülmúlják-e a relé-rendszerek a nem relé alapú rendszereket?
A kutatás szerint nem. Larsson szerint ez meglepetés, de a természetes rendszerek, a kérdőlicitekre épülő és a relé rendszerek azonos értékűek.

Melyik a legjobb típusú rendszer a világon?
Larsson válasza: „Úgy tűnik, az erős treff rendszer, erős szannal és agresszív gyenge 2-es indulásokkal a legjobb rendszer-típus.”

Melyik a legjobb licitrendszer a világon?
Larsson szerint ez a saját rendszere, a Cottontail Club. Mielőtt bárki a „minden szentnek maga felé hajlik a keze” elv alapján az eredményeket torzító elfogultsággal vádolná a szerzőt, szeretném jelezni, hogy feltehetően nem erről van szó, hanem fordított összefüggésről. Larsson nagyon régóta foglalkozik a licitrendszerek szisztematikus összehasonlító vizsgálatával (legjobb tudomásom szerint a múlt század 90-es éveinek eleje óta), így saját rendszerébe folyamatosan beépíthette kutatási részeredményeit, vagyis módjában állt azt folyamatosan úgy formálni, hogy az legyen a legeredményesebb rendszer (s mint maga is írja, rendszere még az utolsó, a legjobbnak talált rendszerek közötti „mindent eldöntő” végső összehasonítás előtt is átesett egy módosításon). A teljesség, a becsületesség és a lehetséges alternatívák kedvéért azt is jegyezzük meg, hogy Larsson maga, a legjobb rendszer kihirdetésekor azt is hozzáteszi, hogy lehetségesnek kell lennie még az övénél is jobb erős treff rendszert tervezni.

Az összehasonlított licitrendszerek végső rangsora, illetve ezek struktúrája, indítási táblázatai:

1. Cottontail Club (erős treff rendszer, négyes majorokat indít)
2. Blue Club (erős treff rendszer, négyes majorokat indít)
3. Modern Precision (erős treff rendszer, ötös majorokat indít)
4. Super Spade (erős passz rendszer)
5. Scanian Simple („természetes” 5533 rendszer, multi 2 treff és 2 káró indulással)
6. 2/1 Bergen („természetes” 5533 rendszer, GF 2/1 válaszokkal, Bergen emelésekkel)

1. Cottontail Club

2. Blue Club

3. Modern Precision

* Az Ekren konvenciót ld. itt.

4. Super Spade

5. Scanian Simple

6. 2/1 Bergen

IV. Mit jelent a gyakorlatban (értsd: IMP-ben vagy százalékban kifejezve), hogy egy rendszer jobb, mint egy másik?

Másképpen fogalmazva a kérdést: azonos játékerőt feltételezve, hány pontot hoz egy csapatnak, ha „jobb” rendszert játszik, mint az ellenfele? Larsson a kérdésre nem ad statisztikailag egzakt választ, csak érzékelteti (példával illusztrálja), hogy a rendszerek egymással vívott csatájában a 24 leosztásos csapatmeccsek eredményeinek szórása kb. 3-4-szer nagyobb, mint a két rendszer közötti különbségek átlaga.

Ez azt jelenti, hogy hiába mutatják azt az eredmények, hogy egy rendszer átlagosan (pontosan 300 ilyen összecsapás átlagában) 3 vagy akár 6 IMP-vel szerez többet egy másiknál, ettől még meglehetősen gyakran fog előfordulni, hogy egy konkrét 24 leosztásos meccset fölényesen, két számjegyű IMP-vel nyer meg a másik, a gyengébb átlagot teljesítő rendszer.

Lehetne erre azt mondani, hogy akkor mivégre az egész cirkusz, az egész vizsgálat csak vihar egy pohár vízben. Lehet, de – azt hiszem – mindenki szívesebben ül le egy olyan rendszerrel játszani, amelyről azt tudja, hogy az, ha mégoly csekély, de átlagosan 3-6 IMP stratégiai előnyt biztosít más rendszerekkel szemben egy 24 leosztásos versenyen. És van még egy szempont.         

Kétségtelen, hogy a rendszerek jósága, alkalmassága, eredményessége sokkal inkább függ azok úgynevezett „humán” tulajdonságaitól, mintsem a számítógépes szimulációval mérhető objektív és egzakt hatékonyságuktól. Ezzel Larsson maga is tisztában van, és meg is nevezi, hogy melyek azok a „humán” jellemzők, amelyeknek köszönhetően egy rendszert jól, azaz hatékonyan, eredményesen lehet használni a való játékban:
– Könnyű megtanulni és megérteni.
– Könnyű fejben tartani.
– Könnyű végrehajtani (használni a gyakorlatban).
– Könnyű megmagyarázni.
– Szociálisan elfogadott.
– Legális a világnak azon a részén, ahol játszani akarod.
– Az ellenfeleket nehéz helyzetbe hozza.*
– Az ellenfeleket szokatlan helyzetbe hozza.**

*Nem pszichológiai értelemben, hanem objektíve: nem közöl velük az ellenjátékhoz szükséges információt, kizárja őket a számukra megfelelő licitmagasságról, stb.
**Ez meg éppen pszichológiailag értendő, de nem csak arról van szó, hogy az ellenfeleknek adott esetben nincs megállapodásuk bizonyos konkrét licitek ellen, hanem arról, hogy ha van is ilyen megállapodás, maga a helyzet szokatlan a számukra, abban bizonytalanul mozogva rosszul értékelik az erő és/vagy a színek eloszlását a két vonal között, stb. 

Az érdekes az, hogy az erős treff rendszerek ezekben a vonatkozásokban is felülmúlják az úgynevezett természetes rendszereket: sokkal könnyebb őket megérteni, megtanulni, fejben tartani és végrehajtani, a gyakorlatban használni is. Az erős treff rendszerek használata során – azok struktúrájánál fogva – sokkal könnyebb tájékozódni a saját vonalunk lehetőségeiről, és sokkal nehezebb helyzetbe hozzuk az ellenfeleket, mint az úgynevezett természetes rendszerek.

Ajánlás

Mielőtt a kritikai észrevételekre rátérnék, szeretném kijelenteni, hogy Larsson könyvét – kritikai meglátásaim ellenére is – olvasásra, tanulmányozásra ajánlom mindazoknak, akik érdeklődnek a licitrendszerek elméleti alapjai iránt, szeretnének a jelenlegi rendszerüknél jobb rendszert játszani vagy akár a jelenlegi rendszerüket jobban játszani, és persze, alapszinten beszélnek (olvasnak) angolul. A könyv az interneten rendelhető, az ára ez idő szerint 16 euró körül van.

V. Kritikai észrevételek a vizsgálattal és annak eredményeivel kapcsolatban   

A kutatás módszertanával kapcsolatban említettem, hogy annak egyik nehezen eldönthető kérdése, hogy egy-egy rendszer esetében pontosan mit is kell programozni (mi szerepeljen az implementációban), egy adott néven szereplő rendszer vagy rendszercsalád melyik változata? Szorosan ehhez kapcsolódó kérdés, hogy ha úgy döntök, hogy egy adott rendszert vagy rendszercsaládot ez és ez a változat fog képviselni az összehasonlításban, akkor az összehasonlítás eredménye mennyire lesz érvényes magára az adott névvel illetett rendszerre vagy rendszercsaládra?

A vizsgálat azt mutatta, hogy egészen „kicsiny” változtatások egy-egy rendszerben (például a gyenge 2-es indulással ígért színhosszúság egy lappal való csökkentése, a normál és az erős treff indulások tartományát elválasztó határ egy ponttal való elmozdítása) elég volt ahhoz, hogy egy rendszer így módosított változata már jobban teljesítsen. Ebből az is következik, hogy az előbb megfogalmazott kérdésre azt kell válaszolni, hogy a vizsgálat megállapításainak a konkrétan vizsgált változatokon túli érvényessége erősen korlátozott.

Kérdéses, hogy a versengés eredményét ez mennyire befolyásolja. Nem lehetséges-e, hogy egy rendszer vagy rendszercsalád azért maradt alul az összehasonlításban, mert nem a lehető legjobb reprezentáns képviselte? Larssonnak becsületére legyen mondva, hogy akár a négyes majorokat indító természetes rendszereknek, akár a precíziós rendszernek több változatát is vizsgálta, de vajon éppen azokat-e, amelyek valóban a legígéretesebbek? Nem felejtett-e ki valamit? Akár szempontokat, akár konkrét változatokat, akár konkrét rendszereket? Okom van feltételezni, hogy igen, kimaradtak a vizsgálatból olyan rendszerek, illetve olyan változatok, amelyek esetleg módosíthatták volna a „részeredményeket” vagy akár a végső eredményt is.

Az alábbiakban bemutatok néhány rendszert, illetve változatot, amelyekről azt gondolom, hogy mindenképpen helye lett volna az elemzésben, és arra is rámutatok, hogy az összehasonlításból való kimaradásuk milyen módszertani hiba következménye.

A Richard Lighton féle MOCK és valami hasonló az Acolban

A MOCK ismeretes volt Larsson számára (egy korábbi tanulmányában írt róla).

Nem kizárt, hogy Larsson most is vizsgálta, csak épp valamely okból gyengén szerepelt. Az ok az lehet, hogy ha az indulónak menet közben nő meg a lapereje a partnere válaszának hatására, akkor adott esetben esetleg fals választ kell adnia. Pl. 1♥-1♠ után 4414 elosztással, eredetileg 15 figuraponttal biztosan invitáló viszonválaszt kell adni, miközben az indulónak nincs ötös kőrje. Ha azonban az eredeti gondolatot az Acol rendszerbe építjük be, akkor ez a probléma elesik:
1m = 11-15, 5+m / 16-21, 4+m
1M = 11-21, 4+M
1N = 12-15, BAL 
és nem lesznek fals viszonválaszok, mert az 1M indulások minden esetben csak 4+ színhosszúságot ígérnek, a minor indulások viszont mindenképpen megbízhatóak, illetve „harcképesek” mert vagy erősek, vagy ha gyengék, akkor a licitált minor 5+ hosszúságú. [Évekig játszottam ilyen Acol rendszert, több partnerrel is, és bármilyen öt majort indító és erős 1 szant indulást használó standard változatnál jobban működött.]
További kérdés, hogy mi lett volna, ha az itt vázolt Acol struktúrába bevezetjük a MAFIA (Major First Allvays) és a MAMIC (Major-Minor Canapé) elvet? 

A Warne-Bergdahl féle precíziós

Az, hogy a Larsson féle végső ranglistát két olyan erős treff rendszer vezeti, amelyek négyes majorokat indítanak, arra kellene, hogy ösztökélje a kutatót, hogy a Warne-Bergdahl rendszer alapgondolatát beépítse egy négyes majorokat indító erős treff rendszerbe, és azt is bedobja a küzdelembe… 

A MOSCITO és változatai
Ahogy Larsson is írja, Paul Marston és Anthony Burgess 1986-ban MOSCITO rendszerükkel harmadikak lettek a páros világbajnokságon, és innen kezdve a rendszernek komoly reputációja volt a modern, agresszív és precíz rendszerek között. A rendszer – Larsson saját szavai szerint – határozottan kandidált a világ legjobb licitrendszere címre. Nos, ehhez képest Larsson meglehetősen mostohán bánt vele. A könyv 147. oldalán a MOSCITO ezzel a struktúrával szerepel:

MOSCITO Original (1986)

Ez utóbbi annál is inkább érdekes, mert az Interneten megtalálható egy olyan változat (MOSCITO 2001 néven), amely éppen abban különbözik az itt szereplőtől, hogy a 2M indulások gyengék, 6-9 pontot ígérnek, 5+ majorral. 

Annak sem lett volna semmi akadálya, hogy a MOSCITO még az Ekren konvenciót is megkapja – láttuk, hogy a Mondern Precíziósnak ez volt a legerősebb változata.

A MOSCITO-nak ezeken kívül is számtalan változata létezik. Megértem, hogy Larsson valami oknál fogva nem akarta ezek mindegyikét vizsgálat tárgyává tenni, de legalább azt az egyet illet volna, amivel a GIB annak idején megnyerte a bridzsprogramok világbajnokságát. Íme:

***

Az itt előadott kritikai megjegyzésekből nem az következik, hogy Larsson vizsgálati eredményeit kukába kellene dobni. Ellenkezőleg: ezek a vizsgálati eredmények megtartandók, de további rendszereknek a vizsgálatba, összevetésbe való bevonásával kiegészítendők. Olyan rendszerekről van szó, amelyek ugyan első látásra szokatlannak, extrém megoldásnak tűnnek, valójában azonban egyszerű zöld vagy kék rendszerek, és némelyik ezt a minősítést hivatalosan meg is kapta. A vizsgálat ilyen irányú bővítésének tehát gyakorlati haszna is lehetne.