قهرمان فعلی جهان مگنوس کارلسون نروژی است که سه سال پشت سر هم قهرمان جهان شده است. بالاترین ریتینگ کارلسون ۲۸۸۲ بوده در سال ۲۰۱۴٫
بالا بردن ریتینگ کار سخت و طاقتفرسایی است و باختن به بازیکنان ریت پایینتر به شدت ریتینگ رو میکشه پایین، مثلا احسان قائم مقامی در مسابقات قهرمانی ایران ۱۴ واحد از امتیازش کم شد و پرهام مقصود لو قهرمان شد. پیک ریتینگ قائم مقامی ۲۶۳۳ بوده مربوط به سال ۲۰۰۵٫
برای استاد بزرگی امتیاز ۲۵۰۰ و برای ابر استاد بزرگی امتیاز ۲۷۰۰ نیاز است که در ایران تاکنون کسی به این امتیاز نرسیده.
خوب این از آدمها، حالا بریم سراغ برنامههای کامپیوتری شطرنجباز که بهشون انجین یا موتور گفته میشود.
بهترین برنامههای کامپیوتری شطرنج فعلی جهان عبارتاند از:
استاک فیش، کومودو و هودینی
ریتینگ این انجین ها به ترتیب ۳۲۲۶ , ۳۲۲۴ و ۳۱۹۲ است
از رو امتیازها قطعاً متوجه شدید حتی قهرمان شطرنج جهان در مقابل انجین شانسی نداره. این انجینها حتی با آوانس هم در برابر قهرمان شطرنج جهان پیروز خواهند شد. ناکامورا ( یکی از ده شطرنج باز برتر جهان با ریتینگ ۲۷۸۱) با کمک انجین ریبکا (۳۰۰۰ ) مقابل استاک فیش شکست خورد. (دو باخت و دو مساوی). البته ریبکای استفاده شده آخرین نسخه نبود.
این موتورها هم یک سری مسابقات دارند که در این مسابقات قویترین انجین در دو بخش فکری و رپید (شطرنج سریع) مشخص میشود.
یکی از این مسابقات TCEC (http://tcec.chessdom.com) است که سال ۲۰۱۶ استاک فیش قهرمان شد.
( امسال هودینی در بخش فکری اول شد و بخش رپید هم اکنون در جریانه)
استاک فیش یه موتور اوپن سورس (متن باز) است که ده سالی از عمرش میگذرد.
همه این مقدمات گفته شد تا برسیم به اتفاقی که در هفته پیش رخ داد، برای شرح این اتفاق لازم شد برگردیم به چند ماه قبل:
گوگل (یا به بیان بهتر آلفابت) الگوریتم هوش مصنوعیای دارد که دارای قابلیت یادگیری است، یعنی اگه قوانین یک کاری مثلاً یک بازی رو بهش بدیم و بعد باهاش بازی کنیم هر بار که ببازد یاد میگیره که دفعه بعد اون جوری شکست نخوره.
چند ماه پیش گوگل به این برنامه هوش مصنوعی بازی GO رو یاد داده بود. GO یک بازی اصالتاً چینی است شبیه دوز با یک صفحه ۱۹ در ۱۹٫ برنامه هوش مصنوعی گوگل بعد از یادگرفتن اصول اولیه این بازی و تمرین با یک بازیکن حرفهای GO موفق شد با نتیجه ۴ به ۱ قهرمان فعلی GO جهان یعنی لی سودول کره ای رو شکست دهد.
اما ربط این بخش دوم به بخش شطرنجی اول چیست؟
ربط این دو بخش این است که گوگل به این هوش مصنوعی قوانین شطرنج رو یاد داده و یک فرصت تمرینی چهارساعته برای این هوش مصنوعی در نظر گرفته شد تا برنامه مهارتهای خودش در شطرنج رو تقویت کند، پس از این تمرین، برنامه هوش مصنوعی گوگل (در اینجا با نام آلفازیرو زیر بخش پروژه دیپ مایند) آماده مقابله با استاک فیش شد.
موتورهایی که اسم آنها برده شد سالهاست که در حال بهبود میباشند و انواع گشایشها و آخر بازیهای مختلف براشون تعریف شده اما به آلفا زیرو فقط قوانین پایهای آموزش داده شده و بعد تمرین کرده و بعد از هر شکست قویتر شده است. شبیه شخصیت کمیک بوکی Doomsday.
نتیجه پیکار آلفازیرو در برابر استاک فیش:
از ۱۰۰ مسابقه، ۷۲ مسابقه مساوی (پات) شده و ۲۸ مسابقه دیگر را آلفا زیرو برده است. استاک فیش حتی در یک مسابقه هم نتوانسته آلفا زیرو رو شکست دهد! یعنی نتیجه شد ۳۶ به ۶۴٫
جالب این که استاک فیش در tcec2017 حتی یک مسابقه را هم نباخت.
مورد بعدی اینکه آلفا زیرو در هر ثانیه ۸۰٫۰۰۰ پوزیشن رو حساب و استاک فیش ۷۰٫۰۰۰٫۰۰۰ موقعیت رو حساب میکنن، اما انگار کمیت همه چیز نیست. آلفازیرو حین محاسبه موقعیتهای مختلف این قابلیت رو داراست که لاین (مسیر) های ضعیف رو تشخیص بده و محاسبات مربوط به اون مسیرها رو حذف کند. اینجوری در زمان کمتری میتونه بهترین حرکت رو پیدا کنه، چیزی شبیه الگوریتم فکر کردن انسان که جدا از بقیه چیزها احتمالاً الگوریتم فکر کردن انسان با توجه با سرعت پایین پردازش مغز «بهصرفهترین» الگوریتم هست.
مورد بعدی اینکه الگوریتمهای کامپیوتری که البته تا این اندازه هوش مصنوعی توشون دخیل نبوده هزاران روش برای گشایش ( تو شطرنج بهش میگن گامبی) دارن و همین طور در مورد آخر بازی و بازی با پیادهها در پایان بازی. انجینهایی مثل استاک فیش و کومودو هر وقت یه نسخه جدید میدن معمولا ادعا میکنن ۴۰ تا ۵۰ واحد قویتر شدن و مثلاً پایان بازیشون بهبود پیدا کرده. اما آلفا زیرو چون هیچ کدوم از اون کتابخانهها رو نداره ( قطعا اگه بیشتر بازی کنه خودش اونا رو کشف میکنه و احتمالا بهترشون هم بکنه و لازم نیست ما مدام اونا رو بهش اضافه کنیم) بازیهاش برای یه شطرنجباز حرفهای عجیبه چون خیلی با تئوریهای ما سازگار نیست
مثلاً تو عکس زیر اسب سیاه رو با شاه میزنه!!
و بعد شاه رو همچون یک پیاده حرکت میده و در پایان در یه همچین موقعیتی پیروز میشه (سفید آلفا زیرو است.)
یا همنشینی شاه و وزیر در موقعیت جالب زیر
یا در موقعیت زیر
که دیگر انجینها حرکت رخ به صورت زیر رو پیشنهاد میدن:
اما آلفا زیرو برای به دست آوردن موقعیت برتر در صفحه فارغ از ارزش فیل در قبال پیاده این حرکت رو انجام میده
ده تا از بازیهای آلفا زیرو رو در اینجا میتونید ببینید.
اینگونه حرکات نه خیلی شبیه بازی آدمها و نه شبیه بقیه موتورهای کامپیوتری است. گویا سبک سوم خاص و منحصر به فردی است مخصوص آلفا زیرو. (البته مسلماً انتظار هست جزئیات بیشتری از این بازیها و شرایط انجام اونها منتشر بشه. و اینکه هرکسی بتونه این بازیها رو دوباره شبیهسازی کنه)
این گونه یادگیری و این بازیها باز همون علامت سوال همیشگی خطرات هوش مصنوعی رو به ذهن متبادر میکنه. مثلا ایلان ماسک مدیر کمپانی تسلا و اسپیس ایکس گفته هوش مصنوعی از کره شمالی هم خطرناکتره! (جالبه تسلا خودش مدتهاست رو هوش مصنوعی و خودروهای خودران کار میکنه.)
به هرحال ترس ما (با دلیل یا بیدلیل) اینه که روزی بیاد که ما بمونیم و یک “هال ٩٠٠٠” که از بدشانسی محاسباتش نشون داده بقای بشر برای آینده حیات کره زمین خطرناکه و داره فکر میکنه و محاسبه میکنه چجوری باید نسل بشر رو منقرض کنه.
همچنین "جادی میرمیرانی" در این باره در وبسایتش نوشت:
حرکات فضایی آلفا زیرو، قدرت هوش مصنوعی و یادگیری ماشینی رو به رخ شطرنج بازها – و بقیه – میکشه
برنامه جدید دیپ مایند نه فقط فوق العاده و قابل تطابقه، که کمی هم عجیبتر از اون چیزی شده که انتظارش رو داشتیم. گروه دیپ مایند توی مقاله جدیدشون برنامه جدید یادگیرنده بازی ای رو که توسعه کردن توضیح می دن، این برنامه تونسته شطرنج و یک بازی ژاپنی رو بعد از یاد گرفتن بازی گو یاد بگیره.
دمیس حسابیس که مدیر دیپ مایند (و البته موسس) است و خودش هم شطرنج باز است می گه برنامه حرکاتی انجام می ده که برای یک شطرنج باز انسانی قابل درک نیستن.
سبک بازی ای که یاد گرفته نه شبیه آدم است و نه شبیه برنامه های قبلی. این سیستم به یک شیوه سوم و شاید شیوه ای بیگانه بازی می کنه.
برنامه آلفا زیرو نسخه جهانشمولتر برنامه آلفا گو گوگل است که مخصوص بازی گو طراحی شده بود و با فقط ۲۴ ساعت زمان و بررسی بازی و بازی کردن با خودش تونسته یاد بگیره برنامه استاک فیش که یکی از قوی ترین موتورهای کامپیوتری جهان برای شطرنج است رو نه فقط با اختلاف زیاد، که بدون حتی یک شکست،ِ در هم بکوبه. لازم به ذکر نیست که هیچ انسانی نمی تونه در مقابل استاک فیش برنده بشه. عکس العمل قهرمانان شطرنج جهان به این پیروزی همراه با شوک،
اما اینجا مساله «یک موتور شطرنج قوی تر» نیست بلکه یک موتور شطرنج است که قربانی های عجیب می کنه. مثلا حاضر می شه فیل و وزیر رو بده تا موقعیت برتر به دست بیاره و با اون موقعیت، ببره. چنین بازی ای در بین انسان ها تقریبا دیده نمی شه. یا مثلا در جایی دیگه موتور شطرنج جدید وزیر رو به گوشه صفحه می بره که در شطرنج حرکتی کمیابه. حسابیس می گه نگاه کردن به شطرنج بازی کردن این موتور مانند نگاه کردن به شطرنج از بعدی دیگه است.
این «آموزش به خود» باعث شده موتور آلفازیرو طبق الگوهای مرسوم ما و ارزشهایی که به مهره ها می دیم بازی نکنه و از خوردن مهره هاش نگرانی ای نداشته باشه. ممکنه اصولا درک ما از شطرنج خیلی محدود و مبتنی بر به دست آوردن برتری نسبی از نظر ارزش مهرهها و تبدیل اون به پیروزی بوده. شاید این برنامه یکبار دیگه شطرنج هیجان انگیز رمانتیک که همراه با قربانی دادن و کارهای پر هیجان و عجیب بود رو به بازی برگردونه و البته شاید این برنامه شروعی باشه برای ما که کم کم قبول کنیم کامپیوترها دارن دنیا رو بهتر از ما می فهمن.