Seperti yang pernah dikatakan oleh Kenny Rogers, seorang penjudi yang baik harus tahu kapan harus menahan mereka dan tahu kapan harus melipatnya. Di Rivers Casino di Pittsburgh minggu ini, sebuah program komputer bernama Libratus akhirnya dapat membuktikan bahwa komputer dapat melakukan ini lebih baik daripada pemain kartu manusia.
Libratus memainkan ribuan permainan head-up, atau dua pemain.
Texas Hold'em tanpa batas melawan beberapa pemain poker profesional ahli. Sekarang sedikit lebih dari setengah jalan melalui kontes 20 hari, Libratus naik hampir $ 800.000 melawan lawan manusianya. Jadi kemenangan, meskipun jauh dari terjamin, mungkin ada dalam kartu.
Kemenangan untuk Libratus akan menjadi pencapaian besar dalam kecerdasan buatan.
Poker membutuhkan alasan dan kecerdasan yang terbukti sulit ditiru mesin. Ini pada dasarnya berbeda dari catur, catur, atau Go, karena tangan lawan tetap tersembunyi dari pandangan selama bermain. Dalam permainan "informasi yang tidak sempurna," sangat rumit untuk mengetahui strategi ideal mengingat setiap pendekatan yang mungkin dilakukan lawan Anda. Dan Texas Hold'em tanpa batas sangat menantang karena lawan pada dasarnya dapat bertaruh berapa pun jumlahnya.
“Poker telah menjadi salah satu game tersulit bagi AI untuk ditembus,” kata Andrew Ng, kepala ilmuwan di Baidu. "Tidak ada satu pun gerakan optimal, tetapi seorang pemain AI harus mengacak tindakannya sehingga membuat lawan menjadi tidak pasti ketika itu menggertak."
Libratus diciptakan oleh Tuomas Sandholm, seorang profesor di departemen ilmu komputer di CMU, dan mahasiswa pascasarjana Noam Brown. Sandholm, seorang ahli teori permainan dan AI yang beremigrasi dari Finlandia untuk gelar PhD-nya, mengatakan sungguh menakjubkan bahwa manusia telah mampu mengungguli komputer begitu lama. "Itu hanya mengejutkan saya betapa bagusnya para pemain top ini," katanya. "Dari semua permainan yang telah ditangani AI, [poker] adalah satu-satunya di mana AI belum mencapai kinerja manusia super."
Peneliti AI menggunakan teori permainan, atau matematika pengambilan keputusan strategis, untuk menemukan strategi terbaik yang diberikan berbagai ketidakpastian, yang dikenal sebagai keseimbangan. Karena kemungkinannya sangat luas, ini biasanya melibatkan beberapa bentuk perkiraan.
"Apakah langkah itu baik atau tidak tergantung pada hal-hal yang tidak dapat Anda amati," kata Vincent Conitzer, seorang profesor di Universitas Duke yang mengajarkan AI dan teori permainan. “Ini juga menghasilkan kebutuhan yang tidak dapat diprediksi. Jika Anda tidak pernah menggertak, Anda bukan pemain yang baik. Jika Anda selalu menggertak, Anda bukan pemain yang baik. Teori permainan memberi tahu Anda cara mengacak permainan Anda dengan cara yang, dalam arti, optimal. ”
Tahun lalu, Sandholm memimpin pengembangan program bermain poker sebelumnya, yang disebut Claudico, yang dipukuli dengan baik dalam pertandingan melawan beberapa pemain poker profesional. Dia menjelaskan bahwa Libratus menggunakan beberapa kemajuan baru untuk mencapai tingkat permainan yang begitu tinggi.
Ini termasuk teknik pendekatan keseimbangan baru, kata Sandholm, serta beberapa metode baru untuk menganalisis kemungkinan hasil ketika kartu terungkap pada tahap akhir permainan. Analisis akhir permainan ini sangat menantang secara komputasi, dan dilakukan selama setiap pertandingan di Pittsburgh Supercomputing Center, fasilitas yang dioperasikan oleh CMU dan University of Pittsburgh.
Kemajuan dalam pembelajaran mesin dan AI telah melihat sejumlah program bermain game manusia super baru-baru ini muncul. Tahun lalu, para peneliti di DeepMind, anak perusahaan Alphabet, mengembangkan program yang mampu mengalahkan salah satu pemain Go terbaik dunia. Pencapaian ini sangat spektakuler karena Go sangat kompleks, dan karena sulit untuk mengukur kemajuan dalam permainan (lihat “AI Masters Google Menuju Satu Dekade Lebih Awal dari yang Diharapkan”).
Beberapa kelompok riset berbeda berfokus pada penanganan poker.
Tim akademis lain, dari Universitas Alberta di Kanada, dan Universitas Charles dan Universitas Teknik Ceko di Republik Ceko, baru-baru ini mengembangkan sebuah program, yang disebut DeepStack, yang telah mengalahkan beberapa pemain profesional dalam head-up tanpa batas Texas hold'em ( lihat “Poker Adalah Game Terbaru untuk Melipat Terhadap AI”). Namun, kata Sandholm, para pemain yang terlibat dalam pertandingan melawan Libratus jauh lebih kuat, dan bermain lebih banyak tangan melawan mesin, yang seharusnya memberikan signifikansi statistik yang lebih besar pada hasilnya.
Teknik yang digunakan untuk membangun bot-poker yang lebih cerdas bisa memiliki banyak aplikasi di dunia nyata.
Teori permainan telah diterapkan untuk penelitian tentang serangan jamming dan cybersecurity, panduan otomatis untuk layanan taksi, dan perencanaan robot, kata Sam Ganzfried, yang terlibat dengan pengembangan Claudico dan sekarang menjadi asisten profesor di Florida International University di Miami.
Namun, bahkan jika Libratus menang minggu ini, itu tidak berarti bahwa manusia tidak lagi berhak mendapat tempat di meja kartu. Versi multi-pemain Texas Hold'em tanpa batas tidak dapat dikuasai menggunakan teknik yang digunakan oleh Libratus.