Bulan lalu, antropik startup AI yang divalidasi $ 61,5 miliar mengatur streaming langsung game on Berkedut. Live streams game bukanlah hal baru di Twitch, tapi yang ini sedikit berbeda: Claude, model AI antropik, berusaha untuk mengalahkan Pokémon Red.
Kami sekarang satu bulan lagi, Dan streaming langsung masih berjalan. Namun, Claude memilikinya tidak berkembang sebanyak itu. Dan, pada tingkat ini, agen AI Anthropic mungkin tidak akan pernah menjadi yang terbaik, seperti tidak ada yang pernah ada.
Menurut antropik, saat itu pertama kali diluncurkan Proyek “Claude Plays Pokémon”, versi sebelumnya dari agen AI Claude gagal pada beberapa tugas yang sangat mendasar. Misalnya, menurut Anthropic, Claude 3.5 akan mencoba melarikan diri dari hampir setiap pertempuran pada Juni 2024.
Beberapa bulan dan beberapa versi Claude kemudian, Anthropic mengatakan ada perubahan yang mencolok. Pada bulan Februari 2025, Anthropic memberi Claude 3.7 soneta berputar bermain Pokémon.
“Dalam beberapa jam, Claude mengalahkan Brock. Beberapa hari kemudian, itu membuat berkabut,” kata Anthropic. “Kemajuan bahwa model yang lebih tua memiliki sedikit harapan untuk dicapai.”
Kecepatan cahaya yang dapat dipasangkan
Antropik mengatakan bahwa Claude 3.7 sonnet dapat merencanakan ke depan, mengingat tujuan, dan belajar dari kesalahannya, tidak seperti versi sebelumnya dari agen AI. Itu juga membangun basis pengetahuan, melihat layar, dan menekan tombol tekan.
Namun, kemajuan Claude 3.7 Sonnet yang awalnya dibuat dalam permainan tampaknya telah terhenti.
Misalnya, pemirsa langsung menonton Seperti klausul 3.7 78 jam Untuk melewati Mt. Moon dalam permainan. Di Reddit, gamer diperkirakan Bahwa biasanya akan memakan waktu anak hanya beberapa jam untuk maju melalui tahap yang sama.
Claude dapat terlihat berputar -putar, tersandung di jalan yang sama, dan sering mengetuk dinding saat mencoba berkeliling permainan.
Livestream itu menarik, terutama saat kotak teks menjabarkan “pemikiran” Claude ketika agen AI mencoba mencari tahu apa yang bergerak selanjutnya.
Menurut insinyur antropik dalam sebuah wawancara dengan ARS TechnicaClaude memiliki waktu yang lebih mudah dengan aspek -aspek permainan yang melibatkan teks, seperti pertempuran Pokémon. Namun, ia berjuang dengan aspek permainan yang lebih visual, seperti bergerak dari kota ke kota di peta.
Claude 3.7 Sonnet telah melangkah lebih jauh dalam permainan daripada model Claude sebelumnya, jadi ada kemajuan. Namun, bagi mereka yang memperingatkan bahwa AI akan segera dapat mengambil alih dunia, kita belum menjadi tempat yang menjadi kenyataan. Claude masih memiliki 151 Pokémon untuk ditangkap.