By using this site, you agree to the Privacy Policy and Terms of Use.
Accept
HeryArts NewsHeryArts NewsHeryArts News
  • Home
  • Tech News
    Tech NewsShow More
    Ekspansi Besar Apple Store Ann Arbor: Mengintip Rencana Relokasi Mewah di Briarwood Mall Michigan Akhir Juli Ini
    9 Min Read
    Samsung Siapkan Update Android 17 untuk Jajaran Perangkat Galaxy: Bocoran Daftar Perangkat yang Terus Bertambah!
    11 Min Read
    Analisis Mendalam Strategi Belanja: Mengapa 11 Penawaran Monitor di Amazon Prime Day Ini Menjadi Pilihan Utama Para Ahli
    10 Min Read
    Batman: Caped Crusader Season 2 Siap Guncang Juli Ini: Riddler dan Joker Muncul dalam Trailer Perdana dengan Format Binge-Drop!
    14 Min Read
    Revolusi Gemini 3.5 Flash: Google Beri Kendali Layar Penuh pada AI untuk Perusahaan, Era Baru Agen AI Dimulai
    8 Min Read
  • AI News
    AI NewsShow More
    Tesla Bantah Tuduhan FSD Mematikan: Data Log Ungkap Kesalahan Fatal Pengemudi Salah Injak Pedal Gas
    11 Min Read
    Membongkar Rahasia Batasan 5 Jam Claude AI: Mengapa Pengguna Gratis Sering Terhenti dan Bagaimana Cara Mengatasinya?
    10 Min Read
    SpaceX Caplok Cursor Senilai $60 Miliar: Inilah Perbandingan Jujur Claude Code vs Cursor di Era Coding 2026
    10 Min Read
    Bukan Sekadar Benchmark: 12 Alasan Kuat Mengapa Claude Kini Mengungguli ChatGPT dalam Workflow Profesional Harian
    9 Min Read
    Claude Fable 5 Resmi Rilis: Inilah Model AI Tercanggih Anthropic dari Lini Mythos yang Siap Mengubah Peta Persaingan Global
    10 Min Read
  • Mobile
    MobileShow More
    Gebrakan Google Play: Kampanye ‘Mega Game Sale’ Pangkas Harga Game Android Populer Menjadi Hanya $0.10
    12 Min Read
    AIB Guncang Sektor Perbankan: Rombak Total Aplikasi Mobile Setelah Satu Dekade Demi Pengalaman Finansial Paripurna
    12 Min Read
    Rahasia Layar Android Auto Lebih Berguna: 3 Aplikasi Sideload Terbaik untuk Nonton YouTube dan Browsing di Mobil
    11 Min Read
    Revolusi Gadget Lansia: Consumer Cellular Rilis SpeakEasy, Ponsel Khusus Usia 75+ yang Anti-Ribet!
    10 Min Read
    CatchCat: Eksperimen Game AR Bertema Kucing yang Berpotensi Viral Namun Disebut Sebagai Peluang yang Terbuang Sia-sia
    9 Min Read
  • Gadget
    GadgetShow More
    Solusi Akhir Keluhan Pengguna: Google Resmi Perbaiki Glitch SiriusXM yang Mengganggu di Speaker Pintar Google Home
    12 Min Read
    Solusi Keamanan Rumah Pintar: Kamera Reolink 4K Outdoor PTZ Kini Dibanderol Harga Terendah Sepanjang 2026 di Prime Day
    12 Min Read
    iPhone Ultra Lipat Siap Meluncur September: Apple Pecahkan Masalah Engsel dan Mulai Produksi Massal!
    10 Min Read
    Bocoran Samsung Galaxy Z Fold 8 Ultra: Revolusi Layar Lipat dengan Peningkatan Piksel Masif dan Signifikan
    11 Min Read
    Samsung Galaxy A37 5G Pecahkan Rekor Harga Terendah: Diskon 33% di Amazon Prime Day Jadi Rebutan!
    10 Min Read
  • Software
    SoftwareShow More
    Revolusi Google Chrome: Gemini Kini Bisa ‘Melihat’ Layar Anda dan Gemini 3.5 Flash Resmi Mendukung ‘Computer Use’
    11 Min Read
    Bye-Bye Biaya Langganan! Dapatkan Microsoft Office Pro 2021 Lisensi Seumur Hidup Hanya Dengan $30, Hemat Hingga 70 Persen
    10 Min Read
    Transformasi Windows 11 Setelah 5 Tahun: Dari Awal yang Sulit Menjadi Sistem Operasi Terbaik Microsoft Dekade Ini
    14 Min Read
    Revolusi Privasi Mengetik: FUTO Swipe Hadir Sebagai Penantang Gboard dengan Model Gesture Typing yang 100% Lokal
    9 Min Read
    Mengenang Sosok Jenius di Balik Garis Gelombang Merah Microsoft Word: Inovasi Sederhana yang Mengubah Dunia Penulisan Digital Selamanya
    12 Min Read
  • Gaming
    GamingShow More
    Gebrakan Google Play: Kampanye ‘Mega Game Sale’ Pangkas Harga Game Android Populer Menjadi Hanya $0.10
    12 Min Read
    Google Play Mega Game Sale Meledak: Game Premium Mulai Rp 1.500 dan Diskon Raksasa Galaxy Z Fold 7 yang Wajib Anda Cek!
    12 Min Read
    Revolusi Layar Ganda Terjangkau: 4 Monitor Portabel Diskon Besar di Prime Day, Harga Mulai 600 Ribuan!
    10 Min Read
    Diskon Besar Secretlab Prime Day 2024: Hemat Hingga $129 untuk Kursi Titan Evo dan Meja Magnus!
    9 Min Read
    Investigasi Rakit PC Gaming $1000 Terbaik 2026: Kekuatan RTX 5060 Ti dan 32GB RAM di Amazon Prime Day yang Mengalahkan PC Prebuilt!
    12 Min Read
  • Education
    EducationShow More
    Revolusi Pendidikan Prabowo: Dari Sekolah Rakyat ke Era Digital, Strategi Besar Cetak SDM Unggul Indonesia
    11 Min Read
    Siasat Licik Siswa Kelabui Detektor AI: Mengenal Aplikasi ‘Humanizer’ dan ‘Autotyper’ yang Mengancam Integritas Akademik
    12 Min Read
    Gen Z Skeptis Terhadap AI: Mengapa Universitas Harus Berhenti Memaksakan Teknologi dan Mulai Mendengarkan Mahasiswa
    10 Min Read
    Misteri Adaptasi Gelap: Mengapa Mata Manusia Membutuhkan Waktu Lama untuk Melihat dalam Kegelapan?
    10 Min Read
    Kisah Luar Biasa Rohit Goeptar: Dari Kemiskinan di Suriname Menuju Puncak Karier di NASA
    11 Min Read
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2022 HeryArts News Network. Company. All Rights Reserved.
Reading: Terobosan Alibaba Qwen-AgentWorld: Melatih AI Memahami Konsekuensi Dunia Sebelum Bertindak
Share
Sign In
Notification Show More
Font ResizerAa
HeryArts NewsHeryArts News
Font ResizerAa
  • Home
  • Tech News
  • AI News
  • Mobile
  • Gadget
  • Software
  • Gaming
  • Education
Search
  • Home
  • Tech News
  • AI News
  • Mobile
  • Gadget
  • Software
  • Gaming
  • Education
Have an existing account? Sign In
Follow US
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2022 HeryArts News Network. Company. All Rights Reserved.
HeryArts News > Blog > Artificial Intelligence > Terobosan Alibaba Qwen-AgentWorld: Melatih AI Memahami Konsekuensi Dunia Sebelum Bertindak
Artificial IntelligenceChina TechIndustri TeknologiInovasi TeknologiKecerdasan Buatan

Terobosan Alibaba Qwen-AgentWorld: Melatih AI Memahami Konsekuensi Dunia Sebelum Bertindak

Last updated: June 24, 2026 9:54 pm
heryarts
Share
SHARE

Dunia kecerdasan buatan baru saja menyaksikan pergeseran paradigma yang fundamental melalui peluncuran terbaru dari tim Qwen Alibaba. Pada hari Selasa, raksasa teknologi asal Tiongkok ini merilis Qwen-AgentWorld, sebuah inovasi yang tidak melatih AI untuk sekadar menjalankan tugas, melainkan untuk memprediksi hasil dari setiap interaksi dalam sebuah lingkungan. Pendekatan yang dikenal sebagai World Model ini menandai langkah ambisius Alibaba dalam menciptakan agen otonom yang jauh lebih cerdas dan adaptif dibandingkan teknologi yang ada saat ini. Dengan fokus pada prediksi status lingkungan daripada pemilihan tindakan langsung, model ini memberikan landasan kognitif yang lebih dalam bagi AI untuk memahami ‘sebab-akibat’ di dunia digital.

Contents
Mengapa Pendekatan World Model Menjadi Sangat Krusial?Tiga Tahap Pelatihan Menuju General AgentsArsitektur Teknis: Kekuatan di Balik Mixture-of-ExpertsLonjakan Performa di Atas Benchmark IndustriKritik dan Skeptisisme dari Komunitas Peneliti AIPandangan ke Depan: Revolusi Pipeline Agen AI

Peluncuran ini merupakan kelanjutan dari strategi agresif Alibaba dalam pengembangan agen otonom yang sebelumnya telah diperkenalkan melalui Qwen3.7-Max pada bulan Mei lalu. Sebagai pengingat, Qwen3.7-Max dibangun dengan kemampuan eksekusi otonom selama 35 jam non-stop dan mendukung berbagai harness eksternal. Namun, Qwen-AgentWorld membawa ambisi tersebut ke level yang berbeda dengan mencakup tujuh domain utama di bawah satu arsitektur tunggal, yaitu Model Context Protocol (MCP), Search, Terminal, Software Engineering, Android, Web, dan Sistem Operasi (OS). Integrasi lintas domain ini memungkinkan satu model tunggal untuk memahami berbagai ekosistem teknis secara simultan tanpa perlu beralih konteks secara kaku.

Mengapa Pendekatan World Model Menjadi Sangat Krusial?

Selama ini, para pengembang agen AI menghadapi ‘tembok besar’ saat mencoba melatih model dalam skala besar menggunakan lingkungan nyata. Mesin pencari asli akan selalu menampilkan hasil apa pun yang tersedia tanpa mekanisme untuk menyuntikkan kondisi terkontrol yang dibutuhkan untuk pengujian. Begitu pula dengan terminal sistem operasi yang sedang berjalan; pengembang tidak bisa secara instan memaksa kondisi ‘disk penuh’ atau ‘kegagalan jaringan’ hanya untuk melihat bagaimana respons AI. Ketergantungan pada lingkungan produksi yang kaku ini membuat pelatihan agen AI menjadi sangat terbatas pada skenario umum dan jarang terpapar pada kasus-kasus ekstrem atau edge cases yang justru sering terjadi di lapangan.

Di sinilah Qwen-AgentWorld hadir sebagai penyelamat dengan menciptakan simulator yang mampu mereplikasi perilaku lingkungan digital secara akurat. Alih-alih bertanya ‘apa yang harus saya lakukan selanjutnya?’, model ini dilatih untuk menjawab pertanyaan ‘jika agen melakukan tindakan X, apa yang akan ditampilkan oleh lingkungan selanjutnya?’. Pembalikan logika ini memungkinkan tim peneliti untuk melatih agen di dalam simulator yang terkendali, di mana mereka bisa memanipulasi kondisi lingkungan sesuka hati. Hasilnya sangat mengejutkan; agen yang dilatih dalam simulator ini menunjukkan peningkatan performa yang melampaui agen yang hanya dilatih di lingkungan nyata, membuktikan bahwa pemahaman teoritis tentang lingkungan sangat membantu eksekusi praktis.

Tiga Tahap Pelatihan Menuju General Agents

Proses pengembangan Qwen-AgentWorld dilakukan melalui tiga tahap yang sangat sistematis dan mendalam. Pada tahap pertama, model diajarkan tentang perilaku dasar berbagai lingkungan, mulai dari struktur sistem file, perubahan status pada terminal, hingga perubahan hierarki DOM pada peramban web dan respons API. Tahap kedua berfokus pada kemampuan penalaran, di mana model dilatih untuk memikirkan kemungkinan hasil sebelum memberikan prediksi akhir. Tahap terakhir melibatkan Reinforcement Learning (RL) yang menggunakan pemeriksaan berbasis aturan dan penilaian kualitas terbuka untuk mempertajam akurasi prediksi model terhadap realitas.

  • Tahap 1: Grounding Lingkungan – Mempelajari pola dasar respons dari sistem teknis seperti file system dan API.
  • Tahap 2: Reasoning – Mengembangkan kemampuan logika untuk memprediksi status lingkungan di masa depan.
  • Tahap 3: Reinforcement Learning – Optimasi prediksi menggunakan feedback loop untuk memastikan akurasi tinggi.

Arsitektur Teknis: Kekuatan di Balik Mixture-of-Experts

Secara teknis, Alibaba merilis dua varian model yang menggunakan desain Mixture-of-Experts (MoE), di mana hanya sebagian kecil parameter yang aktif untuk setiap token yang diproses. Varian pertama memiliki total 35 miliar parameter (35B) dengan hanya 3 miliar parameter yang aktif saat bekerja, sementara varian raksasa 397B mengaktifkan 17 miliar parameter. Kedua model ini dibekali dengan jendela konteks yang sangat luas sebesar 256K context window, memungkinkan mereka untuk memproses informasi dalam jumlah masif dalam satu waktu. Untuk domain antarmuka grafis (GUI) seperti Android dan Web, model ini tidak bekerja berdasarkan tangkapan layar, melainkan melalui textual accessibility trees dan hierarki tampilan UI yang lebih efisien secara komputasi.

Keputusan Alibaba untuk merilis bobot model 35B dan AgentWorldBench di bawah lisensi Apache 2.0 memberikan peluang besar bagi komunitas pengembang global untuk bereksperimen. Namun, perlu dicatat bahwa untuk varian 397B yang lebih kuat, Alibaba memilih untuk tidak merilis bobotnya secara publik, yang kemungkinan besar dilakukan untuk menjaga keunggulan kompetitif atau alasan keamanan siber. Meskipun demikian, ketersediaan model 35B sudah dianggap cukup untuk memberikan dampak signifikan pada industri, terutama bagi tim yang fokus pada efisiensi AI Engineering tanpa memerlukan sumber daya komputasi yang terlalu ekstrem.

Lonjakan Performa di Atas Benchmark Industri

Data dari hasil pengujian menunjukkan bahwa kemampuan prediksi lingkungan ini berkorelasi langsung dengan kesuksesan tugas agen. Dalam pengujian terkontrol, penggunaan simulasi yang disuntik dengan gangguan tertentu (seperti respons parsial yang memaksa agen mengambil langkah ekstra) berhasil mendongkrak skor MCPMark dari 24,6 menjadi 33,8. Pada domain Search, agen yang dilatih di dalam ‘dunia fiksi’ yang diciptakan simulator ternyata mampu mentransfer kemampuannya ke tugas pencarian dunia nyata dengan sangat baik. Skor WideSearch F1 Item melonjak drastis dari 34,02 menjadi 50,31 menggunakan model terbuka 35B, sebuah angka yang menunjukkan validitas dari metode pelatihan ini.

Lebih jauh lagi, pengujian ‘warm-up’ menunjukkan bahwa world model pretraining mampu meningkatkan performa pada benchmark yang bahkan belum pernah dilihat oleh model selama pelatihan. Skor pada BFCL v4 meningkat dari 62,29 menjadi 71,25, sementara pada Claw-Eval skor naik dari 53,60 menjadi 64,88 tanpa adanya fine-tuning khusus untuk agen tersebut. Fenomena ini memperkuat argumen para peneliti Alibaba bahwa pemodelan dunia adalah potongan puzzle yang selama ini hilang dalam perjalanan menuju penciptaan General Agents yang mampu beroperasi di berbagai situasi yang tidak terduga.

Kritik dan Skeptisisme dari Komunitas Peneliti AI

Meskipun hasilnya tampak luar biasa, rilis ini tidak luput dari sorotan tajam para pakar di platform X. Salah satu poin yang menjadi perdebatan adalah mengenai AgentWorldBench, yang merupakan benchmark buatan Alibaba sendiri. Beberapa pengamat, seperti akun @TheSignal_Desk, menunjukkan skeptisisme dengan menyebut bahwa Alibaba membuat tesnya sendiri dan kemudian menjuarainya. Hal ini sering terjadi di industri AI, namun tetap memerlukan verifikasi pihak ketiga untuk memastikan tidak ada bias yang menguntungkan arsitektur Qwen secara spesifik. Validitas benchmark internal selalu menjadi isu sensitif dalam transparansi riset teknologi global.

“Setiap model agen lainnya dilatih untuk bertindak di lingkungan. Qwen membalikkan pertanyaan tersebut. Mereka melatih model untuk memprediksi lingkungan itu sendiri… Pengetahuan prediktif itu kemudian ditransfer ke tugas agen bahkan tanpa fine-tuning khusus agen.” — @drawais_ai, Peneliti AI/ML.

Selain masalah benchmark, risiko overfitting terhadap simulator juga menjadi perhatian utama. Praktisi AI seperti @limalemonnn memperingatkan bahwa jika simulator terlalu ‘bersih’ atau memiliki pola tertentu, agen mungkin hanya belajar untuk memenangkan simulator tersebut daripada mempelajari tugas yang sebenarnya. Namun, Alibaba memberikan jawaban parsial terhadap kekhawatiran ini melalui hasil pencarian di dunia fiksi yang berhasil ditransfer ke tugas nyata. Kemampuan model untuk tetap relevan di lingkungan yang berbeda menunjukkan bahwa Qwen-AgentWorld tidak hanya sekadar menghafal pola simulator, tetapi benar-benar menangkap logika dasar dari interaksi sistem.

Pandangan ke Depan: Revolusi Pipeline Agen AI

Bagi tim Software Engineering dan pengembang pipeline AI, karya Alibaba ini memberikan sinyal kuat bahwa cara kita membangun agen otonom akan berubah total. Kita kini memasuki era di mana lingkungan sintetis menjadi lapisan pelatihan yang sah dan krusial, bukan sekadar jalan pintas. Kemampuan untuk menyuntikkan skenario kegagalan yang langka ke dalam simulator berarti agen AI di masa depan akan jauh lebih tangguh saat menghadapi masalah teknis di dunia nyata yang sebelumnya tidak pernah mereka temui selama masa pengembangan.

Kesimpulan utama dari riset ini adalah bahwa apa yang dipelajari model sebelum pelatihan agen dimulai jauh lebih penting daripada yang diperkirakan sebelumnya. Dengan membuktikan bahwa environment grounding yang dilakukan sejak dini dapat meningkatkan performa secara masif, Alibaba telah menetapkan standar baru dalam pengembangan kecerdasan buatan. Masa depan agen otonom tidak lagi hanya tentang seberapa cepat mereka bisa bertindak, tetapi seberapa dalam mereka memahami konsekuensi dari setiap tindakan yang mereka ambil di dunia digital yang semakin kompleks ini. Belum ada konfirmasi resmi mengenai kapan model 397B akan tersedia, namun arah industri kini jelas tertuju pada pemodelan dunia sebagai fondasi utama.

You Might Also Like

Solusi Akhir Keluhan Pengguna: Google Resmi Perbaiki Glitch SiriusXM yang Mengganggu di Speaker Pintar Google Home

Solusi Keamanan Rumah Pintar: Kamera Reolink 4K Outdoor PTZ Kini Dibanderol Harga Terendah Sepanjang 2026 di Prime Day

iPhone Ultra Lipat Siap Meluncur September: Apple Pecahkan Masalah Engsel dan Mulai Produksi Massal!

Bocoran Samsung Galaxy Z Fold 8 Ultra: Revolusi Layar Lipat dengan Peningkatan Piksel Masif dan Signifikan

Samsung Galaxy A37 5G Pecahkan Rekor Harga Terendah: Diskon 33% di Amazon Prime Day Jadi Rebutan!

TAGGED:#AI#AlibabaGroup#ArtificialIntelligence#Benchmark#ChinaTech#GenerativeAI#InovasiTeknologi#KecerdasanBuatan#MachineLearning#MasaDepanAI#ModelContextProtocol#ReinforcementLearning#SoftwareEngineering#TechNewsAgenticAI

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.
By signing up, you agree to our Terms of Use and acknowledge the data practices in our Privacy Policy. You may unsubscribe at any time.
Share This Article
Facebook Twitter Copy Link Print
Share
Previous Article Revolusi Figma Config 2026: Code Layers dan Plugin AI Kustom Resmi Hadir untuk Akhiri Era Handoff Desain yang Rumit
Next Article Xiaomi HarnessX Guncang Dunia AI: Inovasi ‘Self-Rewriting’ yang Membuat Model Kecil Berlari Lebih Cepat dari Raksasa
Leave a comment

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Stay Connected

248.1kLike
54.3kFollow
10.3kSubscribe
39.5kFollow
banner banner
Create an Amazing Newspaper
Discover thousands of options, easy to customize layouts, one-click to import demo and much more.
Learn More

Latest News

Gebrakan Prime Day: Nothing Ear 3 Hancurkan Harga ke Rekor Terendah $128, Inilah TWS dengan Super Mic Paling Dicari!
Belanja Online Elektronik Gadget Gaya Hidup Digital Teknologi
Terobosan Besar! FDA Akhirnya Melunak Terkait Fitur Tekanan Darah WHOOP: Kemenangan Baru Bagi Dunia Kesehatan Digital
Gadget Healthcare AI Inovasi Teknologi Kebijakan Publik Kesehatan Digital
Panduan Belanja Prime Day 2026: Diskon Gila-Gilaan Anker, Beats, Sonos, hingga Smart TV yang Wajib Anda Miliki!
Belanja Online Gadget Gaya Hidup Digital Inovasi Teknologi Teknologi
Harga iPad Mini 7 Terjun Bebas! Diskon Langka $99 di Amazon Prime Day 2026, Kesempatan Emas yang Tak Boleh Dilewatkan
Apple Belanja Online Bisnis Gadget Teknologi
//

We influence 20 million users and is the number one business and technology news network on the planet

Quick Link

  • Contact
  • Blog
  • Complaint
  • Advertise

Support

Sign Up for Our Newsletter

Subscribe to our newsletter to get our newest articles instantly!

HeryArts NewsHeryArts News
Follow US
© 2022 HeryArts News Network. Company. All Rights Reserved.
Join Us!

Subscribe to our newsletter and never miss our latest news, podcasts etc..

[mc4wp_form]
Zero spam, Unsubscribe at any time.
Welcome Back!

Sign in to your account

Lost your password?