GLM-5.2 Salip Claude Fable 5, Juara Baru Web Design AI Ini Bisa Mengusik Pilihan Tim Developer

Persaingan model AI untuk desain web memasuki babak baru setelah GLM-5.2 dari Zhipu AI disebut merebut posisi teratas di salah satu tolok ukur creative coding yang banyak diperhatikan. Model asal China itu menyalip Claude Fable 5 dan mengklaim peringkat nomor satu pada leaderboard desain web HTML single-round untuk kategori non-agent.

Kabar ini menonjol bukan hanya karena perubahan posisi di papan atas, tetapi juga karena datang dari benchmark berbasis penilaian manusia. Design Arena menyusun hasilnya dari voting buta terhadap desain buatan AI, sehingga penilaian berfokus pada tampilan, kegunaan, dan kualitas hasil akhir yang benar-benar dilihat pengguna.

Design Arena mengumumkan pada 19 Juni bahwa GLM-5.2 kini berada di posisi #1 dalam leaderboard tersebut. Menurut platform itu, model ini mengungguli Claude Fable 5, sekaligus melampaui versi Opus 4.6 dan 4.7.

Lompatan GLM-5.2 juga terbilang besar dibanding pendahulunya. Dari posisi GLM-5.1, model baru ini naik lima peringkat dan mencatat skor Elo sekitar 1360 di arena kategori kode.

Mengapa hasil ini menarik

Keunggulan GLM-5.2 disebut terlihat langsung pada cara model itu membangun halaman web. Hasilnya menonjol pada tata letak yang bersih, pemakaian gambar dari CDN, tipografi, hierarki visual, dan animasi halus yang membuat situs terasa lebih hidup.

Model ini juga dinilai bekerja baik dengan pustaka populer untuk kebutuhan front-end. Design Arena mencatat kompatibilitas yang kuat dengan Chart.js dan Three.js, dua library yang sering dipakai untuk visualisasi data dan elemen interaktif.

Dalam putaran terbaru, tingkat kemenangan GLM-5.2 dilaporkan naik sekitar 6 poin persentase. Kenaikan itu memperkuat kesan bahwa peningkatan model bukan sekadar kosmetik, melainkan terlihat pada hasil desain yang lebih sering dipilih pengguna.

Ada pula detail teknis yang menarik dari pola desainnya. GLM-5.2 sangat sering memakai Tailwind CSS, muncul pada 91% desain yang dihasilkannya, serta Font Awesome pada 51% sesi.

Sebagai pembanding, Fable 5 hanya menggunakan Tailwind CSS pada sekitar 57% sesinya. Perbedaan ini dinilai bisa membantu menjelaskan celah praktis yang terlihat pada hasil desain masing-masing model.

Benchmark yang menitikberatkan pilihan manusia

Bobot hasil ini ikut diperkuat oleh metode evaluasi Design Arena. Platform itu menyebut benchmark-nya sebagai arena crowdsourced besar untuk creative coding, tempat orang-orang memberikan suara secara buta terhadap desain yang dibuat model AI.

Pendekatan seperti ini berbeda dari pengujian sintetis yang hanya menilai output lewat metrik otomatis. Dalam desain web, faktor seperti rasa visual, keterbacaan, penataan elemen, dan kenyamanan penggunaan memang sering lebih mudah ditangkap lewat penilaian manusia.

Design Arena juga menyebut telah mengumpulkan jutaan suara dari para kreator. Basis penilaian semacam itu membuat hasil leaderboard ini dianggap relevan untuk melihat performa model pada tugas yang dekat dengan kebutuhan dunia nyata.

Harga murah jadi faktor penting

Selain performa, GLM-5.2 menonjol dari sisi biaya pemakaian. API model ini disebut dibanderol sekitar $1.40 per satu juta token input dan $4.40 untuk output.

Angka itu jauh di bawah Fable 5, yang disebut berada di kisaran $10 untuk input dan $50 untuk output. Selisih biaya tersebut bisa menjadi faktor penting bagi tim pengembang yang menjalankan beban kerja besar atau iterasi desain dalam jumlah tinggi.

GLM-5.2 juga hadir sebagai model open-weights dengan lisensi MIT. Artinya, tim dapat menjalankannya secara lokal dan tidak sepenuhnya bergantung pada layanan proprietary.

Model ini turut membawa context window 1 juta token. Kapasitas konteks sebesar itu memberi ruang lebih luas untuk menangani proyek panjang, instruksi besar, dan alur kerja yang lebih kompleks dalam satu sesi.

Dampak lebih luas di industri AI

Kemenangan GLM-5.2 dipandang melampaui sekadar adu kuat di desain web. Hasil ini juga menempatkannya di antara model terbuka yang dinilai kuat dalam benchmark coding yang lebih luas.

Bagi industri AI, perkembangan ini menjadi sinyal lain bahwa laboratorium AI China bergerak cepat di area kreatif yang semakin spesifik. Persaingan kini tidak lagi hanya soal chatbot umum, tetapi juga soal kemampuan menghasilkan antarmuka yang siap dipakai, efisien, dan menarik secara visual.

Claude Fable 5 tetap disebut sebagai pemain kuat di kategori ini. Namun kombinasi performa tinggi, biaya yang lebih rendah, dan sifat terbuka membuat GLM-5.2 berpotensi menjadi pilihan menarik bagi banyak tim pengembangan web yang membutuhkan hasil cepat tanpa biaya setinggi layanan tertutup.

Source: www.gizmochina.com

Terkait