Geekbench menemukan lonjakan performa hingga 30% pada pengujian tertentu saat Intel Binary Optimization Tool, atau iBOT, aktif di CPU Intel terbaru. Temuan ini muncul setelah Geekbench meninjau ulang hasil benchmark pada Core Ultra 7 270K Plus dan Core Ultra 5 250K Plus, lalu mengungkap bahwa peningkatan itu berasal dari instruksi yang sudah divektorkan ulang untuk arsitektur Intel tertentu.
Kasus ini penting karena iBOT tidak bekerja seperti optimasi umum yang berlaku luas di semua aplikasi. Teknologi itu justru memodifikasi binary agar cocok dengan satu arsitektur Intel spesifik, sehingga hasil benchmark bisa mencerminkan performa puncak, bukan performa tipikal dalam penggunaan harian.
Geekbench menelusuri sumber lonjakan performa
Setelah hasil awal dari Core Ultra 7 270K Plus dan Core Ultra 5 250K Plus dipublikasikan, Geekbench menyatakan akan membatalkan semua skor yang dicatat dengan dua prosesor tersebut. Langkah itu diambil karena Geekbench menjadi satu-satunya aplikasi non-game yang saat ini mendukung Intel Binary Optimization Tool.
Sekitar sepekan kemudian, Geekbench merilis hasil investigasi internal terhadap apa yang dilakukan iBOT di balik layar. Dari penelusuran itu, Geekbench menyimpulkan bahwa ada peningkatan hingga 30% pada beban kerja tertentu, dan sumber utamanya berasal dari instruksi baru yang diubah menjadi format vectorized.
Dalam pengujian Geekbench 6.3 pada MSI Prestige 16 AI+ dengan Intel Core Ultra 9 386H, Geekbench mencatat kenaikan performa total sebesar 5,5% untuk single-thread dan multi-thread. Namun, beberapa subtes menunjukkan lonjakan yang jauh lebih tinggi, termasuk object removal yang naik 24,6% dan HDR processing yang naik 28,5%.
Apa yang berubah di dalam instruksi
Geekbench kemudian membedah subtes HDR secara lebih detail karena hasilnya paling mencolok. Saat iBOT diaktifkan, Geekbench melihat penurunan 14% pada total instruksi dan penurunan 62% pada scalar instructions.
Di saat yang sama, vector instructions justru melonjak 1.366%. Perubahan komposisi instruksi ini menjadi petunjuk utama bahwa iBOT berhasil memindahkan sebagian besar beban kerja dari jalur scalar ke jalur vector yang lebih efisien.
Untuk memastikan jenis instruksi yang berjalan, Geekbench memakai Intel Software Development Emulator atau SDE. Hasilnya menunjukkan bahwa setelah 100 kali menjalankan subtes HDR tanpa iBOT, total instruksi scalar mencapai 220 miliar dan vector instructions 1,25 miliar.
Saat iBOT diaktifkan, jumlah itu berubah menjadi 84,6 miliar instruksi scalar dan 18,3 miliar instruksi vector. Pergeseran besar ini menunjukkan bahwa iBOT memanfaatkan pendekatan SIMD, atau single instruction, multiple data, yang memungkinkan satu instruksi memproses banyak data sekaligus.
Mengapa hasil ini memicu perdebatan
Geekbench menilai pendekatan tersebut problematis untuk benchmark umum. Alasannya, optimasi yang sangat spesifik bisa mengubah gambaran performa dari kondisi nyata menjadi kondisi ideal yang hanya terjadi pada aplikasi tertentu.
Menurut Geekbench, iBOT “mengganti kode yang beragam dengan binary yang disesuaikan prosesor dan sepenuhnya dioptimalkan, sehingga mengukur performa puncak alih-alih performa tipikal.” Pandangan itu memperlihatkan kekhawatiran bahwa hasil benchmark bisa menjadi kurang representatif bila hanya sebagian kecil aplikasi yang dioptimalkan secara khusus.
Di sisi lain, temuan ini juga memperlihatkan bagaimana vectorized instructions dapat memberi dampak besar tanpa selalu menaikkan konsumsi daya secara ekstrem. Dalam industri CPU modern, pendekatan seperti ini memang sering dipakai untuk memaksimalkan throughput pada tugas komputasi tertentu.
Catatan teknis dari pengujian Geekbench
Ada beberapa detail lain yang ikut menarik perhatian dalam investigasi ini. Pada pengujian awal, Geekbench mencatat jeda startup selama 40 detik ketika iBOT aktif, lalu turun menjadi sekitar dua detik pada percobaan berikutnya.
Saat iBOT dimatikan, jeda tersebut tidak muncul. Geekbench juga menemukan bahwa pada Geekbench 6.7 tidak ada peningkatan performa yang berarti, sementara iBOT diketahui memakai checksum terhadap executable untuk memastikan apakah binary tertentu layak dioptimalkan.
Berikut ringkasan temuan utama Geekbench:
- iBOT aktif pada beberapa CPU Intel terbaru dan mengubah binary agar sesuai arsitektur tertentu.
- Geekbench menemukan kenaikan performa hingga 30% pada workload tertentu.
- Subtes HDR menunjukkan lonjakan vector instructions sebesar 1.366%.
- Instruksi scalar turun drastis, dari 220 miliar menjadi 84,6 miliar dalam skenario uji yang sama.
- Ada potensi bias benchmark karena hasil lebih mencerminkan peak performance daripada penggunaan umum.
Temuan ini membuat iBOT menjadi sorotan bukan hanya karena efisiensinya, tetapi juga karena dampaknya terhadap interpretasi benchmark. Bagi pengamat hardware, kasus ini menjadi contoh jelas bahwa optimasi berbasis binary dapat mengubah hasil uji secara signifikan, terutama ketika instruksi yang sudah divektorkan ulang mengambil peran lebih besar dalam beban kerja yang dijalankan.
