Microsoft mulai memperlihatkan arah baru dalam persaingan kecerdasan buatan dengan merilis model AI buatan sendiri yang siap menantang dominasi OpenAI dan Google. Tiga model tersebut adalah MAI-Transcribe-1, MAI-Voice-1, dan MAI-Image-2, dan semuanya sudah tersedia lewat platform Microsoft Foundry serta MAI Playground.
Langkah ini penting karena Microsoft selama ini dikenal sangat dekat dengan OpenAI melalui kemitraan teknologi dan investasi besar di layanan AI. Kini, perusahaan tidak hanya bergantung pada model pihak ketiga, tetapi juga mulai membangun fondasi model miliknya sendiri untuk kebutuhan produk dan pengembang.
Tiga model AI Microsoft dan fungsinya
Microsoft menyiapkan ketiga model itu untuk kebutuhan yang berbeda, yakni mendengar, berbicara, dan melihat. MAI-Transcribe-1 fokus pada transkripsi suara ke teks, MAI-Voice-1 menangani pembuatan audio sintetis, dan MAI-Image-2 diarahkan untuk pembuatan gambar.
Berikut ringkasan kemampuan utama ketiganya:
- MAI-Transcribe-1: mendukung speech-to-text dalam 25 bahasa dan diklaim 2,5 kali lebih cepat dibanding Azure Fast milik Microsoft sendiri.
- MAI-Voice-1: mampu menghasilkan 60 detik audio terdengar natural hanya dalam waktu satu detik dan mendukung pembuatan suara kustom dari klip audio pendek.
- MAI-Image-2: sudah masuk tiga besar pada papan peringkat generasi gambar di Arena.ai.
Microsoft juga menyebut model audio tersebut dibangun oleh tim kecil berisi 10 orang. Fakta ini menunjukkan bahwa perusahaan ingin menonjolkan efisiensi pengembangan sekaligus kemampuan teknis yang kompetitif.
Masuk ke produk Microsoft yang sudah populer
Peluncuran model ini tidak berdiri sendiri, karena Microsoft mulai menanamkannya ke produk yang sudah digunakan banyak orang. Rollout MAI-Image-2 dilaporkan sedang berlangsung di Bing dan PowerPoint, dua layanan yang punya jangkauan luas di ekosistem Microsoft.
Integrasi seperti ini penting karena memberi Microsoft jalur distribusi yang kuat. Jika model buatan sendiri bekerja baik di Bing, PowerPoint, Copilot, atau Teams, perusahaan bisa mempercepat adopsi tanpa harus sepenuhnya bergantung pada teknologi eksternal.
Jejak kemitraan dengan OpenAI mulai berubah
Pergerakan Microsoft ini juga tidak lepas dari batasan kontrak dengan OpenAI yang sebelumnya membatasi perusahaan untuk membuat frontier AI sendiri. Menurut informasi yang tersedia, pembatasan itu berlaku hingga Oktober 2025, setelah kesepakatan yang ditandatangani pada 2019 mengatur bahwa Microsoft memperoleh lisensi atas model OpenAI sebagai imbalan atas dukungan infrastruktur cloud.
Namun, kontrak itu juga melarang Microsoft membangun model AI frontier miliknya sendiri. Setelah pembatasan itu berubah, Microsoft mulai merilis model yang sebelumnya diam-diam mendukung Copilot dan Teams di belakang layar.
Persaingan harga jadi senjata tambahan
Selain kemampuan teknis, harga juga menjadi bagian penting dari strategi Microsoft. Perusahaan disebut memasang harga yang lebih rendah dibandingkan penawaran serupa dari Amazon dan Google.
Strategi ini bisa menarik perhatian pengembang yang mencari model AI dengan performa baik tetapi tetap efisien secara biaya. Dalam pasar AI generatif yang semakin kompetitif, selisih harga bisa menjadi faktor penentu adopsi, terutama untuk bisnis yang ingin menekan biaya operasional.
Posisi Microsoft di tengah persaingan AI
Meski model-model baru ini menunjukkan ambisi yang makin besar, Microsoft belum menunjukkan sinyal ingin memutus hubungan dengan OpenAI. Mustafa Suleyman, CEO Microsoft AI, tetap menegaskan komitmen perusahaan terhadap kemitraan tersebut.
Artinya, Microsoft tampaknya memilih strategi ganda: tetap memanfaatkan kerja sama yang sudah ada sambil membangun jalur mandiri lewat model internal. Jika performa MAI-Transcribe-1, MAI-Voice-1, dan MAI-Image-2 terus kuat, keluarga model MAI berpeluang menjadi tulang punggung utama portofolio AI Microsoft di masa mendatang.
