Artificial intelligence kini mulai merambah biologi dengan cara yang berbeda dari aplikasi AI pada teks atau gambar. Jika model bahasa belajar dari kata, foundation model untuk DNA belajar dari urutan genetik, dan pendekatan ini berpotensi mengubah cara ilmuwan memahami tanaman, mempercepat pemuliaan, serta meningkatkan ketahanan terhadap perubahan iklim.
Perubahan itu penting karena data genomik terus membengkak, tetapi kemampuan manusia untuk menafsirkannya masih tertinggal. Sekuensing DNA kini lebih murah dan lebih luas digunakan, namun tantangan utamanya bukan lagi mengumpulkan data, melainkan menjelaskan bagaimana urutan-urutan itu memengaruhi sifat nyata seperti hasil panen, toleransi kekeringan, atau respons terhadap lingkungan.
Mengapa DNA menjadi “bahasa” baru untuk AI
Dalam wawancara yang dikutip referensi, Bertrand Gakière, VP Biology di Living Models, menekankan bahwa semua makhluk hidup berjalan dengan “bahasa pemrograman” yang sama: DNA mengode RNA, RNA mengode protein, lalu protein membentuk fenotipe. Ia menegaskan, “Kami bukan membangun chatbot lain. Kami membangun model yang bisa membaca dan menafsirkan kode itu.”
Pendekatan ini memakai arsitektur transformer, teknologi yang sebelumnya mendorong lompatan besar pada model bahasa besar. Bedanya, model biologis tidak memprediksi kata berikutnya, melainkan mencari pola struktural dalam sekuens biologis, termasuk motif konservatif, hubungan jarak jauh antarbagiannya, dan aturan regulasi yang sulit ditangkap metode statistik klasik.
Berikut perbedaan sederhana antara pendekatan lama dan baru:
| Pendekatan | Fokus | Kelemahan utama |
|---|---|---|
| Model genomik klasik | Korelasi penanda genetik dan fenotipe | Sulit dipakai di lingkungan atau spesies baru |
| Foundation model DNA | Struktur biologis dari sekuens mentah | Masih butuh validasi eksperimen |
| Hybrid workflow | AI + data lapangan + ahli agronomi | Bergantung pada kualitas data dan integrasi |
Mengapa tanaman menjadi titik awal
Living Models memilih tanaman sebagai domain pertama karena tiga alasan praktis yang kuat. Data genom tanaman bersifat publik, hambatan regulasinya lebih ringan dibanding manusia, dan siklus eksperimen lebih cepat karena hasil uji bisa terlihat dalam satu musim tanam.
Selain itu, sektor pertanian menghadapi tekanan langsung dari iklim. Kekeringan, gelombang panas, dan pergeseran musim tanam sudah mengganggu produksi pangan di banyak wilayah, sehingga kebutuhan untuk mengidentifikasi kombinasi gen yang relevan menjadi semakin mendesak.
Perusahaan itu menyebut telah melatih modelnya pada 1.600 genom tanaman. Mereka juga menyatakan bahwa data pelatihan mencakup ribuan genom tanaman secara publik, tanpa ketergantungan hukum seperti izin pasien atau proses etika yang rumit.
Apa yang bisa diubah oleh model DNA
Nilai utama foundation model biologis bukan menggantikan peneliti, melainkan mempersempit ruang pencarian. Dalam pemuliaan tanaman, AI dapat memprioritaskan kandidat varian gen yang paling mungkin memengaruhi toleransi kekeringan, efisiensi air, atau stabilitas hasil panen sebelum masuk ke uji lapangan.
Satu contoh yang diangkat referensi adalah pengembangan gandum yang tahan kekeringan. Proses tradisional bisa memakan lima hingga dua belas tahun dari hipotesis awal sampai varietas komersial, dengan banyak kandidat gagal di tahap akhir. Model DNA dapat membantu menyaring kandidat lebih awal, sehingga eksperimen lapangan menjadi lebih efisien.
Manfaat lain yang disorot adalah kemampuan model untuk bekerja pada kombinasi gen baru yang belum pernah muncul dalam data historis. Ini penting karena model korelatif lama cenderung melemah ketika dipakai pada lingkungan berbeda atau latar genetik yang belum dikenal.
Risiko, batasan, dan cara pengamanannya
Meski menjanjikan, model biologis tidak boleh diperlakukan seperti mesin keputusan otomatis. Living Models menyebut BOTANIC sebagai “hypothesis engine”, bukan sistem penentu akhir, sehingga hasilnya tetap harus divalidasi lewat eksperimen dan pengetahuan agronomi.
Untuk mengurangi risiko “hallucination” biologis, perusahaan itu menekankan tiga lapisan pengaman. Pertama, setiap prediksi dilengkapi distribusi kepercayaan, bukan angka tunggal. Kedua, area genom dengan data rendah ditandai agar tidak disalahartikan. Ketiga, model dipakai dalam alur kerja yang tetap melibatkan ahli dan uji lapangan multi-musim.
Arah teknologi berikutnya
Perkembangan foundation model DNA menunjukkan bahwa AI mulai bergerak dari penalaran berbasis bahasa menuju penalaran berbasis kehidupan. Dalam konteks tanaman, perubahan ini dapat mempercepat pemuliaan, memperkuat ketahanan pangan, dan membuka cara baru membaca hubungan antara gen, lingkungan, dan hasil panen secara lebih sistematis.
