GIF Jennifer Aniston 1,6MB Menggandakan Backup 377GB, EXT4 Tumbang Karena Batas Hardlink

Sebuah GIF berukuran hanya 1,6MB ternyata bisa memicu masalah besar pada sistem cadangan website. File animasi Jennifer Aniston dari serial Friends itu diduplikasi 246.173 kali di backup, lalu menggelembungkan kapasitas hingga 377GB dan membuat proses backup gagal karena menabrak batas filesystem Linux EXT4.

Kasus ini datang dari Discourse, platform diskusi open source yang dipakai lebih dari 22.000 komunitas daring. Dalam penjelasan teknis yang dibagikan perusahaan, masalah bermula dari fitur keamanan file yang membuat salinan baru setiap kali sebuah file berpindah konteks keamanan, misalnya dari pesan pribadi ke posting publik.

Bagaimana GIF kecil berubah menjadi beban raksasa

Discourse menjelaskan bahwa sistem “secure uploads” memperlakukan file identik sebagai salinan baru jika konteksnya berubah. Artinya, satu GIF yang sama bisa tersebar di banyak posting, balasan, dan pesan pribadi, lalu setiap perpindahan konteks menciptakan file tambahan.

Pada kasus ini, GIF reaksi “happy dance” Jennifer Aniston menjadi file yang sangat populer di komunitas pengguna. Jake Goldsborough, blog teknis Discourse, menyebut bahwa file tersebut “used constantly in posts, PMs, everywhere,” sehingga duplikasi terus menumpuk tanpa terlihat sebagai masalah sejak awal.

Kondisi itu akhirnya membuat ukuran backup membengkak jauh melebihi data unik yang sebenarnya ada. Dari total 432GB unggahan, analisis internal menunjukkan konten uniknya hanya sekitar 26GB, yang berarti ada inflasi data sekitar 16 kali lipat akibat duplikasi.

Mengapa EXT4 ikut memunculkan masalah

Saat Discourse mencoba menghemat ruang dengan cara mengelompokkan file berdasarkan hash, sistem backup membuat hardlink untuk file yang sama. Namun, Linux EXT4 memiliki batas sekitar 65.000 hardlink per inode, dan batas itu terlampaui dalam kasus yang melibatkan 246.173 duplikat tersebut.

Begitu batas itu tercapai, proses yang semula ditujukan untuk efisiensi justru memicu fallback backup tambahan. Discourse menyebutnya sebagai hasil yang jauh dari harapan, karena bukan satu salinan untuk semua duplikat, melainkan satu unduhan utama ditambah sekitar 181.000 unduhan cadangan setelah limit tercapai.

Inti masalah yang perlu dipahami

  1. File kecil tidak selalu berarti beban kecil bagi infrastruktur.
  2. Kebijakan keamanan yang ketat bisa menciptakan salinan tak terduga.
  3. File system Linux memiliki batas teknis yang tetap harus dihormati.
  4. Optimasi backup perlu memperhitungkan pola pemakaian nyata, bukan hanya ukuran file.

Kasus ini juga menunjukkan bahwa masalah data tidak selalu datang dari file besar atau serangan siber. Kadang, sebuah GIF reaksi yang populer justru menjadi pemicu stres berat bagi sistem penyimpanan dan cadangan.

Solusi yang akhirnya dipakai Discourse

Setelah pendekatan awal tidak efektif, Discourse memperbarui mekanisme backup dengan cara yang lebih tahan terhadap batas filesystem. Sistem tetap memulai dengan hardlink, tetapi ketika muncul error EMLINK atau “too many hardlinks,” file akan disalin secara lokal dan dianggap sebagai file utama baru sampai batas itu tercapai lagi.

Menurut Discourse, pendekatan baru ini bisa berjalan di semua filesystem tanpa konfigurasi tambahan. Perubahan tersebut penting karena mencegah backup macet hanya gara-gara satu file populer yang tersebar terlalu luas di berbagai konteks.

Kasus ini menjadi pengingat bahwa infrastruktur digital sering diuji oleh pola penggunaan yang tampak sepele. Dalam praktiknya, satu GIF reaksi yang viral bisa berubah menjadi beban ratusan gigabyte jika sistem keamanan, duplikasi file, dan batas filesystem tidak dirancang dengan sangat hati-hati.

Terkait