ChatGPT, asisten kecerdasan buatan (AI) yang banyak digunakan, kini menghadapi ancaman baru. Peneliti keamanan siber telah mengungkap kerentanan yang dijuluki ChatGPhish, yang memungkinkan ringkasan halaman web yang dihasilkan oleh AI ini dimanfaatkan sebagai permukaan serangan phishing.
Baca Juga: ICE Perluas Penggunaan Pemindai Biometrik, Termasuk Pemindaian Iris Mata Senilai $25 Juta
Kerentanan ini mengeksploitasi kepercayaan implisit ChatGPT terhadap tautan dan gambar Markdown, mengubah platform yang seharusnya membantu menjadi alat potensial bagi penyerang.
Dilansir dari The Hacker News, teknik ini dikembangkan oleh Permiso Security. Menurut peneliti keamanan Andi Ahmeti, perender respons chatgpt.com mempercayai tautan Markdown dan URL gambar Markdown yang berasal dari halaman pihak ketiga yang baru saja diringkas oleh asisten. Ini secara otomatis mengambil gambar-gambar tersebut dan menampilkan tautan-tautan tersebut sebagai elemen yang dapat diklik di dalam antarmuka asisten yang terpercaya.
Baca Juga: Awas! Tautan ChatGPT Disalahgunakan untuk Sebar Malware Berkedok Aplikasi Desktop
Dalam skenario serangan hipotetis, seorang aktor jahat dapat menyisipkan muatan kecil ke halaman web mana pun. Ketika korban meminta ChatGPT untuk meringkas halaman tersebut, kerentanan ini akan memicu beberapa konsekuensi berbahaya.
Misalnya, detail seperti alamat IP, User-Agent, dan Referer korban dapat bocor saat gambar yang di-hosting penyerang diambil secara otomatis saat jawaban dirender.
Lebih lanjut, tautan Markdown berbahaya dapat dirender sebagai elemen yang dapat diklik langsung di dalam respons asisten, menampilkan peringatan keamanan palsu bergaya sistem, atau bahkan menyajikan kode QR dari penyimpanan S3 penyerang. Kode QR ini dapat mengelabui korban untuk memindainya melalui perangkat seluler mereka, secara efektif melewati filter URL desktop dan kontrol keamanan perusahaan.
Ini menunjukkan bagaimana fitur ringkasan yang tampaknya tidak berbahaya dapat menjadi permukaan serangan yang signifikan.
Permiso Security menekankan bahwa yang membuat ChatGPhish menjadi teknik serangan yang patut diperhatikan bukanlah injeksi prompt itu sendiri, melainkan cara instruksi yang tertanam dalam halaman web diikuti dan disajikan kepada pengguna sebagai bagian dari ringkasan. Dengan kata lain, halaman web biasa yang diringkas dengan ChatGPT sudah cukup untuk menampilkan tautan phishing, peringatan akun palsu, gambar jarak jauh, dan kode QR langsung di dalam antarmuka AI yang terpercaya.
“Pergeseran dari email ke browser secara signifikan memperluas potensi permukaan serangan. Pengguna tidak lagi harus membuka lampiran berbahaya atau berinteraksi dengan pesan yang mencurigakan,” kata Permiso. “Cukup meringkas halaman selama aktivitas penjelajahan normal dapat menyisipkan instruksi yang dikendalikan penyerang ke dalam konteks model dan pada akhirnya ke dalam respons yang dirender.”
Penemuan ChatGPhish ini muncul bersamaan dengan laporan lain mengenai kerentanan AI. Adversa AI mendokumentasikan dua teknik serangan, SymJack dan TrustFall, yang menargetkan agen pengodean AI dan CLI pengodean agen.
Serangan ini memungkinkan penyerang mencapai eksekusi kode jarak jauh (RCE) dan kompromi mesin secara penuh.
Dalam beberapa bulan terakhir, berbagai metode serangan terhadap model AI juga telah ditemukan, termasuk:
Seiring dengan terus berkembangnya model AI, aktor ancaman semakin bereksperimen dengan teknologi ini untuk menulis malware dengan kemampuan tambahan untuk secara dinamis mengadaptasi perilakunya dalam upaya menghindari deteksi. Mereka juga memanfaatkan LLM untuk menentukan apakah lingkungan yang dikompromikan cukup berharga atau aman untuk menjatuhkan muatan tahap berikutnya.
“Dalam jangka pendek, proliferasi kemampuan model AI canggih berisiko memberdayakan musuh untuk mengeksploitasi zero-days dan N-days pada skala yang belum pernah terjadi sebelumnya,” kata Palo Alto Networks Unit 42. “Kemungkinan juga akan memungkinkan penyerang untuk bergerak pada skala, kecanggihan, dan kecepatan yang lebih besar dari sebelumnya.”
Baca Juga: Xiaomi Mijia Air Conditioner 2026: Hemat Energi dengan Subsidi Pemerintah
Unit 42 juga merinci agen proof-of-concept (PoC) bernama Zealot yang memanfaatkan kekuatan LLM untuk melakukan serangan cloud end-to-end dengan panduan manusia minimal, dengan mengeksploitasi miskonfigurasi dan kerentanan yang diketahui. Ini menunjukkan bahwa lingkungan cloud secara default “AI-Attack-Ready” karena setiap tindakan memiliki API yang setara, memiliki mekanisme penemuan yang bervariasi, penuh dengan miskonfigurasi, dan didorong oleh akses berbasis kredensial. Dengan demikian, kewaspadaan terhadap ancaman siber yang memanfaatkan AI menjadi semakin krusial.








Leave a Comment