Artificial intelligence
Mengejutkan! Studi Sebut Ringkasan Pencarian AI Google Hasilkan Jutaan Jawaban tak Akurat
JAYAKARTA NEWS— Studi mengejutkan mengungkapkan bahwa ringkasan hasil pencarian yang dihasilkan AI Google menghasilkan jutaan jawaban yang tidak akurat setiap jamnya.
Dikutip dari New York Post, hasil pencarian yang dihasilkan AI Google menghasilkan puluhan juta jawaban yang tidak akurat setiap jamnya – bahkan ketika raksasa teknologi ini menyedot pengunjung dan pendapatan iklan dari media berita yang kekurangan dana, menurut analisis yang mengejutkan.
Untuk menguji keakuratan ringkasan hasil pencarian AI Google, perusahaan rintisan Oumi meninjau 4.326 hasil pencarian Google yang dihasilkan oleh model Gemini 2 Google dan jumlah hasil yang sama yang dihasilkan oleh model Gemini 3 yang lebih canggih.
Analisis tersebut menemukan bahwa model-model tersebut akurat masing-masing sebesar 85% dan 91%.
Dengan Google diperkirakan akan menangani lebih dari 5 triliun pencari pada tahun 2026 saja, itu berarti ringkasan hasil pencarian AI menghasilkan berita palsu dengan kecepatan ratusan ribu kesalahan setiap menitnya – tanpa pengguna menyadarinya.
The New York Times adalah yang pertama melaporkan analisis Oumi ini.
“Ringkasan AI Google telah menjadi bencana bagi penerbit yang bergantung pada klik untuk mendanai produksi jurnalisme berkualitas, tetapi juga mengecewakan pengguna yang mencari informasi akurat,” kata Danielle Coffey, presiden dan CEO News/Media Alliance, sebuah kelompok perdagangan yang mewakili lebih dari 2.000 outlet berita termasuk The Post.
Jawaban yang salah termasuk beberapa kesalahan mendasar, seperti salah menyebutkan tahun di mana rumah musisi Bob Marley diubah menjadi museum, salah menyebutkan tahun kematian mantan pelempar relief MLB Dick Drago, dan mengklaim tidak ada catatan Yo-Yo Ma dilantik ke dalam Classical Music Hall of Fame meskipun ia dilantik pada tahun 2007, menurut contoh yang diberikan Oumi kepada Times.
Ringkasan AI telah muncul di bagian atas hasil pencarian Google sejak tahun 2024, sementara serangkaian tautan biru tradisional ke outlet berita secara efektif terkubur dan tidak terlihat. Para penerbit telah lama menuduh Google, yang dipimpin oleh CEO Sundar Pichai, menjiplak karya mereka untuk “melatih” model AI-nya tanpa memberikan kredit atau kompensasi yang layak.
“Respons yang dihasilkan secara algoritmik yang mengambil data dari hampir setiap sumber di internet sama sekali tidak dapat dipercaya,” kata Coffey.
“Para penerbit menghabiskan banyak waktu dan uang untuk memastikan bahwa konten yang mereka berikan kepada pembaca mereka telah diperiksa kebenarannya dengan benar, sementara Ringkasan AI Google diproduksi tanpa pengawasan atau akuntabilitas.”

Ringkasan AI juga memiliki kecenderungan untuk mengutip informasi dari sumber yang meragukan atau mudah diedit, seperti halaman Facebook, postingan blog, dan entri Wikipedia, seolah-olah itu adalah fakta.
Fitur ini tampaknya mudah dimanfaatkan untuk menyebarkan berita palsu.
The Times mengutip sebuah contoh di mana pembawa acara podcast BBC, Thomas Germain, menulis sebuah postingan blog yang menyatakan dirinya sebagai salah satu “Jurnalis Teknologi Terbaik dalam Makan Hot Dog.”
Ringkasan AI Google telah melahap informasi tersebut dalam sehari dan mulai mengklaim bahwa Germain telah “mendapatkan ketenaran karena kehebatannya di ‘divisi berita’ acara makan kompetitif.”
Analisis Oumi dilakukan antara Oktober dan Februari dan menggunakan uji benchmark terkenal yang disebut SimpleQA, yang dikembangkan oleh OpenAI dan digunakan untuk menilai akurasi model AI.
Meskipun akurasi meningkat dari Gemini 2 dan Gemini 3, penelitian Oumi menunjukkan bahwa AI Overviews semakin buruk dalam mengutip dengan benar sumber informasi yang ditemukannya.
Persentase jawaban AI Overviews yang “tidak berdasar,” atau di mana tautan yang diberikan oleh Google tidak mendukung informasi yang termasuk dalam ringkasan AI, melonjak dari 37% di Gemini 2 menjadi 51% di Gemini 3, menurut laporan tersebut.
Jubir Google: Studi Oumi Miliki ‘Celah Serius’
Seorang juru bicara Google mengatakan studi Oumi memiliki “celah serius” – sebagian karena uji benchmark SimpleQA menyertakan informasi yang tidak akurat dalam datasetnya sendiri.
Perusahaan tersebut juga mempertanyakan ketergantungan Oumi pada model AI internalnya sendiri, yang disebut HallOumi, untuk melakukan analisis, meskipun ada risiko bahwa model tersebut juga dapat membuat kesalahan.
“Ia menggunakan satu AI untuk menilai AI lain pada benchmark lama yang dikenal penuh dengan kesalahan, dan itu tidak mencerminkan apa yang sebenarnya dicari orang di Google,” kata juru bicara tersebut.
“AI Overviews dibangun di atas model Gemini kami, yang memimpin industri dalam hal akurasi, dan mereka memenuhi standar kualitas tinggi yang sama yang kami miliki untuk semua fitur Pencarian kami.”
Seperti yang telah dilaporkan oleh The Post, AI Overviews telah kesulitan memberikan informasi yang akurat sejak diluncurkan, sebelumnya menyarankan pengguna untuk menambahkan lem ke saus pizza mereka dan menggembar-gemborkan “manfaat kesehatan” tembakau untuk anak-anak. (Sumber: New York Post)
