Puluhan Model AI Termasuk ChatGPT Adu Mekanik, Siapa Jawaranya?

Lulua Ashila Wardhono . June 26, 2023

chatgpt

Puluhan Model AI Termasuk ChatGPT Adu Mekanik. Foto: Shutterstock/Rokas Tenys

Teknologi.id - Chatbot kecerdasan buatan (AI) terus berkembang, dengan perusahaan teknologi utama seperti Microsoft dan Google memperkenalkan chatbot mereka sendiri. Untuk menentukan chatbot mana yang paling unggul, University of California, Berkeley bekerja sama dengan University of California, San Diego dan Carnegie Mellon University untuk menciptakan Large Model Systems Organization (LMSYS) dan melakukan eksperimen yang disebut Chatbot Arena.

Dalam artikel ini, kita akan menjelajahi hasil Chatbot Arena dan mengeksplorasi kemampuan ChatGPT, Bing, Bard, dan chatbot lainnya yang menonjol.

Eksperimen Chatbot Arena

LMSYS terdiri dari empat anggota fakultas yang memiliki minat khusus dalam bidang kecerdasan buatan (AI) dan ilmu komputer, dan yang terlibat dalam penelitian di bidang tersebut.

Selain mereka, ada sepuluh mahasiswa, yang berpartisipasi dalam sesuatu yang disebut Chatbot Arena. Chatbot Arena, yang dirancang oleh kelompok penelitian LMSYS, memungkinkan pengguna untuk secara bersamaan mengobrol dengan dua model anonim dan memberikan pemungutan suara untuk yang lebih disukai.

Ini memungkinkan peserta tes untuk membandingkan dua chatbot secara bersamaan karena hal ini dapat mempermudah perbandingan hasil. Satu hal yang perlu diperhatikan adalah bahwa peserta tidak diberitahu chatbot AI mana yang mereka bicarakan sampai setelah tes selesai.

Mereka memberikan suara pada chatbot yang mereka pilih berdasarkan jawaban yang mereka terima, dan kurangnya pengetahuan tentang nama chatbot yang mereka ajak bicara akan mengurangi bias dengan margin yang besar. 

Eksperimen ini melibatkan berbagai model bahasa (Large Language Model, biasa diketahui LLM) dari OpenAI, Google, Meta, Anthropic, dan lainnya. Dengan memberikan suara mereka, peserta berkontribusi dalam mengukur kinerja LLM ini. Lebih dari 40.000 suara telah terkumpul, mengungkapkan kelebihan dan kekurangan dari model chatbot yang berbeda.

Baca juga: Tak Hanya ChatGPT! Ini Dia 8 Tools AI Terbaik yang Wajib Kamu Coba

Menjelajahi Penawaran Chatbot

1. ChatGPT

ChatGPT, dikembangkan oleh OpenAI, adalah chatbot AI yang populer dan serbaguna. Ini menawarkan berbagai fitur seperti pembangkitan teks, pemecahan masalah, dan kemampuan percakapan. Meskipun model GPT-4 yang lebih canggih memerlukan langganan, versi ChatGPT 3.5 yang gratis tetap memberikan performa yang baik.


2. Bing Chatbot

Bing Chatbot dari Microsoft mengintegrasikan kemampuan chatbot AI ke dalam mesin pencari Bing. Meskipun awalnya memiliki akses internet terbatas untuk non-pelanggan, Bing Chatbot memberikan kemudahan bagi pengguna dalam mencari informasi dan tetap terkini.


3. Google Bard

Google ikut serta dalam pertarungan chatbot dengan Bard, yang didukung oleh model LaMDA. Bard unggul dalam pengeditan teks dan penulisan dokumen, menjadikannya alat berharga untuk penciptaan konten profesional. Meskipun tidak memiliki kemampuan pemrograman dan mesin pencari, Bard menawarkan pengalaman chatbot yang menjanjikan.


4. Claude by Anthropic

Claude oleh Anthropic juga ikut pertarungan chatbot. Claude mempunyai sistem AI inovatif dengan kecerdasan mesin dan memfasilitasi kemajuan revolusioner di berbagai bidang. Anthropic mempunyai riset AI terkemuka dan mewakili kemajuan siginfikan dalam ranah kecerdasan buatan. Claude dilengkapi basis pengetahuan yang luas, dan dapat menyediakan wawasan yang akurat dan terikni dalam berbagai topik.

Hasil Chatbot Arena

Menurut papan peringkat, GPT-4 dari OpenAI saat ini menduduki posisi teratas sebagai LLM yang paling disukai di Chatbot Arena. Claude-v1 dan Claude Instant dari Anthropic berada di posisi kedua dan ketiga.

Untuk menjelajahi papan peringkat lengkap dan mengalami Chatbot Arena secara langsung, orang yang tertarik dapat mengunjungi situs web LMSYS.

Secara keseluruhan, ChatGPT 4 berhasil menduduki peringkat teratas dengan skor 1.225. Claude oleh Anthropic mendapatkan peringkat kedua dan ketiga dengan salah satu versi mencetak skor 1.195 dan versi lainnya mendapatkan rating Elo sebesar 1.153.

Jika pengguna tidak ingin membayar $20 per bulan untuk GPT 4, pengguna masih dapat menggunakan ChatGPT 3.5 gratis yang menduduki peringkat keempat dengan rating Elo keseluruhan sebesar 1.143.

Eksperimen Chatbot Arena yang dilakukan oleh organisasi LMSYS UC Berkeley telah membuka wawasan tentang kinerja berbagai chatbot AI. Dengan adanya ChatGPT dari OpenAI, Bing Chatbot dari Microsoft, dan Bard dari Google sebagai pesaing menonjol, pengguna sekarang memiliki pemahaman yang lebih jelas tentang kemampuan mereka.

Baca juga: Cara Mengintegrasikan ChatGPT dengan WhatsApp

Untuk membuat keputusan yang terinformasi, nilai setiap chatbot berdasarkan fitur, keandalan, dan kesesuaian dengan kebutuhan spesifik pengguna. Lanskap yang terus berkembang dari chatbot AI menjanjikan inovasi yang terus-menerus dan pengalaman pengguna yang lebih baik di masa depan.

Baca Berita dan Artikel yang lain di Google News.

(law)

author0
teknologi id bookmark icon

Tinggalkan Komentar

0 Komentar