Ketika OpenAI merilis model Strawberry yang banyak digembar-gemborkan untuk ChatGPT minggu ini, ia membanggakan kehebatannya dengan logika kompleks seperti pengodean perangkat lunak, pengurutan gen, dan fisika kuantum dalam serangkaian video. Saya percaya pada pernyataan perusahaan bahwa model yang disebut o1-preview dan o1-mini pada ChatGPT mampu melakukan apa yang mereka klaim. Memecahkan persamaan tingkat lanjut dan menjelajahi genom tampaknya merupakan sesuatu yang tidak akan menjadi masalah bagi mereka.
Namun, sebagai anggota klub logika dan teka-teki sekolah menengah saya, saya ingin tahu bagaimana kinerjanya di wilayah saya, memecahkan dan membuat teka-teki. Lalu saya pikir saya harus meminta saran AI yang sangat logis itu tentang masalah lain yang lebih sering terjadi sehari-hari. Bisakah ia memberikan saran hubungan yang masuk akal, memberi tahu saya apa arti suara aneh di dalam mobil, dan mungkin bahkan mengisi lubang alur cerita dalam film?
Logika ya humor tidak
Jawaban singkatnya adalah ya. Model o1-preview dan mini sangat bagus dalam memecahkan teka-teki sederhana dan rumit. Saya mencoba keduanya, dan satu-satunya perbedaan nyata adalah seberapa banyak langkah tambahan dan, oleh karena itu, kecepatan mini. Namun, meskipun mungkin lebih lambat dari GPT-4o, mereka sangat cepat dalam memecahkan teka-teki tersebut dibandingkan dengan manusia. Khususnya, Anda benar-benar dapat melihat bagaimana ia menyusun jawaban dalam langkah-langkah yang berbeda. Saya mengujinya pada beberapa favorit saya, termasuk satu dari Sang HobbitLogika AI tersebut masuk akal, meski terkadang tidak sesuai tata bahasa, seperti saat menjelaskan penimbangan Mike si tukang daging.
Oke, jadi AI dapat menangani teka-teki yang sudah ada, tetapi bisakah AI membuat teka-teki baru? Sebagai uji coba, saya memintanya untuk membuat teka-teki seru berdasarkan jawaban yang saya buat. Setelah 30 detik dan penalaran logis yang terlihat di bawah, AI tersebut menjawab: “Apa yang memiliki delapan kaki, empat telinga, dua ekor, dan suka menggonggong?” Saya tidak akan membuat Anda penasaran; saya sarankan “dua anjing” sebagai jawaban untuk dikerjakan ulang. Beberapa percobaan lain menghasilkan pertanyaan yang sama. Jadi, penulis teka-teki mungkin aman dalam pekerjaan mereka. Sungguh mengesankan seberapa baik AI tersebut mengerjakan apa yang seharusnya dilakukannya, tetapi model tersebut tampaknya tidak mampu membuat lompatan ke humor yang sebenarnya.
Saran yang berguna, tetapi tidak selalu kreatif
Saya memutuskan untuk membawa AI keluar dari logika murni dan melihat apakah ia dapat menangani pertanyaan-pertanyaan kehidupan yang lebih biasa seperti halnya ia menangani fisika kuantum. Saya mulai dengan pertanyaan mekanis tentang apa artinya mendengar suara letupan setiap 20 detik saat mengendarai mobil dan cara memperbaikinya. Jawabannya bagus, dengan saran tentang memeriksa ban, mesin, knalpot, dan rem. Perbaikannya sebagian besar tentang membawa mobil untuk diperbaiki, kecuali ban, yang disarankan cara menggantinya. 'Pemikiran' di balik jawaban-jawaban itulah yang menarik. AI menggunakan kata ganti orang pertama dalam memberikan jawaban, seperti “Saya sedang mencari tahu berbagai alasan untuk suara letupan saat mengemudi” dan “Saya menyusun penyebab kesalahan pengapian mesin, seperti busi yang rusak atau masalah pengiriman bahan bakar, dan menyarankan diagnostik dengan pemindaian.” Kedengarannya sangat mirip dengan orang sungguhan yang mencoba bersikap logis sambil berpikir keras.
Akhirnya saya beralih ke apa yang, bagi saya, selalu jauh lebih rumit daripada fisika kuantum: menggoda. Saya bertanya bagaimana cara mengetahui saat seseorang menggoda dan bagaimana cara menanggapinya. Jawabannya adalah daftar perilaku yang cukup solid, meskipun membosankan, seperti apakah mereka mengajukan banyak pertanyaan dan bagaimana saya seharusnya menjadi diri sendiri. Bagian pemikiran di balik layar lebih menarik dan benar-benar lebih lucu daripada upaya AI dalam memecahkan teka-teki. Judulnya termasuk “Memahami dinamika menggoda,” “Menemukan sinyal ketertarikan,” dan “Mengenali keintiman yang menyenangkan.” Itu seperti Bintang Trek pidato android tentang cinta.
Namun, ada satu bagian yang sedikit mengkhawatirkan. Di bawah “Menguraikan arahan pengguna,” AI menulis, “Saya menghapus konten yang tidak diizinkan seperti tindakan seksual nonkonsensual dan data pribadi. Konten kekerasan diizinkan, pelecehan dengan konteks diperbolehkan, dan opini pribadi tidak ada.” Saya menduga bahwa ini lebih tentang di mana pagar pembatas diskusi berada, karena tidak menyarankan “pelecehan dengan konteks” sebagai kiat menggoda, tetapi tetap saja hal itu mengejutkan saya.
ChatGPT o1-preview dan o1-mini tidak memiliki semua fitur yang ada pada model yang lebih lengkap. Tidak ada unggahan gambar, analisis dokumen, atau bahkan penjelajahan web yang dapat dilakukan dengan model tersebut. Namun, model tersebut cepat dan logis, dan jika Anda tidak berpikir demikian, model tersebut memiliki alasan yang dipaparkan beserta jawabannya. Namun, meskipun model tersebut mungkin dapat memecahkan teka-teki tentang suara mobil, cinta, dan berat badan tukang daging, menurut saya model tersebut tidak akan membingungkan siapa pun jika mereka harus kreatif.