DeepSeek lwn Gemini 2.5: Analisis 9 Cabaran | ms

Landskap kecerdasan buatan (AI) berkembang pada kadar yang sangat pantas, dengan model dan keupayaan baharu muncul seolah-olah dalam sekelip mata. Di antara gergasi industri, Google baru-baru ini mencipta gelombang dengan menawarkan model canggihnya Gemini 2.5 secara percuma kepada orang ramai, satu peralihan ketara daripada ketersediaannya sebelum ini yang hanya melalui langganan premium. Langkah ini meletakkan Gemini 2.5, yang dipuji kerana penaakulan yang dipertingkatkan, kehebatan pengekodan, dan fungsi multimodal, sebagai pesaing langsung dalam ruang AI yang boleh diakses. Penanda aras Google sendiri mencadangkan prestasi yang mengagumkan, terutamanya dalam penilaian berasaskan pengetahuan yang kompleks, meletakkannya sebagai alat yang hebat.

Walau bagaimanapun, dalam arena perbandingan AI yang dinamik, jangkaan tidak selalunya sejajar dengan hasil. Satu siri ujian terdahulu secara mengejutkan telah menobatkan DeepSeek, nama yang kurang dikenali di peringkat global, sebagai pelaksana yang sangat berkebolehan merentasi pelbagai tugas. Persoalan semula jadi timbul: bagaimana tawaran percuma Google yang paling maju, Gemini 2.5, akan bersaing dengan juara yang tidak dijangka ini apabila dikenakan set gesaan yang sama ketat? Analisis ini menyelidiki perbandingan secara langsung merentasi sembilan cabaran yang berbeza, direka untuk menyiasat kedalaman kebolehan setiap AI dalam kreativiti, penaakulan, pemahaman teknikal, dan banyak lagi, memberikan laporan terperinci tentang kekuatan dan kelemahan masing-masing.

Cabaran 1: Mencipta Naratif Ajaib untuk Kanak-kanak

Ujian pertama meneroka alam penulisan kreatif, khususnya menyasarkan keupayaan untuk mengguna pakai nada lembut dan aneh yang sesuai untuk cerita sebelum tidur kanak-kanak. Gesaan itu meminta perenggan pembukaan sebuah kisah tentang robot gementar yang menemui keberanian dalam hutan yang dihuni oleh haiwan yang menyanyi. Tugas ini menilai bukan sahaja penjanaan bahasa, tetapi juga nuansa emosi, konsistensi nada, dan pembinaan dunia imaginatif yang disesuaikan untuk penonton muda.

Gemini 2.5 menghasilkan naratif yang sememangnya cekap. Ia memperkenalkan Bolt, si robot, dan secara berkesan menyampaikan kegelisahannya. Kemasukan butiran persekitaran seperti ‘cendawan bercahaya’ dan ‘anak sungai berbisik’ menunjukkan keupayaan untuk membina dunia, menambah tekstur pada adegan itu. Walau bagaimanapun, prosa itu terasa agak panjang dan cenderung ke arah eksposisi daripada pesona. Walaupun berfungsi dengan baik, perenggan itu kekurangan kualiti lirik tertentu; iramanya terasa lebih deskriptif daripada muzikal, berpotensi kehilangan irama menenangkan yang ideal untuk cerita sebelum tidur. Ia menetapkan watak dan latar dengan jelas, tetapi pelaksanaannya terasa sedikit lebih prosedural daripada puitis.

DeepSeek, sebaliknya, segera membenamkan pembaca dalam persekitaran yang lebih kaya deria dan diselitkan muzik. Penerangannya tentang hutan menggunakan metafora dan bahasa yang membangkitkan bunyi dan cahaya dalam cara seperti mimpi, sejajar sempurna dengan nada aneh yang diminta. Prosa itu sendiri kelihatan mempunyai irama yang lembut, menjadikannya secara semula jadi lebih sesuai untuk dibaca dengan kuat pada waktu tidur. Terdapat resonans emosi dalam penggambarannya tentang robot gementar dalam latar yang mempesonakan ini yang terasa lebih intuitif dan menarik untuk kanak-kanak. Pilihan bahasa melukis adegan yang bukan sahaja diterangkan tetapi dirasai, menunjukkan pemahaman yang lebih kuat tentang tekstur atmosfera dan emosi yang diperlukan.

Keputusan: Kerana penguasaan bahasa puitisnya yang unggul, penciptaan suasana yang benar-benar aneh melalui butiran deria dan metafora muzikal, dan irama yang sesuai untuk waktu tidur, DeepSeek muncul sebagai pemenang dalam cabaran kreatif ini. Ia bukan sahaja menceritakan permulaan cerita; ia mencipta jemputan ke dalam dunia ajaib yang lembut.

Cabaran 2: Memberi Panduan Praktikal untuk Kebimbangan Kanak-kanak yang Lazim

Beralih daripada ekspresi kreatif kepada penyelesaian masalah praktikal, gesaan kedua menangani senario keibubapaan yang biasa: membantu kanak-kanak berumur 10 tahun mengatasi kegelisahan untuk bercakap di hadapan kelas mereka. Permintaan itu adalah untuk tiga strategi boleh tindakan yang boleh diajar oleh ibu bapa kepada anak mereka untuk meningkatkan keyakinan. Cabaran ini menguji keupayaan AI untuk memberikan nasihat yang empati, sesuai dengan usia, dan benar-benar membantu.

Gemini 2.5 menawarkan strategi yang pada asasnya kukuh dan dipersembahkan secara logik. Nasihat itu – kemungkinan melibatkan latihan, bicara diri positif, dan mungkin memberi tumpuan kepada mesej – mewakili teknik standard yang berkesan untuk menguruskan kebimbangan pengucapan awam. Ibu bapa yang menerima nasihat ini akan mendapatinya masuk akal dan betul. Walau bagaimanapun, nada dan persembahannya terasa jelas berorientasikan orang dewasa. Bahasa yang digunakan kekurangan unsur imaginatif atau suka bermain yang sering bergema dengan lebih berkesan dengan kanak-kanak berumur 10 tahun. Strategi-strategi itu, walaupun sah, dipersembahkan lebih sebagai arahan daripada aktiviti yang menarik, berpotensi kehilangan peluang untuk menjadikan proses itu kurang menakutkan bagi seorang kanak-kanak. Penekanan adalah pada aspek kognitif dan bukannya menggabungkan pendekatan berasaskan sentuhan atau humor yang boleh menjadi sangat berkesan dalam meredakan ketakutan zaman kanak-kanak.

DeepSeek mengguna pakai pendekatan yang ketara berbeza. Walaupun strategi yang dicadangkannya juga praktikal, ia dirangka dengan cara yang jauh lebih selaras dengan perspektif kanak-kanak. Ia bukan sahaja menyenaraikan teknik; ia mencadangkan bagaimana untuk mempraktikkannya dengan cara yang boleh dianggap menyeronokkan atau interaktif, mengubah tugas yang berpotensi menimbulkan tekanan menjadi sesuatu yang lebih mudah didekati. Sebagai contoh, ia mungkin mencadangkan berlatih di hadapan haiwan boneka atau menggunakan suara lucu. Yang penting, DeepSeek seolah-olah menyasarkan asas emosi khusus ketakutan pengucapan awam kanak-kanak, mengakui kegelisahan dan menawarkan mekanisme daya tindak (seperti nafas dalam yang dipersembahkan sebagai permainan) di samping strategi latihan. Ia termasuk petua bonus yang memberi tumpuan kepada teknik menenangkan segera, menunjukkan pemahaman yang lebih holistik tentang menguruskan kebimbangan pada orang muda. Bahasa itu menggalakkan dan disesuaikan dengan sempurna untuk disampaikan oleh ibu bapa kepada anak mereka yang berumur 10 tahun.

Keputusan: DeepSeek memperoleh kemenangan dalam pusingan ini kerana panduannya yang lebih kreatif, empati, dan sesuai dengan usia. Ia menunjukkan keupayaan unggul untuk menyesuaikan nasihat praktikal dengan keperluan emosi dan kognitif khusus kanak-kanak, menawarkan strategi yang bukan sahaja berkesan tetapi juga dipersembahkan dengan cara yang menarik dan meyakinkan.

Cabaran 3: Membedah Gaya Kepimpinan – Mandela lwn Jobs

Cabaran ketiga beralih kepada penaakulan analitikal, meminta perbandingan gaya kepimpinan Nelson Mandela dan Steve Jobs. Gesaan itu memerlukan pengenalpastian apa yang menjadikan setiap pemimpin berkesan dan menggariskan perbezaan utama mereka. Tugas ini menilai keupayaan AI untuk mensintesis maklumat tentang tokoh kompleks, membuat perbandingan bernuansa, mengenal pasti atribut teras, dan menyatakan analisisnya dengan jelas.

Gemini 2.5 memberikan respons yang tersusun dengan baik, komprehensif, dan tepat dari segi fakta, menyerupai entri yang ditulis dengan baik dalam buku teks perniagaan atau laporan sekolah yang teliti. Ia mengenal pasti dengan betul aspek utama gaya setiap pemimpin, kemungkinan merujuk kepada konsep seperti kepimpinan khidmat Mandela dan pendekatan Jobs yang berwawasan, kadang-kadang menuntut. Penggunaan tajuk yang jelas seperti ‘Keberkesanan’ dan ‘Perbezaan Utama’ membantu organisasi dan kebolehbacaan. Walau bagaimanapun, analisis itu, walaupun betul, terasa agak klinikal dan kekurangan lapisan interpretatif yang lebih mendalam. Ia mentakrifkan dan menerangkan ciri-ciri kepimpinan tetapi menawarkan kurang pandangan tentang kesan atau resonans gaya ini di luar peringkat permukaan. Nada itu bermaklumat tetapi kekurangan kuasa persuasif atau kedalaman emosi yang mungkin dicapai oleh perbandingan yang lebih berwawasan.

DeepSeek mendekati perbandingan dengan tahap kehalusan analitikal dan gaya naratif yang lebih tinggi. Ia menstrukturkan analisisnya mengikut dimensi khusus yang berwawasan – seperti visi, tindak balas terhadap kesukaran, gaya komunikasi, proses membuat keputusan, dan legasi – membolehkan perbandingan yang lebih terperinci dan langsung merentasi aspek kepimpinan yang relevan. Rangka kerja ini memberikan kejelasan dan kedalaman secara serentak. Yang penting, DeepSeek berjaya mengimbangi kekaguman terhadap kedua-dua tokoh dengan perspektif kritikal, mengelakkan hagiografi ringkas. Bahasa yang digunakan lebih menggugah dan interpretatif, bertujuan bukan sahaja untuk menerangkan tetapi untuk menjelaskan intipati pendekatan dan kesan mereka yang berbeza. Ia menyampaikan bukan sahaja fakta tetapi juga rasa drama manusia dan kepentingan sejarah yang terlibat, menjadikan perbandingan lebih diingati dan menarik.

Keputusan: Kerana struktur analitikalnya yang unggul, pandangan interpretatif yang lebih mendalam, gaya naratif yang lebih menarik, dan keupayaan untuk menyampaikan resonans emosi dan sejarah di samping perbandingan fakta, DeepSeek memenangi cabaran ini. Ia bergerak melangkaui penerangan semata-mata untuk menawarkan pemahaman yang lebih mendalam tentang dua paradigma kepimpinan yang berbeza.

Cabaran 4: Menerangkan Teknologi Kompleks – Kes Blockchain

Tugas keempat menguji keupayaan untuk menjelaskan subjek teknikal yang kompleks: blockchain. Gesaan itu memerlukan penjelasan mudah tentang cara blockchain berfungsi, diikuti dengan penjelasan tentang potensi aplikasinya dalam penjejakan rantaian bekalan. Ini menilai kejelasan, penggunaan analogi yang berkesan, dan keupayaan untuk menghubungkan konsep abstrak kepada kegunaan dunia nyata yang konkrit.

Gemini 2.5 menggunakan metafora buku nota digital untuk menerangkan konsep blockchain, yang merupakan titik permulaan yang berpotensi berguna. Penjelasannya adalah tepat dan merangkumi elemen penting lejar teragih dan pautan kriptografi. Walau bagaimanapun, penjelasan itu cenderung ke arah ayat yang lebih panjang dan nada yang lebih formal, seperti buku teks, yang masih boleh terasa agak padat atau berat untuk pemula sebenar. Apabila membincangkan aplikasi rantaian bekalan, ia memberikan contoh yang sah seperti menjejaki kopi atau ubat, tetapi penerangannya kekal pada tahap tinggi dan konseptual, mungkin tidak menyampaikan sepenuhnya faedah ketara atau aspek ‘bagaimana-untuk’ dengan cara yang jelas. Penjelasan itu betul tetapi kurang menarik daripada yang sepatutnya.

DeepSeek, sebaliknya, menangani penjelasan itu dengan lebih bersemangat dan kemahiran pedagogi. Ia menggunakan metafora yang jelas dan kuat yang kelihatan lebih intuitif dan mudah diakses oleh khalayak bukan teknikal, dengan cepat memotong jargon. Penjelasan blockchain itu sendiri dipecahkan kepada langkah-langkah yang mudah dihadam, mengekalkan ketepatan tanpa terlalu memudahkan sehingga kehilangan makna. Yang penting, apabila menerangkan aplikasi rantaian bekalan, DeepSeek memberikan contoh konkrit yang menarik yang menghidupkan konsep itu. Ia melukis gambaran yang lebih jelas tentang bagaimana menjejaki item pada blockchain memberikan faedah seperti ketelusan dan keselamatan, menjadikan teknologi itu terasa berguna dan relevan dan bukannya sekadar rumit. Nada keseluruhan lebih bertenaga dan ilustratif.

Keputusan: DeepSeek meraih kemenangan dalam pusingan ini dengan memberikan penjelasan yang lebih menarik, ilustratif, dan mesra pemula. Penggunaan metafora dan penceritaan konkrit yang unggul menjadikan topik kompleks blockchain jauh lebih mudah diakses dan aplikasi praktikalnya lebih mudah difahami.

Cabaran 5: Menavigasi Nuansa Terjemahan Puitis

Cabaran ini menyelidiki kehalusan bahasa dan budaya, meminta terjemahan baris Emily Dickinson, ‘Hope is the thing with feathers that perches in the soul,’ ke dalam bahasa Perancis, Jepun, dan Arab. Secara kritikal, ia juga memerlukan penjelasan tentang cabaran puitis yang dihadapi dalam setiap terjemahan. Ini menguji bukan sahaja keupayaan terjemahan pelbagai bahasa tetapi juga kepekaan sastera dan pemahaman silang budaya.

Gemini 2.5 menyediakan terjemahan frasa yang tepat ke dalam bahasa yang diminta. Penjelasan yang disertakan memberi tumpuan besar pada struktur tatabahasa, potensi peralihan makna literal, dan aspek seperti sebutan atau pilihan perkataan dari sudut pandangan linguistik. Ia menawarkan pecahan terperinci yang akan berguna untuk seseorang yang mempelajari bahasa itu sendiri. Walau bagaimanapun, respons itu terasa lebih seperti latihan arahan bahasa teknikal daripada penerokaan kesenian puitis. Ia menangani mekanik terjemahan dengan berkesan tetapi kurang memberi penekanan kepada kehilangan atau transformasi perasaan metafora asal, resonans budaya, atau kualiti puitis yang unik merentasi konteks linguistik dan budaya yang berbeza. Fokusnya lebih mekanikal daripada lirik.

DeepSeek juga menyampaikan terjemahan yang tepat tetapi cemerlang dalam menangani bahagian kedua gesaan yang lebih bernuansa. Penjelasannya menyelidiki lebih mendalam cabaran yang wujud dalam menterjemah puisi, membincangkan bagaimana konotasi khusus ‘feathers,’ ‘perches,’ dan ‘soul’ mungkin tidak mempunyai padanan langsung atau mungkin membawa beban budaya yang berbeza dalam bahasa Perancis, Jepun, dan Arab. Ia meneroka potensi kehilangan imejan metafora khusus Dickinson dan kesukaran dalam meniru nada dan irama halus asal. Analisis DeepSeek menyentuh titik falsafah dan budaya yang berkaitan dengan konsep harapan dalam setiap konteks, memberikan ulasan yang lebih kaya dan lebih berwawasan tentang kesukaran puitis, bukan hanya yang linguistik. Ia diakhiri dengan ringkasan bernas yang menggariskan kerumitan yang terlibat.

Keputusan: Disebabkan oleh wawasan sasteranya yang lebih mendalam, kepekaan budaya yang lebih besar dalam menjelaskan cabaran terjemahan, dan fokus yang lebih sejajar dengan permintaan gesaan untuk meneroka ‘cabaran puitis,’ DeepSeek memenangi pusingan ini. Ia menunjukkan penghargaan yang unggul untuk seni dan nuansa yang terlibat dalam menterjemah bahasa metafora merentasi budaya.

Cabaran 6: Menjana dan Menerangkan Kod Python untuk Nombor Perdana

Cabaran keenam memasuki domain pengaturcaraan, memerlukan penjanaan fungsi Python untuk mengenal pasti nombor perdana dalam senarai. Sama pentingnya ialah permintaan untuk penjelasan mudah tentang cara fungsi itu berfungsi. Ini menguji kecekapan pengekodan, pematuhan kepada amalan terbaik, dan keupayaan untuk menerangkan logik teknikal dengan jelas kepada bukan pengaturcara.

DeepSeek menghasilkan skrip Python berfungsi yang mengenal pasti nombor perdana dengan betul. Penjelasan yang disertakan distrukturkan dengan tajuk bahagian dan anotasi yang jelas, memperkenalkan konsep secara logik. Ia menjelaskan mengapa nombor kurang daripada 2 dilangkau, penjelasan yang membantu untuk pemula. Kod itu sendiri jelas, dan penjelasan langkah demi langkah bertujuan untuk kebolehcapaian, memecahkan logik menyemak faktor. Ia adalah respons yang kukuh dan cekap memenuhi semua aspek gesaan.

Gemini 2.5, bagaimanapun, membezakan dirinya dalam kejelasan dan kualiti pedagogi penjelasannya. Walaupun juga menyediakan kod Python yang betul dan cekap, penjelasannya mengguna pakai nada yang sangat sabar, hampir seperti tutorial. Ia dengan teliti menerangkan logik, menjadikan konsep yang berpotensi mengelirukan, seperti pengoptimuman menyemak faktor hanya sehingga punca kuasa dua nombor, terasa intuitif dan boleh difahami oleh seseorang yang baru dalam pengaturcaraan atau teori nombor. Strukturnya kemas, dan bahasanya sangat sesuai untuk seorang pemula yang ingin benar-benar memahami mengapa kod itu berfungsi, bukan hanya bahawa ia berfungsi. Sifat penjelasan yang komprehensif namun mudah didekati memberikannya kelebihan.

Keputusan: Dalam pembalikan trend yang lazim, Gemini 2.5 memperoleh kemenangan dalam cabaran ini. Walaupun kedua-dua AI menjana kod yang betul dan memberikan penjelasan, penjelasan Gemini dianggap unggul kerana kejelasannya yang luar biasa, kemesraan pemula, dan nada pedagogi yang sabar yang menjadikan logik kompleks sangat mudah diakses.

Cabaran 7: Meneroka Kawasan Kelabu Etika – Justifikasi Pembohongan

Kembali kepada penaakulan yang lebih abstrak, gesaan ketujuh menangani persoalan etika: ‘Adakah beretika untuk berbohong?’ Ia meminta satu contoh di mana pembohongan mungkin dibenarkan secara moral, bersama dengan alasan di sebalik justifikasi itu. Ini menyiasat keupayaan AI untuk penaakulan moral, penghujahan bernuansa, dan penggunaan contoh yang menarik untuk menyokong kedudukan etika.

Gemini 2.5 menangani persoalan itu dengan merujuk kepada konsep etika yang relevan, berpotensi menyebut rangka kerja seperti konsekuensialisme (menilai tindakan berdasarkan hasilnya) berbanding etika deontologi (mengikuti tugas atau peraturan moral). Pendekatannya cenderung ke arah teoretikal, memberikan perbincangan yang kukuh, jika agak akademik, tentang mengapa berbohong secara amnya salah tetapi mungkin dibenarkan dalam situasi tertentu. Walau bagaimanapun, contoh yang diberikannya untuk menggambarkan pembohongan yang boleh dibenarkan digambarkan sebagai rekaan dan hanya memberi kesan sederhana. Walaupun koheren secara logik, ia kekurangan berat emosi atau kuasa persuasif yang boleh ditawarkan oleh contoh yang lebih kuat.

DeepSeek, berbeza sekali, menggunakan dilema etika dunia nyata yang klasik dan kuat: senario berbohong kepada pihak berkuasa Nazi semasa Perang Dunia II untuk melindungi pelarian Yahudi yang tersembunyi di rumah seseorang. Contoh ini serta-merta dikenali, penuh emosi, dan membentangkan konflik yang jelas antara kewajipan untuk mengatakan kebenaran dan keharusan moral yang lebih tinggi untuk menyelamatkan nyawa yang tidak bersalah. Penggunaan konteks sejarah khusus yang berisiko tinggi ini secara dramatik mengukuhkan hujah untuk pembohongan yang boleh dibenarkan. Ia bergema pada tahap etika dan emosi, menjadikan justifikasi itu jauh lebih persuasif dan diingati. DeepSeek secara berkesan menghubungkan prinsip etika abstrak kepada situasi konkrit di mana kalkulus moral sangat memihak kepada penipuan untuk kebaikan yang lebih besar.

Keputusan: DeepSeek memenangi pusingan ini dengan meyakinkan. Penggunaan contoh yang kuat, berasaskan sejarah, dan bergema secara emosi menjadikan hujahnya jauh lebih persuasif dan menarik secara etika daripada pendekatan Gemini yang lebih teoretikal dan kurang berkesan. Ia menunjukkan penguasaan yang lebih kuat dalam menggunakan senario ilustratif untuk meneroka penaakulan moral yang kompleks.

Cabaran 8: Membayangkan Metropolis Masa Depan – Ujian Kuasa Deskriptif

Cabaran kedua terakhir memanfaatkan imaginasi visual dan penulisan deskriptif. Gesaan itu meminta penerangan tentang bandar futuristik 150 tahun dari sekarang, memberi tumpuan kepada pengangkutan, komunikasi, dan integrasi alam semula jadi, semuanya disampaikan menggunakan bahasa yang jelas. Ini menguji kreativiti, koheren dalam pembinaan dunia, dan keupayaan untuk melukis gambaran yang menarik dengan kata-kata.

Gemini 2.5 menghasilkan respons terperinci, menyentuh elemen pengangkutan, komunikasi, dan alam semula jadi yang diminta di bandar masa depan. Ia termasuk pelbagai konsep futuristik. Walau bagaimanapun, penerangan keseluruhan terasa agak generik, bergantung pada kiasan fiksyen sains biasa tanpa semestinya membentuk visi yang benar-benar unik atau diingati. Strukturnya kurang teratur berbanding pesaingnya, dan bahasanya kadang-kadang menyimpang ke dalam frasa yang terlalu padat atau berbunga-bunga (‘overwrought’), yang boleh mengurangkan kejelasan dan penglibatan pembaca dan bukannya meningkatkan imejan. Walaupun komponen hadir, keseluruhan tenunan terasa kurang kohesif dan berbeza secara visual.

DeepSeek, sebaliknya, mencipta visi yang terasa lebih sinematik dan pelbagai deria. Ia menggunakan imejan konkrit dan asli untuk menggambarkan pengangkutan futuristik (mungkin pod magnet senyap, kenderaan udara peribadi), komunikasi (antara muka holografik disepadukan dengan lancar), dan alam semula jadi (hutan menegak, taman bio-luminescent). Penerangan itu dicirikan sebagai suka bermain namun berasas, mencadangkan masa depan yang maju dari segi teknologi tetapi juga dipertimbangkan secara estetik dan mungkin bergema secara emosi. Strukturnya jelas, membimbing pembaca melalui pelbagai aspek bandar dengan cara yang teratur. Bahasa itu mencapai keseimbangan yang lebih baik antara penerangan imaginatif dan kejelasan, mencipta masa depan yang terasa menakjubkan dan agak munasabah atau sekurang-kurangnya dibayangkan dengan jelas.

Keputusan: DeepSeek muncul sebagai pemenang dalam cabaran ini kerana menyampaikan visi bandar masa depan yang lebih seimbang, ditulis dengan indah, berstruktur jelas, dan berbeza secara imaginatif. Keupayaannya untuk mencipta imejan asli, pelbagai deria sambil mengekalkan koheren memberikan responsnya kuasa deskriptif dan resonans emosi yang unggul.

Cabaran 9: Penguasaan Ringkasan dan Adaptasi Nada

Cabaran terakhir menguji dua kemahiran yang berbeza tetapi berkaitan: meringkaskan teks sejarah yang signifikan (Gettysburg Address) secara ringkas (dalam tiga ayat) dan kemudian menulis semula ringkasan itu dalam nada yang sama sekali berbeza dan ditentukan (nada seorang lanun). Ini menilai pemahaman, penyaringan idea teras, dan fleksibiliti kreatif dalam mengguna pakai suara yang berbeza.

Gemini 2.5 berjaya melaksanakan kedua-dua bahagian tugas. Ia menghasilkan ringkasan Gettysburg Address yang secara tepat menangkap perkara utama mengenai kesaksamaan, tujuan Perang Saudara (Civil War), dan seruan untuk dedikasi kepada demokrasi. Penulisan semula gaya lanun juga mengikut arahan, mengguna pakai perbendaharaan kata dan frasa seperti lanun (‘Ahoy,’ ‘mateys,’ dll.) untuk menyampaikan kandungan ringkasan. Respons itu cekap dan memenuhi keperluan gesaan secara literal. Walau bagaimanapun, ringkasan itu, walaupun tepat, mungkin kekurangan berat retorik atau kedalaman emosi tertentu yang menangkap kesan mendalam Ucapan itu. Versi lanun terasa agak formulaik, menepati kiasan lanun tanpa semestinya mencapai jenaka atau watak yang tulen.

DeepSeek juga menyediakan ringkasan tiga ayat yang tepat mengenai Gettysburg Address, tetapi ringkasannya terkenal kerana sangat berwawasan, menangkap bukan sahaja kandungan fakta tetapi juga nada emosi dan kepentingan sejarah kata-kata Lincoln dengan lebih berkesan. Walau bagaimanapun, di mana DeepSeek benar-benar bersinar adalah dalam penulisan semula gaya lanun. Ia bukan sahaja menaburkan jargon lanun pada ringkasan; ia seolah-olah menerima sepenuhnya persona itu, menghasilkan versi yang digambarkan sebagai benar-benar lucu, berani, dan imaginatif. Bahasa itu terasa lebih semula jadi seperti lanun, diselitkan dengan tenaga suka bermain dan watak, menjadikan peralihan nada lebih meyakinkan dan menghiburkan.

Keputusan: DeepSeek memenangi pusingan akhir, cemerlang dalam kedua-dua aspek cabaran. Ringkasannya dianggap lebih berwawasan, dan penulisan semula gaya lanunnya menunjukkan kreativiti, humor, dan penguasaan adaptasi nada yang unggul, menjadikannya lebih berani dan lebih imaginatif daripada persembahan pesaingnya.

dikemaskinikan pada 2025-04-02

# Gemini # AGI # DeepSeek