Inovasi terbaru OpenAI, agen Codex AI, memperkenalkan pendekatan baru untuk coding – sebuah lingkungan “vibe-coding” yang didukung oleh antarmuka mirip ChatGPT. Walaupun konsep ini mungkin awalnya tampak seperti gimmick, kemampuan agen Codex yang baru ini sangat mengesankan.
OpenAI telah melabeli Codex sebagai pratinjau penelitian, yang mengindikasikan bahwa ia masih dalam pengembangan aktif. Saat ini, ia dapat diakses oleh pelanggan ChatGPT Pro, Enterprise, dan tingkat Tim, dengan rencana untuk memperluas ketersediaan ke pengguna Plus dan Edu dalam waktu dekat.
Menurut pengumuman OpenAI, nama Codex telah dikaitkan dengan alat coding yang terus berkembang sejak tahun 2021. Dalam diskusi ini, “Codex” merujuk pada versi yang baru saja diumumkan.
Codex berada di server OpenAI dan terintegrasi dengan repositori GitHub. Demonstrasi menunjukkan bahwa Codex berfungsi sebagai programmer tambahan dalam sebuah tim.
Ia dapat diinstruksikan untuk menyelesaikan serangkaian bug dan menjalankan tugas tersebut sesuai dengan instruksi. Ia juga meminta persetujuan untuk modifikasi kode, walaupun tampaknya ia mampu memodifikasi kode secara otonom.
Codex dapat menganalisis dan memodifikasi kode, mengidentifikasi masalah tertentu, menunjukkan area untuk perbaikan, dan melakukan coding serta tugas pemeliharaan lainnya. Setiap tugas memulai lingkungan virtual baru, yang memungkinkan AI untuk menangani semuanya mulai dari konsep dan desain hingga pengujian unit.
Pergeseran Paradigma dalam Coding
Ini menandakan pergeseran yang tulus dalam paradigma coding. Bantuan coding AI sebelumnya terutama melibatkan fitur autocomplete, yang secara otomatis menghasilkan baris atau blok kode berdasarkan kode yang ada.
Teknologi telah berkembang ke titik di mana AI dapat menulis atau men-debug segmen kode kecil. Ini adalah aspek yang sangat menarik bagi saya terkait dengan tes pemrograman ZDNET.
Peran lain untuk AI adalah analisis sistem secara keseluruhan. Baru-baru ini, saya menjelajahi alat Deep Research baru yang dapat mendekonstruksi seluruh basis kode dan memberikan ulasan serta rekomendasi kode.
Codex sekarang mencapai titik di mana seluruh tugas pemrograman dapat dipercayakan kepada AI di cloud, mirip dengan mendelegasikan tugas kepada programmer lain dalam tim atau programmer junior yang mempelajari pemeliharaan kode.
OpenAI menggambarkan ini sebagai “Pengembangan perangkat lunak asli-Agen, di mana AI tidak hanya membantu Anda saat Anda bekerja tetapi juga mengambil alih pekerjaan secara mandiri.”
Video peluncuran mendemonstrasikan kemampuan Codex untuk mengelola banyak tugas secara bersamaan, masing-masing beroperasi di lingkungan virtual yang terisolasi dan terpisah.
Programmer menugaskan tugas kepada agen, yang kemudian menjalankan pekerjaan secara mandiri. Setelah selesai, agen memberikan hasil pengujian dan menyarankan perubahan kode.
Demo tersebut menampilkan Codex yang melakukan perbaikan bug, memindai kesalahan ketik, menawarkan saran tugas, dan melakukan refactoring seluruh proyek (memodifikasi kode untuk meningkatkan struktur tanpa mengubah perilaku).
Pengembang dan desainer senior terbiasa mengartikulasikan persyaratan dan meninjau pekerjaan orang lain. Menggunakan Codex tidak akan memperkenalkan perubahan signifikan bagi mereka. Namun, pengembang yang kurang memiliki keterampilan artikulasi persyaratan dan peninjauan yang kuat mungkin merasa mengelola Codex agak menantang.
Meskipun demikian, jika alat ini berfungsi seperti yang ditunjukkan, Codex akan memberdayakan tim yang lebih kecil dan pengembang individu untuk mencapai lebih banyak, mengurangi tugas berulang, dan merespons laporan masalah dengan lebih efektif.
Potensi Jebakan dan Strategi Mitigasi
Pengalaman awal dengan kemampuan coding ChatGPT mengungkapkan kecenderungan untuk kehilangan fokus atau menyimpang dari arah yang dimaksudkan. Walaupun ini tidak menjadi masalah besar untuk blok kode individual, hal itu dapat menyebabkan konsekuensi yang tidak diinginkan dan bermasalah jika agen coding diizinkan untuk beroperasi dengan pengawasan terbatas.
Untuk mengatasi hal ini, OpenAI telah melatih Codex untuk mematuhi instruksi yang diuraikan dalam file AGENTS.md. File ini, yang terletak di repositori, memungkinkan programmer dan tim untuk memandu perilaku Codex. Ini dapat mencakup instruksi tentang konvensi penamaan, aturan pemformatan, dan pedoman konsisten lainnya yang diinginkan di seluruh proses coding. Ini pada dasarnya memperluas pengaturan personalisasi ChatGPT ke lingkungan tim yang berpusat pada repositori.
Selain itu, OpenAI telah memperkenalkan versi Codex yang disebut Codex CLI yang berjalan secara lokal di mesin pengembang. Tidak seperti Codex berbasis cloud, yang beroperasi secara asinkron dan memberikan laporan setelah selesai, versi lokal beroperasi melalui baris perintah programmer dan berfungsi secara sinkron.
Intinya, programmer memasukkan instruksi dan menunggu proses Codex CLI untuk mengembalikan hasil. Ini memungkinkan programmer untuk bekerja secara offline, memanfaatkan konteks lokal dari mesin pengembangan aktif mereka.
Prototipe Penelitian dengan Potensi yang Menjanjikan
Demo itu mengesankan, tetapi para pengembang menekankan bahwa apa yang mereka tunjukkan dan rilis adalah prototipe penelitian. Walaupun ia menawarkan apa yang mereka sebut “momen ajaib”, ia masih membutuhkan pengembangan yang signifikan.
Saya telah berusaha untuk memahami implikasi spesifik dari teknologi ini untuk masa depan pengembangan dan proses pengembangan saya sendiri. Produk utama saya adalah plugin WordPress open-source, dengan plugin add-on berpemilik. Codex berpotensi menganalisis repositori publik untuk plugin inti open-source.
Namun, bisakah Codex mengelola hubungan antara repositori publik dan beberapa repositori privat sebagai bagian dari satu proyek keseluruhan? Dan bagaimana kinerjanya saat pengujian tidak hanya melibatkan kode saya tetapi juga memutar seluruh ekosistem tambahan – WordPress – untuk mengevaluasi kinerja?
Sebagai seorang programmer solo, saya menyadari potensi manfaat dari alat seperti Codex. Bahkan langganan Pro $200 per bulan bisa jadi sepadan. Mempekerjakan seorang programmer manusia akan menelan biaya yang jauh lebih besar, dengan asumsi saya dapat memperoleh nilai nyata yang dapat dimonetisasi darinya.
Sebagai manajer tim dan komunikator yang berpengalaman, saya merasa nyaman mendelegasikan tugas ke sesuatu seperti Codex. Ini tidak jauh berbeda dengan berkomunikasi dengan anggota tim melalui Slack.
Fakta bahwa Codex memberikan rekomendasi, membuat draf versi, dan menunggu persetujuan saya memberikan rasa aman dibandingkan dengan hanya membiarkannya beroperasi secara bebas di dalam kode saya. Ini membuka kemungkinan yang menarik untuk siklus hidup pengembangan baru, di mana manusia mendefinisikan tujuan, AI membuat draf implementasi potensial, dan manusia kemudian menyetujui atau mengarahkan kembali AI untuk iterasi lain.
Pertanyaan yang Belum Terjawab dan Implikasi Masa Depan
Berdasarkan pengalaman saya sebelumnya menggunakan AI untuk coding, Codex berpotensi mengurangi waktu pemeliharaan dan mempercepat pengiriman perbaikan kepada pengguna. Namun, efektivitasnya dalam menambahkan fitur baru berdasarkan dokumen spesifikasi masih belum jelas. Demikian pula, kesulitan dalam memodifikasi fungsionalitas dan kinerja setelah implementasi Codex belum dapat ditentukan.
Perlu dicatat bahwa coding AI berkembang di berbagai perusahaan dengan kecepatan yang sama. Saya akan segera menerbitkan artikel lain tentang Agen Coding GitHub Copilot, yang memiliki beberapa fungsi yang sama dengan Codex.
Dalam artikel itu, saya menyatakan kekhawatiran bahwa agen coding ini dapat menggantikan programmer junior dan tingkat pemula. Di luar implikasi untuk pekerjaan manusia, ada juga pertanyaan tentang peluang pelatihan penting yang mungkin hilang jika kita mendelegasikan fase tengah karir pengembang ke AI.
Industri Perangkat Lunak "Into the Unknown"
Ada sebuah lagu di film Disney Frozen II berjudul "Into the Unknown," yang dinyanyikan oleh Idina Menzel. Lagu tersebut mencerminkan konflik internal karakter utama antara mempertahankan status quo dan menjelajah “ke tempat yang tidak diketahui.”
Dengan pengembangan perangkat lunak agentik, di luar hanya coding AI, seluruh industri perangkat lunak memulai perjalanan “ke tempat yang tidak diketahui.” Saat kita semakin bergantung pada sistem berbasis AI untuk mengembangkan perangkat lunak kita, jumlah pemelihara terampil kemungkinan akan berkurang. Ini dapat diterima selama AI terus berfungsi secara efektif dan tetap dapat diakses. Namun, apakah kita membiarkan keterampilan penting layu dan mengorbankan pekerjaan bergaji tinggi demi kenyamanan mendelegasikan ke infrastruktur berbasis cloud yang belum sepenuhnya sadar?
Waktu akan mengungkapkan jawabannya, dan semoga, wahyu ini tidak terjadi ketika kita kehabisan waktu.
Apakah Anda akan mempertimbangkan untuk mendelegasikan tugas pengembangan nyata ke alat seperti ini? Apa yang menurut Anda akan menjadi dampak jangka panjang pada tim perangkat lunak atau pengembang individu? Dan apakah Anda khawatir tentang kehilangan keterampilan atau peran penting karena semakin banyak siklus hidup kode yang dipercayakan kepada AI?