https://dikpora-solo.net/ https://178.128.59.149/ https://68.183.7.18/ https://139.59.17.142/ https://159.89.196.90/ https://167.71.231.203/ jpbos4d https://159.89.123.35/ https://157.245.100.46/ https://209.38.193.240/ https://170.64.146.188/ https://164.90.185.101/ https://161.35.153.241/ https://206.189.131.249/ https://167.99.200.34/ https://147.182.195.76/ https://143.110.214.193/ https://147.182.182.1/ https://206.189.143.71/ https://159.65.140.38/ https://159.89.163.50/ https://161.35.45.9/ https://170.64.227.218/ https://206.189.6.23/ https://68.183.193.218/ https://134.209.156.188/ WARKOPTOTO WARKOPTOTO2 WARKOPTOTO3 WARKOPTOTO5 WARKOPGAMING MALUKU4D JPBOS4D MANTAPBOS
https://178.128.255.170/
Para peneliti membuka sumber Sky-T1, model AI ‘penalaran’ yang dapat dilatih dengan biaya kurang dari $450!

achateclaire.com – Model AI penalaran yang disebut-sebut menjadi lebih mudah — dan lebih murah — untuk dikembangkan.

Pada hari Jumat, NovaSky, tim peneliti yang berbasis di Sky Computing Lab, UC Berkeley, merilis Sky-T1-32B-Preview, model penalaran yang kompetitif dengan versi sebelumnya dari OpenAI o1 pada sejumlah tolok ukur utama. Sky-T1 tampaknya menjadi model penalaran sumber terbuka pertama yang sesungguhnya dalam arti bahwa model tersebut dapat direplikasi dari awal; tim merilis kumpulan data yang mereka gunakan untuk melatihnya serta kode pelatihan yang diperlukan.

“Hebatnya, Sky-T1-32B-Preview dilatih dengan biaya kurang dari $450,” tulis tim tersebut dalam sebuah posting blog, “yang menunjukkan bahwa adalah mungkin untuk mereplikasi kemampuan penalaran tingkat tinggi dengan biaya terjangkau dan efisien.”

Meskipun $450 mungkin tidak terdengar terjangkau, belum lama ini harga untuk melatih model dengan kinerja yang sebanding sering kali berkisar jutaan dolar. Data pelatihan sintetis, atau data pelatihan yang dihasilkan oleh model lain, telah membantu menekan biaya. Palmyra X 004, model yang baru-baru ini dirilis oleh perusahaan AI Writer, yang dilatih hampir seluruhnya pada data sintetis, dilaporkan hanya menghabiskan biaya $700.000 untuk pengembangan.

Tidak seperti kebanyakan AI, model penalaran secara efektif memeriksa fakta sendiri, yang membantu mereka menghindari beberapa jebakan yang biasanya menjegal model. Model penalaran membutuhkan waktu sedikit lebih lama — biasanya beberapa detik hingga beberapa menit lebih lama — untuk sampai pada solusi dibandingkan dengan model nonpenalaran yang umum. Kelebihannya adalah, model tersebut cenderung lebih andal dalam domain seperti fisika, sains, dan matematika.

Tim NovaSky mengatakan bahwa mereka menggunakan model penalaran lain, QwQ-32B-Preview milik Alibaba, untuk menghasilkan data pelatihan awal untuk Sky-T1, kemudian “menyusun” campuran data dan memanfaatkan GPT-4o-mini milik OpenAI untuk menyusun ulang data ke dalam format yang lebih bisa diterapkan. Pelatihan Sky-T1 dengan 32 miliar parameter memakan waktu sekitar 19 jam menggunakan rak yang berisi 8 GPU Nvidia H100. (Parameter kira-kira sesuai dengan keterampilan pemecahan masalah model.)

Menurut tim NovaSky, Sky-T1 berkinerja lebih baik daripada versi pratinjau awal o1 pada MATH500, kumpulan tantangan matematika “tingkat kompetisi”. Model tersebut juga mengalahkan pratinjau o1 pada serangkaian masalah sulit dari LiveCodeBench, sebuah evaluasi pengodean.

Namun, Sky-T1 tidak sebagus pratinjau o1 pada GPQA-Diamond, yang berisi pertanyaan terkait fisika, biologi, dan kimia yang diharapkan dapat diketahui oleh lulusan PhD.

Yang juga penting untuk dicatat adalah bahwa rilis GA OpenAI untuk o1 adalah model yang lebih kuat daripada versi pratinjau o1, dan bahwa OpenAI diharapkan akan merilis model penalaran yang berkinerja lebih baik, o3, dalam beberapa minggu mendatang.

Namun, tim NovaSky mengatakan bahwa Sky-T1 hanya menandai dimulainya perjalanan mereka untuk mengembangkan model sumber terbuka dengan kemampuan penalaran tingkat lanjut.

“Ke depannya, kami akan fokus pada pengembangan model yang lebih efisien yang mempertahankan kinerja penalaran yang kuat dan mengeksplorasi teknik tingkat lanjut yang selanjutnya meningkatkan efisiensi dan akurasi model pada saat pengujian,” tulis tim tersebut dalam postingan tersebut. “Nantikan perkembangan kami dalam inisiatif yang menarik ini.”

By Udin

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *