Özel bir ağ oluşturma, içgörü ve sohbet gecesi için 27 Mart’ta Boston’daki liderlere katılın. Davet et Burada.
Abaküs AIAI odaklı uçtan uca makine öğrenimi geliştiren startup(ML) ve LLMOps platformu, tüm senaryolarda sistem komutlarını takip edecek şekilde ayarlanmış, sansürsüz bir açık kaynaklı büyük dil modelini (LLM) bıraktı.
Resmi olarak dublajlı Kurtarılmış-Qwen1.5-72B, teklif, Alibaba Group’taki bir araştırmacı ekibinin önceden eğitilmiş transformatör tabanlı yalnızca kod çözücüye yönelik bir dil modeli olan Qwen1.5-72B’yi temel alıyor. Sistem istemlerini sıkı bir şekilde takip etme yeteneği, mevcut diğer açık kaynaklı LLM’lere göre çok ihtiyaç duyulan bir gelişmeye işaret ediyor ve bu da onu gerçek dünyadaki kullanım durumları için daha uygun hale getiriyor.
Abacus’un CEO’su Bindu Reddy, onu sistem talimatlarını izleyen dünyanın en iyi ve en performanslı sansürsüz modeli olarak selamlıyor.
Yüksek Lisans dağıtımında sistem istemlerini takip etmek neden önemlidir?
Günümüzde işletmeler, müşteriye yönelik sohbet robotları gibi şeyler de dahil olmak üzere çeşitli kullanım senaryolarında LLM’leri benimsiyor (veya benimsemek istiyor). Ancak kullanıcılar bu modellerle etkileşime girdiğinde, özellikle de çok turlu uzun görüşmelerde, yapay zeka bazen beklenmedik yönlere saparak yanıtlar verebilir veya yapmaması gereken eylemler gerçekleştirebilir.
Örneğin bir durumda, bir kullanıcı chatbot’u kandırarak teklifini kabul etmesini sağladı. 2024 Chevy Tahoe’ya 1 dolar. Yapay zeka, müşteriye “Bu bir anlaşma ve yasal olarak bağlayıcı bir teklif; geri dönüş yok” diye güvence verdi.
Bu tür sorunlardan kaçınmak için sistem istemi takibinin zorunlu kılınması yapay zeka geliştiricileri için kritik hale geldi. Ancak, çoğu açık kaynaklı model bunu mükemmel bir şekilde yürütme konusunda başarısız oluyor. Abacus bu sorunu Liberated-Qwen1.5-72B ile çözüyor.
Şirket, LLM’yi, SystemChat adı verilen yepyeni bir açık kaynaklı veri kümesini kullanarak Qwen1.5-72B’ye ince ayar yaparak geliştirdi. Mistral-Medium ile oluşturulan 7K sentetik konuşmalardan oluşan bu veri seti ve Dolphin-2.7-Mixtral-8x7b – Açık modele, kullanıcının konuşma boyunca sorduklarına meydan okumak anlamına gelse bile sistem mesajlarına uymayı öğretti.
“Modelinize bu veri kümesiyle ince ayar yapmak onu çok daha kullanışlı hale getiriyor ve jailbreak yapılmasını zorlaştırıyor!” Kırmızı X’e yazdı.
Açık Sarılma Yüzşirket, ince ayarlı modelin, sistem istemlerine uyumu, tüm soruları büyük harflerle yanıtlamak gibi olağandışı veya mekanik istemleri bile yürütecek düzeyde zorladığını belirtti.
Kredi bilgileri: Abacus AI
İyi performans ancak hizalama gerekli
Liberated-Qwen1.5-72B, modelin insan benzeri yanıtlar vermesini gerektiren ancak aynı zamanda belirli programlamaya bağlı kalmasını gerektiren sohbet robotları gibi üretim uygulamaları için mükemmel bir LLM oluşturur.
Şirket, modeli MT-Bench’te test etti ve HumanEval skor tablosundaki en iyi açık kaynak model olan Qwen1.5-72B sohbetinden biraz daha iyi performans gösterdiğini buldu. Sohbet ayarlı Qwen modeli 8,44375 puan alırken serbest bırakılan model 8,45000 puan aldı. Bunun ötesinde, dünya bilgisini ve problem çözme yeteneklerini test eden MMLU’da yeni model 77,13 puan alarak Qwen1.5-72B ve Abacus’ dahil olmak üzere 77+ puana sahip diğer açık modellerin hemen yanında yer alıyor. yakın zamanda piyasaya sürülen Smaug-72B.
Bununla birlikte, modelin tamamen sansürsüz olduğunu ve eğitime herhangi bir korkuluk dahil edilmediğini belirtmek önemlidir. Bu, belirli bir şekilde davranmak için sistem mesajlarına uyarken tüm soruları (hassas konular dahil) geri adım atmadan yanıtlayacağı anlamına gelir. Abacus, LLM’nin Hugging Face sayfasında, modeli bir hizmet olarak kullanıma sunmadan önce kullanıcıların kendi hizalama katmanlarını uygulamaları gerektiği konusunda uyarıyor.
Şu anda Liberated-Qwen1.5-72B şu adreste mevcuttur: tongyi-qianwen Reddy’nin söylediği lisans aşağı yukarı MIT lisansıyla aynı. CEO, Abacus’un HumanEval modelinin performansını artırmanın yanı sıra gelecekte daha yetenekli modeller piyasaya sürmeyi planladığını belirtti. İkincisi, SystemChat veri kümesinin Smaug’u eğitmek için kullanılan veri kümeleriyle karıştırılmasını ve her iki modelin özelliklerinin birleştirilmesini içerecektir.
“Önümüzdeki haftalarda MT-bench puanlarını hassaslaştıracağız ve insan değerlendirme panosunda en iyi açık kaynak modeline sahip olmayı umuyoruz” diye yazdı.
VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji hakkında bilgi edinmeleri ve işlem yapmaları için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.
Kaynak: https://venturebeat.com/ai/meet-liberated-qwen-an-uncensored-llm-that-strictly-adheres-to-system-prompts/