Çinli teknoloji şirketleri OpenAI ile aralarındaki farkı kapatmak için her türlü kaynağı ve yeteneği bir araya getiriyor ve Pasifik Okyanusu’nun her iki yakasındaki araştırmacıların deneyimleri şaşırtıcı derecede benzer olabilir. Bir Alibaba araştırmacısının yakın tarihli bir X gönderisi, ChatGPT’nin yeteneklerini yakalamaya çalışan bir dizi Çinli internet devi arasında yer alan e-ticaret firmasında büyük dil modelleri geliştirmenin hayatına nadir bir bakış sunuyor.
Alibaba’nın büyük dil modeli ekibi Qwen’de doğal dil işleme araştırmacısı olan Binyuan Hui, Paylaşıldı X’teki günlük programı, bir postalamak OpenAI araştırmacısı Jason Wei tarafından yakın zamanda viral hale gelen bir makale.
Tipik günlerine paralel bir bakış, sabah 9’da uyanma saatleri ve gece 1 civarında yatma zamanları ile çarpıcı benzerlikleri ortaya koyuyor. Her ikisi de güne toplantılarla başlıyor ve bunu bir kodlama, model eğitimi ve meslektaşlarıyla beyin fırtınası dönemi izliyor. Eve döndükten sonra bile geceleri deneyler yapmaya devam ediyorlar ve modellerini uyku vaktine kadar geliştirmenin yolları üzerinde kafa yoruyorlar.
Göze çarpan fark, Alibaba çalışanı Hui’nin “dünyada neler olup bittiğini” öğrenmek için araştırma makalelerini okumaktan ve X’e göz atmaktan bahsetmesiydi. Ve bir yorumcunun belirttiği gibi Hui, Wei’nin yaptığı gibi eve geldikten sonra bir kadeh şarap içmiyor.
Bu yoğun çalışma rejimi, en iyi üniversite derecelerine sahip teknoloji yeteneklerinin rekabetçi yapay zeka modelleri oluşturmak için gruplar halinde teknoloji şirketlerine katıldığı Çin’in mevcut LLM alanında alışılmadık bir durum değil. Hui’nin zorlu programı, bir dereceye kadar, yapay zeka alanındaki Silikon Vadisi şirketlerini geride bırakmasa da onlarla eşleşmeye yönelik kişisel bir çabayı yansıtıyor. Bu, video oyunları ve e-ticaret gibi ağır operasyonlar içeren daha “geleneksel” Çin internet işletmeleriyle ilişkilendirilen istemsiz “996” çalışma saatinden farklı görünüyor.
Aslında ünlü yapay zeka yatırımcısı ve bilgisayar bilimcisi Kai-Fu Lee bile inanılmaz miktarda çaba harcıyor. Kasım ayında Lee’yle yeni çıkardığı LLM unicorn 01.AI hakkında röportaj yaptığımda, geç saatlerin normal olduğunu ancak çalışanların isteyerek çok çalıştıklarını itiraf etti. O gün, çalışanlarından biri sabah 2:15’te ona mesaj atarak 01.AI misyonunun bir parçası olmaktan duyduğu heyecanı dile getirdi.
Bu tür iş etiği, Çin’in teknoloji firmalarının yüksek lisans programlarını uygulamaya koyma konusundaki hızlı hızını kısmen açıklıyor. Örneğin Qwen, hem İngilizce hem de Çince verilerle eğitilmiş açık kaynaklı bir dizi temel modele sahiptir. En büyüğü, bir modelin geçmiş eğitim verilerinden edindiği bilgiye benzeyen ve bağlamsal olarak ilgili yanıtlar üretme yeteneğini tanımlayan 72 milyar parametreye sahiptir. Ekip ayrıca ticari uygulamaları tanıtmakta da hızlı davrandı. Geçen Nisan ayında Alibaba, Qwen’i kurumsal iletişim platformu Dingtalk ve çevrimiçi perakendeci Tmall’a entegre etmeye başladı.
Çin’in LLM alanında şu ana kadar kesin bir lider ortaya çıkmadı ve risk sermayesi şirketleri ve kurumsal yatırımcılar bahislerini birden fazla yarışmacıya yayıyor. Alibaba, kendi yüksek lisans eğitimini kendi bünyesinde kurmanın yanı sıra, Moonshot AI, Zhipu AI, Baichuan ve 01.AI gibi girişimlere de agresif bir şekilde yatırım yapıyor.
Rekabetle karşı karşıya kalan Alibaba kendine bir niş yaratmaya çalışıyor ve çok dilli hareketi bir satış noktası haline gelebilir. Aralık ayında şirket, birçok Güneydoğu Asya dili için yüksek lisans diplomasını yayınladı. SeaLLM adı verilen model, Vietnamca, Endonezyaca, Tayca, Malayca, Khmer, Lao, Tagalogca ve Burma dilindeki bilgileri işleyebiliyor. Alibaba, bulut bilişim işi ve e-ticaret platformu Lazada’yı satın almasıyla bölgede büyük bir ayak izi oluşturdu ve potansiyel olarak SeaLLM’yi bu hizmetlere tanıtabilir.
Kaynak: https://techcrunch.com/2024/02/27/alibaba-staff-offers-glimpse-into-life-of-llm-researcher-in-china/