Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitimi Üzerine Sınırları Zorlayan Keşif
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik engel olan aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir; bu, AI sisteminin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalardan bakıldığında, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu yazının odaklandığı Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performanslı küme içinde tüm eğitim sürecini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımını, gradyan senkronizasyonunu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarmaktadır, bu da GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Verimlilik, kaynak kontrolü gibi avantajları vardır, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirir.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve eşgüdümlü bir şekilde gerçekleştirilmesi yatmaktadır; bu sayede tek makineli hesaplama ve depolama darboğazları aşılmaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen planlama ve senkronizasyon altında çalışmaktadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışmaktadır. NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunları içerir:
Veri paralelliği: Her bir düğüm farklı veri parametrelerini eğitir, model ağırlıklarının eşleşmesi gerekir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlama
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel granulariteyi artırmak
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını görevleri tamamlamak için koordine etmesine benzer. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Bunun temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmadan işbirliği içinde eğitim görevlerini tamamlar, genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin.
Merkeziyetsizlik: Merkezî bir denetleyici yok, görev dağıtımı, hata geri alma mekanizması karmaşık.
Merkeziyetsizlik eğitimi, dünya genelinde bir grup gönüllünün, kendi hesaplama güçlerini birleştirerek bir modeli eğittiği anlamına gelebilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok düzeyi içermektedir. Ancak, "iş birliği etkili + dürüstlüğü teşvik etme + sonuçların doğru olması" henüz erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş formu olarak, verilerin yerel olarak korunmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur. Federated öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminde veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri için geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvene dayanmayan düğümler arasında verimli bir şekilde tamamlanması zorlaşır. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, hukuki uyum ve etik kısıtlamalar nedeniyle açılamaz ve paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut Merkeziyetsizlik eğitiminin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitiminin bir safsata olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralelleştirilebilen ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayar, davranış hizalaması gibi ardıl eğitim görevleri (, RLHF, DPO ), veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolü yapılabilen küçük temel model eğitimi ve kenar cihazların dahil olduğu işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik projelerin analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğündeki temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermekte ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise nispeten net olup, ilk mühendislik ilerlemelerini görebilmekteyiz.
Prime Intellect: Eğitim izleri doğrulanabilir pekiştirmeli öğrenme iş birliği ağı öncüsü
Prime Intellect, herkesin eğitim sürecine katılabileceği ve hesaplama katkıları için güvenilir ödüller alabileceği bir güvene ihtiyaç duymadan AI eğitim ağı inşa etmeye kendini adamıştır. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizması açısından eksiksiz bir AI Merkeziyetsizlik eğitim sistemi oluşturmayı hedeflemektedir.
Prime Intellect protokol yığını yapısı ve ana modül değeri
Prime Intellect eğitim ana mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanarak, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizması ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlama olmayan ortamlarda esnek eğitim sağlamada daha uygundur, bu da sistem karmaşıklığını azaltır ve çoklu görev paralelliği ile strateji evrimi için bir temel oluşturur.
TOPLOC, Prime Intellect tarafından önerilen doğrulanabilirlik eğitim çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tam model yeniden hesaplamasına bağımlı değildir; bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene ihtiyaç duymadan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir, denetlenebilir ve teşvik edici merkeziyetsiz işbirliği eğitim ağlarının inşası için uygulanabilir bir yol sunar.
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve agregasyon protokolüdür; asenkron, bant genişliği kısıtlı ve düğüm durumu sürekli değişen gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların yavaş yavaş yakınsamasını ve çoklu versiyon evrimini sağlar. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlikle eğitimde ölçeklenebilirliği ve hata toleransı yeteneklerini önemli ölçüde artırır, kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonlarının temeli için kritik bir altyapıdır.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo konseptini bağımsız olarak uyguladığı ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitimi sırasında sıkça karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizmasını birleştiren OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazların eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar ve küresel işbirliği eğitimine katılımı önemli ölçüde artırır. Bu, merkeziyetsizlik eğitim ağı inşasında kritik bir iletişim altyapılarından biridir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerinin temel bileşenidir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene dayanmayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturmayı sağlamıştır.
Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılmasına ve gerçek katkılara dayalı ödüller almasına olanak tanıyan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizması olan bir eğitim ağı inşa etmiştir. Protokol, üç ana rol türüne dayanarak çalışır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim düğümü: Yerel eğitim uygulama, ağırlık güncellemeleri ve gözlem izlerini gönderme.
Doğrulama Düğümleri: TOPLOC mekanizmasını kullanarak eğitim davranışının gerçekliğini doğrulamak ve ödül hesaplaması ile strateji birleştirmeye katılmak.
Protokolün temel süreçleri görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme (SHARDCAST) ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliği ile eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile tamamlanmıştır, tamamen asenkron bir mimari kullanılarak, eğitim süresi 400 saati aşmıştır ve asenkron işbirliği ağının uygulanabilirliği ve istikrarını göstermektedir. Bu model, sadece bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL( asenkron eğitim yapısı), TOPLOC( eğitim davranışı doğrulaması) ve SHARDCAST( asenkron ağırlık birleştirme) gibi temel protokol modüllerini entegre etmiştir. Bu, Merkeziyetsizlik eğitim ağının eğitim sürecinin açık, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini göstermektedir.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Kripto AI devrimi: Merkeziyetsizlik eğitimindeki sınırları ve zorlukları keşfetmek
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitimi Üzerine Sınırları Zorlayan Keşif
AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik engel olan aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir; bu, AI sisteminin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalardan bakıldığında, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu yazının odaklandığı Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performanslı küme içinde tüm eğitim sürecini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımını, gradyan senkronizasyonunu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarmaktadır, bu da GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Verimlilik, kaynak kontrolü gibi avantajları vardır, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirir.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve eşgüdümlü bir şekilde gerçekleştirilmesi yatmaktadır; bu sayede tek makineli hesaplama ve depolama darboğazları aşılmaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen planlama ve senkronizasyon altında çalışmaktadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışmaktadır. NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunları içerir:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını görevleri tamamlamak için koordine etmesine benzer. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Bunun temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmadan işbirliği içinde eğitim görevlerini tamamlar, genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelinde bir grup gönüllünün, kendi hesaplama güçlerini birleştirerek bir modeli eğittiği anlamına gelebilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok düzeyi içermektedir. Ancak, "iş birliği etkili + dürüstlüğü teşvik etme + sonuçların doğru olması" henüz erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş formu olarak, verilerin yerel olarak korunmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur. Federated öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminde veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri için geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvene dayanmayan düğümler arasında verimli bir şekilde tamamlanması zorlaşır. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, hukuki uyum ve etik kısıtlamalar nedeniyle açılamaz ve paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut Merkeziyetsizlik eğitiminin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitiminin bir safsata olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralelleştirilebilen ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayar, davranış hizalaması gibi ardıl eğitim görevleri (, RLHF, DPO ), veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolü yapılabilen küçük temel model eğitimi ve kenar cihazların dahil olduğu işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik projelerin analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğündeki temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermekte ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise nispeten net olup, ilk mühendislik ilerlemelerini görebilmekteyiz.
Prime Intellect: Eğitim izleri doğrulanabilir pekiştirmeli öğrenme iş birliği ağı öncüsü
Prime Intellect, herkesin eğitim sürecine katılabileceği ve hesaplama katkıları için güvenilir ödüller alabileceği bir güvene ihtiyaç duymadan AI eğitim ağı inşa etmeye kendini adamıştır. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizması açısından eksiksiz bir AI Merkeziyetsizlik eğitim sistemi oluşturmayı hedeflemektedir.
Prime Intellect protokol yığını yapısı ve ana modül değeri
Prime Intellect eğitim ana mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanarak, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizması ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlama olmayan ortamlarda esnek eğitim sağlamada daha uygundur, bu da sistem karmaşıklığını azaltır ve çoklu görev paralelliği ile strateji evrimi için bir temel oluşturur.
#TOPLOC:Ağırlık antrenmanı davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen doğrulanabilirlik eğitim çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tam model yeniden hesaplamasına bağımlı değildir; bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene ihtiyaç duymadan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir, denetlenebilir ve teşvik edici merkeziyetsiz işbirliği eğitim ağlarının inşası için uygulanabilir bir yol sunar.
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve agregasyon protokolüdür; asenkron, bant genişliği kısıtlı ve düğüm durumu sürekli değişen gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların yavaş yavaş yakınsamasını ve çoklu versiyon evrimini sağlar. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlikle eğitimde ölçeklenebilirliği ve hata toleransı yeteneklerini önemli ölçüde artırır, kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonlarının temeli için kritik bir altyapıdır.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo konseptini bağımsız olarak uyguladığı ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitimi sırasında sıkça karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizmasını birleştiren OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazların eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar ve küresel işbirliği eğitimine katılımı önemli ölçüde artırır. Bu, merkeziyetsizlik eğitim ağı inşasında kritik bir iletişim altyapılarından biridir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerinin temel bileşenidir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene dayanmayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturmayı sağlamıştır.
Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılmasına ve gerçek katkılara dayalı ödüller almasına olanak tanıyan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizması olan bir eğitim ağı inşa etmiştir. Protokol, üç ana rol türüne dayanarak çalışır:
Protokolün temel süreçleri görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme (SHARDCAST) ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik döngüsü oluşturur.
INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliği ile eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile tamamlanmıştır, tamamen asenkron bir mimari kullanılarak, eğitim süresi 400 saati aşmıştır ve asenkron işbirliği ağının uygulanabilirliği ve istikrarını göstermektedir. Bu model, sadece bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL( asenkron eğitim yapısı), TOPLOC( eğitim davranışı doğrulaması) ve SHARDCAST( asenkron ağırlık birleştirme) gibi temel protokol modüllerini entegre etmiştir. Bu, Merkeziyetsizlik eğitim ağının eğitim sürecinin açık, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini göstermektedir.
Performans açısından, INTELLECT-2