• Anasayfa
  • Blog
  • Kendi LoongArch mimarisine sahip Çinli işlemci Loongson 3A6000: performans testi

Kendi LoongArch mimarisine sahip Çinli işlemci Loongson 3A6000: performans testi

26.08.2024 07:05

Bu işlemci testi muhtemelen son yıllarda sitemizde gördüğümüz en sıra dışı testlerden biri. X86 tabanlı masaüstü ve dizüstü bilgisayarlara alışığız ancak Windows üzerinde çalışanlar da dahil olmak üzere yakın zamanda yeni modeller piyasaya süren Huawei ve Qualcomm'un çözümlerinde kullanılan ARM gibi başka bilgi işlem mimarileri de var. MIPS mimarisi x86 kadar yaygın olmasa da geçmişte de popülerdi.

Günümüzde alternatif mimarilere sahip işlemcilere olan ilginin arttığını görüyoruz. Örneğin ARM, modern masaüstü bilgisayarlar ve güçlü dizüstü bilgisayarlar için gereken güç seviyelerine ulaştı. Üstelik Çinli şirketler, genel amaçlı işlemciler ve grafik işlemciler de dahil olmak üzere mikroelektroniğin geliştirilmesinde önemli ilerleme kaydetti. En ilginç Çin işlemcilerinden biri, bu testte ele alacağımız Loongson 3A6000'dir.

Çin, bilgisayar teknolojisinin ekonomi açısından artan önemi ve yabancı çözümlere bağımlılığı azaltma ihtiyacı nedeniyle mikroçip üretiminde bağımsızlık arayışında. Çin şirketlerine ileri teknolojilerin ve mikroçiplerin satışını yasaklayan ticaret kısıtlamaları ve ABD yaptırımları karşısında Çin, aktif olarak kendi mikroelektronik endüstrisini geliştiriyor.

Bu bağlamda Loongson gibi Çinli şirketler kilit rol oynuyor. Örneğin Loongson, Çin'in önde gelen genel amaçlı işlemci üreticisidir. Çin yapımı Moore Threads GPU'lardan daha önce bahsetmiştik ve şimdi dizüstü bilgisayarlara, masaüstü bilgisayarlara ve sunuculara güç veren evrensel işlemcilere bakmanın zamanı geldi.

Amerika Birleşik Devletleri'nin uyguladığı ticari kısıtlamalara yanıt olarak Çin mikroelektroniğinin gelişimine önemli katkılar yapıldı. Bu kısıtlamalar, en son Batı teknolojilerine erişimi yavaşlatarak Çin'i alternatif çözümler aramaya ve kendi geliştirmelerine yatırım yapmaya zorladı. Çin fabrikalarının henüz Tayvan'ın TSMC'si gibi dünya liderleri seviyesine ulaşmamış olmasına rağmen ilerleme kaydediliyor ve yarı iletken savaşı onlarca yıl sürebilir.

Çin Bilimler Akademisi tarafından desteklenen Loongson Bilim ve Teknoloji, on yılı aşkın bir süre önce kuruldu ve birçok işlemci serisi üretti. 2022'de, 16 çekirdekli Godson 3C5000 ve 3C6000 sunucu modellerini ve daha sonra iki 3C6000 kalıbını tek bir alt tabaka üzerinde birleştiren 32 çekirdekli 3D6000'i piyasaya sürdüler. Yeni piyasaya sürülen 3A6000 işlemci, önceki 3A5000 modeline göre saat başına performansta önemli gelişmeler göstererek piyasadaki en iyi işlemcilere ciddi bir rekabet sağlıyor.

Masaüstü bilgisayarların ihtiyaçlarının karşılanması daha güçlü bir işlemci gerektiriyordu ve Loongson 3A6000 şirketin bugüne kadarki en güçlü çözümü haline geldi. Ağustos 2023'ün başında Çinli üretici, yeni nesil dört çekirdekli işlemci Loongson 3A6000'in üretimine başladığını duyurdu ve Kasım ayında resmi olarak sunuldu. Bu işlemci, Çinli mühendisler tarafından değiştirilmiş 64 bit MIPS64 mikro mimarisine sahiptir ve bir TPM donanım şifreleme modülünün yanı sıra DDR4-3200 desteğine sahip çift kanallı bir RAM denetleyicisi içerir.

Loongson 3A6000'in piyasaya sürülmesi sırasında şirketin 50'den fazla ortağı, bilgisayarlar, dizüstü bilgisayarlar, anakartlar, depolama aygıtları ve ağ güvenlik ekipmanları dahil olmak üzere buna dayalı ürünler duyurdu. Çin ticaret platformlarında Loongson 3A6000'i bitmiş bir sistemin parçası olarak veya iki versiyonda bir anakart üzerine kurulu olarak satın alabilirsiniz: biri hız aşırtma yetenekleri olmayan lehimli bir işlemciye sahip, diğeri bazı hız aşırtma yeteneklerine sahip Asus'tan, ki bu konuda biraz sonra konuşacağız. İncelemenin ikinci bölümünde daha fazla ayrıntı bulacaksınız.

Üretici, Loongson 3A6000'in performansının 10. nesil dört çekirdekli Intel Core işlemci — Core i3-10100 ile karşılaştırılabilir olduğunu iddia ediyor. Testlere bakıldığında, 3A6000 işlemci gerçekten de benzer Intel ve AMD işlemcilerle rekabetçi saat başına performans (IPC) sonuçları sergiliyor. Tek iş parçacıklı SPECint CPU 2006 testinde 3A6000 43,1 puan alırken, SPECfp CPU 2006'da 54,6 puan aldı. Bu sonuçlar, aynı saat hızı olan 2,5 GHz'e sahip önceki nesil Intel Core işlemcilerin sonuçlarına yakındır. SPEC CPU 2017 testlerinde saat hızı gecikmesine rağmen 3A6000'in sonuçları da iyi görünüyor.

Loongson 3A6000, saat başına işlem hızı açısından 11. nesil Core ve Zen 3 seviyesine ulaşacağı yönündeki beklentilere rağmen hâlâ Intel ve AMD işlemcilerin gerisinde kalıyor. 2,5 GHz hızında 3A6000, bazı testlerde 3,6 GHz hızında Core i3-10100'ün yalnızca biraz ilerisindedir, ancak bu tür testler azdır. Önceki 3A5000 modeliyle bir karşılaştırma, yeni işlemcinin tek iş parçacıklı performansının %60 oranında arttığını ve çok iş parçacıklı performansının daha da arttığını gösteriyor ki bu etkileyici, ancak büyük ölçüde düşük tabandan kaynaklanıyor.

Eğer Çinli mühendisler gerçekten de Intel ve AMD'nin modern çözümleriyle karşılaştırılabilecek bir IPC seviyesine ulaşmayı başardılarsa, bu önemli bir başarıdır. Ancak belirtildiği gibi IPC denklemin yalnızca bir parçasıdır ve saat hızı da önemli bir rol oynar. 3A6000'in maksimum frekansı olan 2,5 GHz, modern rekabetçi işlemcilerin turbo frekanslarından önemli ölçüde daha düşüktür ve bu da onun rekabet gücünü sınırlamaktadır. 4,3 GHz'e kadar saat hızına sahip Core i3-10100 genellikle daha hızlıdır.

Frekans sınırlaması yalnızca mimari özelliklerle değil aynı zamanda Çin yarı iletken endüstrisinin teknolojik geriliğiyle de ilişkilidir. Bu zorluklara rağmen Loongson, teknolojisini geliştirmeye devam ediyor ve işlemcilerinin performansını artırmaya çalışıyor.

Mimari özellikler

Loongson 3A6000 işlemci, önceki 3A5000 modelinin geliştirilmiş bir versiyonudur. Dört çekirdek ve dört iş parçacığına sahip, 2,5 GHz hızında çalışan, 35 W'a kadar enerji tüketen ve DDR4-3200 belleği destekleyen 3A5000'in aksine, yeni 3A6000 sürümü, çoklu iş parçacığı desteği ve artırılmış maksimum güç tüketimi sunuyor ancak aynı çalışma frekansını koruyor modern standartlara göre oldukça mütevazı görünüyor.

Önceki 3A5000 gibi 3A6000 işlemci de 12 nm'lik bir süreçle üretiliyor ve bu konuda hiçbir değişiklik yok. 3A6000'in kalıp boyutu yaklaşık 116 mm²'dir (11,6 x 10 mm), bu da 142 mm² alana sahip 3A5000'den daha küçüktür. Ancak yeni işlemci iki kat L1 önbelleğe sahipken, L2 önbelleği çekirdek başına 4 MB'ta kalıyor.

İncelediğimiz işlemci, 2022'de tanıtılan Godson mimarisinin en yeni nesli olan LoongArch mimarisini temel alıyor. Bundan önce şirket, resmi olmayan çözümlerle başlayıp ardından MIPS Technologies'den MIPS32 ve MIPS64 için lisanslar satın alarak MIPS mimarisini kullanıyordu. 32 bit MIPS32 mimarisine sahip ilk Loongson işlemcisi 2000'li yılların başında ortaya çıktı, bunu mimari uzantılara sahip ve x86 ikili çeviri desteğine sahip 64 bit modeller izledi.

Mimari uzantılar arasında yerel komut setleri, sanallaştırma, x86 ve ARM ikili çeviri hızlandırma ve 128 bit SIMD'ler için vektör uzantıları yer alıyordu. 2021 yılında LoongArch mikro mimarisi Loongson 3 5000 serisi işlemcilerle tanıtıldı. Bu mimari MIPS64'ü temel alıyor ancak Çinli mühendisler tarafından kendi talimatlarının eklenmesiyle uyarlandı. Sonuç olarak, çekirdek mikro mimarisi 128 bit ve 256 bit vektör talimatlarını (LSX ve LASX), sanallaştırma talimatlarını (LVZ) ve ikili çeviri için uzantıları (LBT) içerir.

3A6000 işlemci, 3A5000'deki LA464'e kıyasla yeni LA664 çekirdeklerini kullanıyor. Bu çekirdekler daha derin bir boru hattına sahiptir ve çoklu görev performansını artıran çoklu iş parçacığını (SMT) destekler. Özetle, dört çekirdekli 3A6000, sekiz iş parçacığını destekler ve 3A5000'e kıyasla tek iş parçacıklı performansta %32, çok iş parçacıklı performansta ise %84 artış sağlar.

Her LA664 çekirdeğinde 64 KB talimat önbelleği ve 64 KB L1 veri önbelleğinin yanı sıra 256 KB L2 önbelleği bulunur. Tüm çekirdekler için toplam L3 önbellek 16 MB'tır.

Bilgi işlem çekirdeklerinin mimarisi

3A6000 işlemcinin LA664 çekirdeği, sıra dışı talimat yürütme yetenekleri ve gelişmiş talimat yeniden sıralama özelliklerine sahiptir ve bu da onu önceki nesil Intel ve AMD'nin benzer çekirdekleriyle rekabet edebilir hale getirir. LA664, 3A5000'de bulunan önceki LA464 çekirdeğini temel almasına rağmen gelişmiş yeteneklere sahiptir ve aynı anda daha fazla talimat yürütebilir.

3A6000'deki şube tahmincisi, 3A5000'e göre önemli ölçüde geliştirildi ve birkaç nesil önceki Intel ve AMD işlemcilere benzer bir performans sunuyor. Loongson henüz Zen 3 ve daha yeni çözümler seviyesinde olmasa da, dal tahmincisindeki iyileştirmeler önceki modele kıyasla performansta gözle görülür bir artışa katkıda bulunuyor.

Testler, 3A6000'in dal öngörücünün, bilgi sıkıştırma gibi görevleri en azından Zen 1 seviyelerinde ve hatta belki de Zen 2'ye yakın bir düzeyde yerine getirdiğini gösteriyor. Zen 4 mimarisi çok daha üstün olmasına rağmen, 3A6000'in 3A5000'e göre gelişimi açıktır. Talimat tahmincisi yürütme yönünü belirlediğinde, talimat önbelleği verileri çekirdeğe sağlar. 3A6000, L1 talimat önbelleğini 64 KB'ye yükseltir; bu, rakipleri AMD ve Intel'in 32 KB'lik durumuna göre bir gelişmedir. Bu önbellek, artık 3A5000'den daha güçlü olan kod çözücüye güç sağlar.

Talimatlar sıra dışı yürütüldüğünde, yeniden adlandırma ve tahsis işlemi, talimatların durumunu izlemek için kuyruklardaki ve arabelleklerdeki yuvaları kullanır. Daha karmaşık yapılar, çekirdeğin talimat akışını daha fazla tahmin etmesine olanak tanır, gecikmeyi gizler ve talimat düzeyinde paralellik arayışını geliştirir. 3A6000 ayrıca kayıt dosyalarını ve bellek kuyruklarını dörtte bir veya daha fazla artırarak LA464'te mevcut olan dal arabellek eksikliklerini düzeltir.

Büyük sıra dışı yürütme arabellekleri, tek iş parçacıklı performansı artırmak için önemlidir, ancak CPU kaynaklarını birden çok iş parçacığına dağıtan iyi ayarlanmış çoklu iş parçacığı teknolojisi (SMT) de önemlidir. 3A6000, kayıt dosyaları, yükleme ve depolama kuyrukları gibi kaynakların statik paylaşımıyla SMT'nin muhafazakar bir sürümünü uygular. Bu, şirketin SMT desteğine sahip ilk işlemcisi için mantıklı bir seçim.

Yürütme birimleri INT ve FP

Önceki modelle karşılaştırıldığında, 3A6000'in tamsayı yürütme birimleri, ALU yürütme birimlerinin kullanımını daha verimli hale getiren zamanlayıcı performansındaki artış dışında büyük ölçüde değişmemiştir. 3A6000, ikisi dalları, ikisi de tamsayı çarpımlarını işleyen dört ALU kanalını korur. Bu organizasyon AMD'nin Zen 2 çözümünü andırıyor ancak AMD'nin tek kanalının aksine tamsayı çarpımları için iki kanala sahip, ancak AMD'nin zamanlayıcısı daha fazla yeteneğe sahip.

3A5000, LASX uzantısı sayesinde zaten 256 bit vektör işlemlerini destekliyordu, ancak yalnızca iki işlem hattıyla. 3A6000, her biri 256 bitlik paketlenmiş eklemeleri işleyebilen ve kayan nokta performansını önemli ölçüde artıran dört işlem hattını içerecek şekilde büyük bir revizyondan geçti. Karşılaştırıldığında, x86 işlemciler genellikle döngü başına yalnızca iki adet 256 bitlik paketli ekleme gerçekleştirebilir.

Bununla birlikte, tek turlu çoklu toplama (FMA) işlemlerinin en yüksek verimi değişmeden kalır: hem LA664 hem de LA464, döngü başına yalnızca bir FMA işlemi gerçekleştirebilir; bu, Zen 2 veya Skylake'in yarısı kadardır. Ek kanalların eklenmesine rağmen, zamanlayıcının yetenekleri %50 oranında arttı, bu da kayan nokta işlemlerinde performans artışı sağlamalıdır. Bu iyileştirmeler, 3A6000'i vektör ve kayan nokta iş yükleri için oldukça verimli bir işlemci haline getiriyor.

Önbellek ve bellek alt sistemi

İyi tasarlanmış bir önbellek ve bellek hiyerarşisi, modern, yüksek performanslı bir işlemcinin verimli çalışması için kritik öneme sahiptir. 3A6000 önceki modeldeki önbellek hiyerarşisini korurken, gecikmeyi azaltmaya ve önbellek verilerine erişimi kolaylaştırmaya yardımcı olacak iyileştirmeler yapıldı. Örneğin, L1 önbelleğinden verilere erişim gecikmesi dört döngüden üç döngüye düştü; bu, yüksek frekanslı Batı işlemcileriyle karşılaştırıldığında Loongson'un nispeten düşük frekansında özellikle önemlidir.

Mevcut nesil işlemciler, L1 önbellek kayıplarının ve L3 önbelleğin yüksek gecikme süresinin etkisini azaltmak için Düzey 2 (L2) önbellek kullanır. 3A6000, tıpkı eski Intel mimarileri gibi 256 KB L2 önbellek kullanır. Daha yeni AMD ve Intel işlemciler önemli ölçüde daha büyük L2 önbelleklere sahiptir: Zen 4'te 1 MB'a kadar ve Raptor Lake'te 2 MB'a kadar. 3A6000 L2 önbelleğinin boyutu aynı kalsa da gecikme süresi 14 döngüden 12 döngüye düşürüldü. Dört çekirdeğin tümü tarafından paylaşılan 16 MB L3 önbellek değişmedi, ancak L3 gecikmesi de muhtemelen geliştirilmiş L2 önbellek performansı sayesinde birkaç döngü azaldı.

3A6000'deki DDR4 bellek denetleyicisi, 3A5000'e kıyasla önemli ölçüde geliştirildi: RAM erişim gecikmesi 144 ns'den 104 ns'ye düştü. Ancak Loongson'un modern AMD ve Intel işlemcilere kıyasla daha düşük saat hızına sahip olması nedeniyle gerçek gecikme değerleri yüksek kalıyor. Sonuç olarak, gelişmiş talimat yeniden sıralama yeteneklerine ve daha yüksek talimat döngü hızlarına rağmen 3A6000, her önbellek seviyesinde daha yavaştır ve Zen 2 gibi eski modellere göre bile daha düşüktür.

Önbellek ve Bellek Bant Genişliği

Bellek bant genişliği, özellikle çok iş parçacıklı uygulamalarda performans açısından da kritik öneme sahiptir. 3A6000, önceki modeldeki bellek hiyerarşisi öğelerinin çoğunu koruyor ancak bazı iyileştirmeler içeriyor. 3A5000, Skylake ve Zen 2 işlemcilerle karşılaştırılabilir L1 önbellek bant genişliğine sahipti ve 3A6000, yazma bant genişliğini iki katına çıkardı. L1 veri önbelleği artık döngü başına iki adet 256 bitlik erişim sağlayarak nispeten düşük işlemci saat hızlarında bile mükemmel verim sağlıyor. Bu, benzer L1 verimine sahip olan Golden Cove çekirdeğiyle karşılaştırılabilir.

3A6000'in 256 KB ikinci düzey (L2) önbelleği önceki modelle hemen hemen aynı kalıyor: okuma ve yazma verimi döngü başına 21-22 bayttır; bu, modern Batılı işlemcilerle, özellikle de Intel'le karşılaştırıldığında daha azdır; bu rakam 64 bayttır. döngü başına bayt. Bununla birlikte, L3 önbellek bant genişliği döngü başına üçte bir oranında artarak 18 bayta çıktı; bu da Loongson 3A6000'in eski Intel işlemcilerle rekabet etmesine olanak tanıyor, ancak AMD'nin L3 önbelleği daha da iyi uygulanıyor.

3A6000'deki DDR4 bellek denetleyicisi, 3A5000'e göre önemli ölçüde geliştirildi. DDR4-3200 desteği bildirilse de bu hızda kararlı çalışma yalnızca tek kanal modunda sağlanabildi. Çift kanal modunda 3A6000, DDR4-1800/DDR4-1866 frekanslarında çalıştı, ancak bazı testler 2133 MHz'de çalışabildiğini gösterdi. Bu, belirli bellek modülleriyle uyumluluğa bağlı olabilir ve BIOS Kurulumunda bellek ayarı yoktur. Genel olarak modern standartlara göre 3A6000'in bellek performansı vasat kalıyor.

Ancak 3A6000, 3A5000'e göre yaklaşık %38 daha fazla tek iş parçacıklı performans sağlar ve 3A5000'de bulunmayan SMT desteği sayesinde çok iş parçacıklı görevlerde fark daha da büyüktür. SMT, SMT'siz varyasyona göre %20-30 performans artışı sağlarken rakiplerin kazancı %40'a ulaşabilmektedir. Buna rağmen, testlerde Loongson 3A6000, AMD ve Intel'in en son çözümleriyle karşılaştırıldığında rekabetçi sonuçlar gösteriyor; ancak bu, belirli testlere ve yazılıma bağlı.

İşlemci lansman etkinliğinde Loongson üç modeli tanıttı: sunucu ve üst düzey sistemler için LS3A6000-HV, masaüstü bilgisayarlar için LS3A6000-LL ve mobil cihazlar için LS3A6000M. Tüm modeller aynı fiziksel özelliklere sahiptir: 1190 pinli 35x35 mm FCBGA paketi. Saat hızı modele bağlı olarak 2,0 ila 2,5 GHz arasında değişir ve güç tüketimi 30 ila 80 W arasında değişir.

Loongson 3A6000 işlemcinin bellek denetleyicisi iki DDR4-3200 kanalını ve ECC hata düzeltmesini destekler. İşlemci, G/Ç için sırasıyla 200-800 MHz ve 1000-3200 MHz frekanslarında çalışan, HT 1.0 ve HT 3.0 standartlarıyla uyumlu, maksimum 6,4 Gbps hıza sahip bir HyperTransport 3.0 denetleyicisi kullanıyor. Güç tüketimini yönetmek için çekirdek saat dinamik olarak devre dışı bırakılır, çekirdek saat dinamik olarak dönüştürülür ve çekirdek alan dinamik voltajı kontrol edilir. 3A6000 işlemci yalnızca tek işlemcili bir yapılandırmada çalışır ve fiziksel veri yolu adres genişliği 44 bit ile sınırlıdır.

İşlemci, LG110 grafik çekirdeği içeren 7A2000 yonga seti ile birlikte geliyor. HDMI ve VGA aracılığıyla 120Hz'de 1920x1080'e veya 30Hz'de 4K'ya kadar çözünürlüklerin yanı sıra OpenGL 2.1 ve OpenGL ES 2.0'ı da destekler. Yonga seti 32 PCIe 3.0 hattı, dört SATA600 bağlantı noktası, dört USB 3.0 ve sekiz USB 2.0 sağlar. Bu özellikler giriş seviyesi PC'ler için yeterli genişletme ve bağlantı sağlar.

Performans testi

Test sistemleri ve koşulları

Testlerde hem belirtilen donanıma sahip Loongson 3A6000 işlemciye dayalı hazır bir Çin bilgisayarı hem de lehimli işlemciye, eksiksiz bir hava soğutucuya ve ek bileşenlere sahip Asus anakartı kullanıldı.

  • İşlemci: Loongson 3A6000 (4 çekirdek/8 iş parçacığı, 2,5 GHz)
  • Soğutma sistemi: küçük boyutlu hava soğutucuları
  • Anakartlar:
    • PNXC PN-L530A (7A2000 yonga seti)
    • Asus XC-LS3A6M (7A2000 yonga seti)
  • VERİ DEPOSU:
    • 16 GB (2x8 GB) DDR4-3200 CL16
    • 16 GB (1x16 GB) DDR4-3200 CL22
  • Video kartları: yerleşik LG110 yonga seti ve harici AMD Radeon RX 480 (8 GB)
  • Depolama: SSD Kimtigo TP3000 512 GB

Çin işlemcisi, selefi dört çekirdekli ve dört iş parçacıklı Loongson 3A5000 gibi DDR4-3200 belleği destekliyor. Çift kanal modu mümkündür, ancak DDR4 bellek kitlerimiz yalnızca DDR4-1800/1866 hızlarında çalışıyordu, bu da çift kanallı yapılandırmanın kullanılmasından elde edilen performans kazanımlarını sınırlıyordu. Sistem üzerindeki etkiyi değerlendirmek için çift kanallı belleği de test ettik. Referans olarak, bitmiş PNXC sisteminde tek kanal modunda tam DDR4-3200 hızında çalışan bir modül kuruludur.

Ne yazık ki, BIOS Kurulumunda bellek frekanslarını ve zamanlamaları ayarlamaya yönelik ayarlar yoktur; anakart, nispeten yeni platformun sınırlamalarından dolayı XMP profillerini seçme veya yapılandırma yeteneği olmadan tüm parametreleri otomatik olarak ayarlar. Yonga setine yerleşik Loongson ekran kartıyla birlikte ek testler için AMD Radeon RX 480 ekran kartını kullandık, bu modeli seçmenin nedenleri makalenin pratik kısmında anlatılacak.

Loongson 3A6000 için rakip seçmek zordu çünkü stoklarımızda Core i3-10100 gibi modeller yoktu. Bu nedenle, karşılaştırma için Intel ve AMD işlemcileri temel alan mevcut sistemlerin minimum yapılandırmalarını kullandık: DDR5 belleğe sahip bir Core i3-12100 ve dört çekirdekli Ryzen 5 1500X'i taklit edecek şekilde yapılandırdığımız bir Ryzen 7 1700 işlemci. Dört çekirdekli Ryzen 5 1500X'i simüle ederken 16 MB L3 önbelleğin tamamını korurken sınırlı Infinity Fabric bant genişliğiyle çekirdeklerin yarısını devre dışı bıraktık. Ayrıca Ryzen 5 1500X ile neredeyse birebir eşleşecek uygun bir güç tüketimi limiti de belirledik.

Ryzen ve Core işlemciler için XMP profillerinden alınan ayarlarla standart test anakartları ve tipik bellek kullanıldı ve işlemci özelliklerine uygun olarak güç tüketimi limitleri belirlendi. Ayrıca Core i3-12100'ü sabit 2,5 GHz frekansta test ederek Turbo Boost ve Thermal Velocity Boost gibi tüm güçlendirme teknolojilerini devre dışı bıraktık ve tüketim sınırını daha düşük bir sınıra ayarladık. Benzer şekilde simüle edilen Ryzen 5 1500X, Precision Boost Overdrive gibi hız aşırtma teknolojileri devre dışı bırakılarak sabit 2,5 GHz frekansa ayarlandı (ekran görüntüsüne bakın).

Sonuç olarak, Çin işlemcisi gibi tüm çekirdeklerin 2,5 GHz frekansında çalıştığı benzer işlemciler aldık. Core ve Ryzen'in aynı frekansta çalışmasıyla, Çin işlemcisinin mimarisini değerlendirebilir ve aynı saat hızında Intel ve AMD'nin en yeni olmasa da modern çözümleriyle nasıl karşılaştırıldığını öğrenebiliriz. Bu, IPC göstergesi olarak adlandırılan saat başına performansı veya saat başına yürütülen talimat sayısını karşılaştırmanıza olanak tanır.

Yazılıma gelince, şu ana kadar LoongArch mimarisini resmi olarak destekleyen iki tam teşekküllü işletim sistemi piyasaya sürüldü: Loongnix ve UOS. Ayrıca Rus ALT Linux'un test yapıları da mevcut ve destek gelecekte genişletilebilir. Bize verilen bilgisayar, Linux tabanlı UOS işletim sistemi önceden yüklenmiş olarak geldi, ancak testlerimizde Asus anakartını temel alan ikinci bir sistemde Loongnix'i de kullandık. Eşit test koşullarını sağlamak için Ryzen 5 ve Core i3, UOS'un x86 uyumlu bir sürümünü çalıştırarak piyasaya sürüldü. Lütfen diğer Linux ve/veya Windows sürümlerinin x86 işlemciler için daha iyi sonuçlar sağlayabileceğini unutmayın.

Test yazılımını seçmenin oldukça zor olduğu ortaya çıktı. Loongson için desteklenen Windows sürümlerinin olmaması ve tanıdık Linux yazılımının bulunmaması nedeniyle Phoronix Test Suite'i kullanmaya ve LoongArch64 mimarisiyle uyumlu mümkün olduğunca çok sayıda mevcut testi test etmeye karar verdik.

Pek çok test ya bu mimariyi desteklemediğinden ya da x86-64 için özel olarak tasarlanmış kitaplıklara ve optimizasyonlara bağlı olduğundan ve diğer CPU'larda derlenemediğinden bu süreç kolay olmadı. Kodda belirgin bir mimari bağımlılık olmasa bile derleme sorunları ortaya çıkabilir ve testleri çalıştırmayı denediğinizde yanlış davranışlarla, eksik sonuçlarla veya testlerin tamamlanmasında hatalarla karşılaşabilirsiniz. Sonuç olarak, paketteki yalnızca Loongson işlemcili bir sistemde çalıştırabildiğimiz testleri kullanabildik. Bazıları x86 ikili çevirisini kullanabilir, bu da nasıl çalıştıklarını belirlemeyi zorlaştırır.

Sentetik testler

Bellek ve önbelleğe alma performansı

Öncelikle Çinli mühendisler tarafından yapılan bellek denetleyicisi ve veri önbellekleme sisteminin etkinliğini değerlendirelim. Ne yazık ki, Intel DDR5 belleği desteklerken AMD ve Loongson yalnızca DDR4 ile çalıştığı için test koşulları işlemciler arasında farklılık gösteriyordu. Çin işlemcisi tek DDR4-3200 stick ile sorunsuz çalışmasına rağmen elimizdeki modüllerle çift kanal DDR4-3200 modunda çalışamıyordu. Ancak tek kanallı DDR4-3200 ile çift kanallı DDR4-1866 arasındaki performans farkı beklenenden azdı.

İlk test, LLCbench paketindeki CacheBench'i kullanarak önbellek ve RAM bant genişliğini kontrol etmekti. Bu test, okuma, yazma ve karma modlu veri işlemlerine yönelik verimi ölçer. Sonuçlar, Loongson'un tek kanallı ve çift kanallı modları arasındaki farkın önemsiz olması nedeniyle, performans üzerindeki ana etkinin RAM bant genişliğinden ziyade önbellek bant genişliğinden kaynaklandığını göstermektedir.

Intel işlemci, beklenen tüm modlarda açık bir avantaj gösteriyor — en yenisi ve DDR5-5200 kullanarak, Çin Loongson'a kıyasla önbellek ve bellekle çalışma konusunda iki kat daha fazla performans gösterdi. Ryzen 5 1500X'in bu testte Loongson'dan neredeyse bir buçuk kat daha hızlı olduğu ortaya çıktı, bu da çift kanallı bellek modunu desteklemesinden kaynaklanıyor.

Ancak frekans 2,5 GHz’e düştükçe işlemciler arasındaki fark azalıyor. Bu durumda Loongson, yalnızca Ryzen 5 1500X ile eşleşmekle kalmadı, aynı zamanda onu geride bırakarak aynı sayıda çekirdeğe sahip eski Zen 1'e kıyasla daha iyi önbellek performansı sergiledi. 2,5 GHz saat hızına sahip Core i3-12100, tam hızlı Zen 1 ile aynı seviyede kaldı. Genel olarak Loongson'un sonuçları şu ana kadar çok da kötü görünmüyor.

İkinci kıyaslama olan Bellek Bant Genişliği (MBW), veri kopyalama işlemlerinin hızını ölçen basit bir RAM bant genişliği testidir. İki veri boyutu kullandık: 128 MB ve 4 GB. Bu testte RAM bant genişliği önbellekten daha önemlidir; bu nedenle çift kanal modu, DDR4-1866 ile bile, ilk durumda daha düşük frekansa rağmen tek kanallı DDR4-3200'e göre bir avantaj göstermektedir.

Rakipleriyle karşılaştırıldığında Core i3-12100, DDR5 bellek kullanımı nedeniyle yine en hızlısıydı. Ryzen 5 1500X ayrıca özellikle ilk kopyalama modunda Çin işlemcisine göre daha iyi performans gösterdi. Bununla birlikte, sabit veri bloğu boyutuyla çift kanal modundaki Loongson, Zen 1 ailesinin işlemcilerinden bile daha yüksek hız gösterdi; bu, DDR4-1866 kullanımı göz önüne alındığında iyi bir sonuçtur.

RAMspeed, iki ortalama veri aktarım hızı modunu kullandığımız bir RAM performans testidir: tamsayı ve kayan nokta. Bu testte RAM bant genişliği çok önemli ve tek ve çift kanal modları arasındaki fark dikkat çekiciydi; ikinci seçenek, bellek frekansındaki azalmaya rağmen avantajlıydı.

Ancak bu avantaja rağmen Loongson 3A6000, Batılı şirketlerin eski işlemcilerinin sonuçlarına yaklaşamadı. Core i3-12100 ve Ryzen 5 1500X, Loongson'un maksimum hızı olan 2,5 GHz hızında çalıştırıldıklarında bile Çin işlemcisine kıyasla önemli ölçüde daha iyi performans gösterdi. Bu testte 3A6000'in rakip çözümlerden iki ila üç kat daha yavaş olduğu ortaya çıktı.

Bu bölümdeki son teste Stream denir. Bu, dört farklı ölçüm yöntemi sunan popüler bir RAM bant genişliği kıyaslamasıdır. Bu testte RAM'in verimliliğini inceledik ve sonuçlar, bellek kanalı sayısına bağlı olarak farklılıklar gösterdi.

Ne yazık ki Çinli işlemcinin sonuçları önemli bir başarı göstermedi. Bir modda Ryzen 5 1500X'e yaklaşmayı başardı, ancak diğerlerinde hem AMD'nin hem de bu karşılaştırmada en hızlısı olduğu ortaya çıkan DDR5 belleğe sahip daha güçlü Intel işlemcinin gerisinde önemli bir gecikme gösterdi. Genel olarak Çin işlemcisi, bellek denetleyicisinde eski Batılı işlemcilerin verimlilik seviyesine henüz ulaşmadı.

Sentetik ve genel testler

Farklı paketlerdeki sentetik kıyaslamalar, belirli görevlerde düşük seviyeli işlemci performansını değerlendirmek için yararlı olabilir, ancak bazıları çok yönlülük de sunar. Bu test grubu, işlemcinin çeşitli uygulama ve senaryolardaki göreceli performansını gösterir.

Çekirdek Gecikmesi, tüm işlemci çekirdeği kombinasyonları arasındaki gecikmeyi ölçen ve minimum, ortalama ve maksimum değerleri sağlayan bir testtir. Sonuçlar, çekirdekler arası gecikmelerin büyük ölçüde değişebildiği yonga mimarileri veya çok işlemcili sistemlerde özellikle ilgi çekicidir.

Test sonuçları, çift kanallı ve tek kanallı DDR4 bellek modlarında gecikmelerin neredeyse aynı olduğunu gösteriyor. Loongson 3A6000 kristalinin monolitik olduğu ve çekirdekleri arasındaki gecikme farklarının minimum düzeyde olduğu açıkça görülüyor — biraz daha kötü olmasına rağmen monolitik Core i3-12100 ile neredeyse aynı. Ancak frekans 2,5 GHz'e getirildiğinde Loongson avantaj göstermeye başlıyor. Ryzen 5 1500X işlemci, yonga mimarisi sayesinde açıkça geride kalıyor — farklı yongalarda bulunan aktif çekirdekler arasındaki gecikmeler, özellikle ortalama ve maksimum değerler önemli ölçüde daha yüksek.

EEMBC CoreMark, eski Dhrystone kıyaslamasının yerini alan, işlemcilerin ve mikrokontrolörlerin performansını ölçmek için tasarlanmış bir sentetik kıyaslama paketidir. Verileri aramak ve sıralamak, matris işlemleri, sağlama toplamı hesaplaması ve diğer görevler için algoritmalar içerir. Sonuçlar, farklı sistemler arasında uygun karşılaştırma yapılmasına olanak sağlayacak şekilde saniyedeki tekrar sayısı olarak sunulur.

Bu test zayıf bir şekilde bellek hızına bağlıdır ve bu testte Loongson 3A6000, tam 3,5 GHz frekansında bile Ryzen 5 1500X'in çok gerisinde değildir. AMD, Çin işlemcisinin 2,5 GHz saat hızına düştüğünde Loongson, Zen 1 nesil işlemciden daha iyi performans gösteriyor. 2,5 GHz'de çalışan Core i3-12100, nominal frekansı daha yüksek — 3,3 GHz olmasına rağmen 3A6000'den daha iyi performans gösteriyor. Bu, Çinli işlemciyi önemli ölçüde daha kötü sonuçlarla dezavantajlı duruma sokuyor.

Swet, çok işlemcili ve çok çekirdekli sistemler de dahil olmak üzere CPU'ların ve RAM'in performansını değerlendirmek için sentetik bir kıyaslamadır. Sonuçlar saniyedeki işlem sayısı olarak ifade edilir. RAM hızının belirtilen etkisine rağmen, Loongson 3A6000'de çift kanallı ve tek kanallı modlar arasında hiçbir fark fark edilmedi.

Diğer işlemcilerle karşılaştırıldığında Çin CPU'su zayıf sonuçlar gösteriyor: Tam frekansta Ryzen 5 1500X'ten iki kat daha yavaş ve nominal frekansta çalışan Core i3-12100'den neredeyse dört kat daha yavaş. Batılı işlemciler için frekansın 2,5 GHz'e düşürülmesine rağmen Loongson, bırakın Core i3'ü, Ryzen'e bile ulaşamıyor. Bu test, mimarisinin yetersiz optimizasyonu veya ikili çeviricinin kullanılması nedeniyle Çinli bir işlemci için muhtemelen pek uygun değildir, bu da bu tür sonuçları üreticinin tanıtım malzemeleri için çekici kılmaz.

HardInfo, ışın izlemeden kriptografiye kadar çeşitli görevleri kapsayan çeşitli performans testlerini içeren bir sistem ve donanım bilgilerini görüntüleme ve izleme aracıdır. Sonuçlar, yürütme süresi veya noktaları şeklinde sunulur.

Burada Çinli işlemci etkileyici sonuçlar gösteriyor. Işın izleme testinde Loongson 3A6000, tam frekansta Ryzen 5 1500X'ten daha iyi performans gösterdi ve nominal frekansında Core i3-12100 ile karşılaştırılabilir. Karmaşıklığıyla bilinen N-Queens görevinde Loongson en hızlısı olurken, Core i3-12100 en kötü sonucu gösterdi, bu da spesifik uygulamanın özelliklerinden kaynaklanabilir.

CryptoHash, Zlib ve Fibonacci testlerinde Loongson, normal frekansında Ryzen 5 ve 2,5 GHz'de Core i3 ile karşılaştırılabilecek kadar iyi sonuçlar gösteriyor. Ayrıca FFT (ayrık Fourier dönüşümü) testinde Çin işlemcisi, 2,5 GHz'de bile Core i3-12100'den daha düşük olmasına rağmen, 3,5 GHz'de Ryzen 5 1500X ile karşılaştırılabilecek iyi sonuçlar gösteriyor. Genel olarak Loongson 3A6000, normal frekanslarında performans açısından Ryzen 5 1500X'e yakın ancak Core i3-12100 hala açıkça daha hızlı.

Bu, Monte Carlo, Hızlı Fourier Dönüşümü, Sıralı Over-Jacobi Gevşetme, Seyrek Matris Çarpımı ve LU Matris Ayrışımı gibi çeşitli algoritmaları içeren bilimsel hesaplama standardı SciMark 2.0'ın Java sürümüdür. Testler, tüm algoritmalar için olmasa da, çift kanal modu için artan bellek bant genişliğinden bir miktar etki göstermektedir.

Loongson 3A6000, özellikle 2,5 GHz'e kadar yavaşlayan AMD ve Intel işlemcilerle karşılaştırıldığında iyi sonuçlar verdi. Bu, her ne kadar Çin işlemcisi tam hızlı Ryzen 5 1500X ve Core i3-12100'den hala uzak olsa da, saat döngüsü başına yürütülen talimat sayısına ilişkin iyi bir gösterge olduğunu gösteriyor. Sonuçlar belirli alt testlere bağlıdır; bazılarında Loongson, tam frekansta Ryzen seviyesine ulaştı.

Sıralı Jacobian süper gevşeme yönteminde ve seyrek matrisler üzerinde çarpma işlemlerinde Çin işlemcisi, daha yavaş olan Ryzen 5 1500X'ten bile daha düşüktü. Ancak Hızlı Fourier Dönüşümü testinde tam frekansta Ryzen'den daha iyi sonuçlar verdi ve LU matris ayrıştırmasında test edilen üç işlemci arasında en hızlısı oldu. Bu, pek çok şeyin belirli göreve ve optimizasyona bağlı olduğunu gösterir. Genel olarak IPC açısından Çinli işlemci Zen 1 ailesinin temsilcilerine yakın.

Karşılaştırmalı Stres-NG

Bu, birçok farklı testle kapsamlı donanım yükü testi için özel bir yardımcı programdır. Pakette çok sayıda test bulunduğundan, sonuçları yalnızca tüm sistemlerde başarıyla çalıştırılan testleri içerecek şekilde uygun bir tablo biçiminde sunmaya karar verdik.

Bu test aynı zamanda Loongson'un başka bir işletim sistemi olan Loongnix'i çift kanallı bellek modunda çalıştırmasına ilişkin sonuçları da gösterir. Tablodan da görebileceğiniz gibi sonuçlar farklılık gösteriyor ve bazı testlerde fark, değerin bir buçuk katına ulaşabiliyor. Tabloyu kendiniz analiz edebilirsiniz ancak Loongson 3A6000'i Batılı işlemcilerle karşılaştırarak birkaç önemli noktaya dikkat çekeceğiz.

Her şeyden önce, Loongson'un genellikle 2,5 GHz'e düşürülmüş bir frekansta çalışan Ryzen 5 1500X'ten daha aşağı olmadığını ve ortalama olarak hala biraz olmasına rağmen aynı modda Core i3-12100'e yakın olduğunu belirtmekte fayda var. daha modern Intel işlemciden daha düşük. En büyük kayıplar, matris hesaplamalarının ve özel SIMD talimatlarının aktif kullanımını gerektiren görevlerde gözlemlenir; bu, testlerin Loongson talimat seti için optimize edilemeyebileceğini gösterir.

İşleme

İşleme testleri, ışın izleme iş yükünün çok iş parçacıklı yapısı nedeniyle modern işlemciler için en zorlu testlerden bazılarıdır. Bu koşullar altında işlemciler mümkün olan en yüksek frekansı korumaya çalışır, maksimum enerji tüketir ve çok ısınır. Bu tür iş yükleri daha fazla çekirdeğe ve iş parçacığına sahip işlemciler tarafından daha iyi işlendiğinden, üreticiler genellikle işlemcilerinin performansını rakipleriyle karşılaştırmak için işleme testlerini kullanır.

Dört görüntü oluşturma hızı karşılaştırmasının sonuçlarını tek bir grafiğe koyduk:

  • AOBench: ortam perdelemesi kullanan, 2048x2048 piksel çözünürlüklü hafif işleyici.
  • C-Ray: Kayan nokta testi için çok iş parçacıklı ışın izleyici.
  • POV-Ray: Vision ray tracer'ın kalıcılığı.
  • Smallpt: OpenMP aracılığıyla çoklu iş parçacıklarını kullanan Monte Carlo yol izleme küresel aydınlatma oluşturucusu.

Bellek bant genişliğinin sonuçlar üzerinde çok az etkisi oldu; Bellek kanalı sayısıyla farklı modlarda işleme hızı neredeyse değişmeden kaldı. Loongson 3A6000'in render testlerindeki sonuçları oldukça etkileyiciydi. Yüksek IPC'yi vurgulayan aynı 2,5 GHz frekansında rakipleriyle hemen hemen aynı seviyede olmakla kalmayıp, bazı testlerde 3,5 GHz nominal frekansta Ryzen 5 1500X'e yakındı.

Core i3-12100, beklendiği gibi, 3,3 GHz hızıyla her iki rakibinin de önemli ölçüde önündeydi. Frekans 2,5 GHz'e düşürüldüğünde bile Çin işlemcisinden daha hızlı kaldı ve AMD'den yalnızca biraz daha düşüktü. Loongson 3A6000'in sonuçları, özellikle IPC'sinin daha modern işlemcilerden pek de aşağı olmadığı göz önüne alındığında başarılı sayılabilir. Beklentiler daha düşüktü ve önümüzde hala birçok farklı test var.

Medyayla çalışmak

Bu bölümde fotoğraflar ve videolar da dahil olmak üzere çeşitli medya işleme testlerine bakacağız. Bu testler, ses ve video verilerinin özel formatlara kodlanması gibi pratik görevlerin yanı sıra konuşma sentezi gibi daha özel görevleri de kapsar. Bu tür görevler sıklıkla birçok kullanıcı tarafından gerçekleştirildiğinden, bu bölümün sonuçlarının önemli pratik sonuçları vardır.

Başlangıç ​​olarak ses verilerinin sıkıştırılmasını çeşitli formatlarda test ettik: APE, FLAC ve WavPack. Bu formatların tümü kayıpsız ses sıkıştırması için tasarlanmıştır ve RAM bant genişliğinin sonuçlar üzerinde gözle görülür bir etkisi olmamıştır.

Maalesef Loongson 3A6000 işlemci ses kodlama testlerinde en iyi performansı gösteremedi. Her üç formatta da Çin işlemcisi hem AMD'nin hem de Intel'in gerisindeydi ve bu fark, frekansın 2,5 GHz'e düşmesine rağmen devam etti. Aynı frekanstaki Batılı işlemcilerle karşılaştırıldığında performans farkı iki ila üç kata, hatta bazen dört kat gecikmeye ulaştı! Bunun nedeni, daha az yaygın olan LoongArch işlemcileri için optimizasyon eksikliğidir. Ses kodlamanın çok zorlu bir iş olmadığı ve sürecin hala nispeten hızlı olduğu söylenebilirken, diğer ses işleme testlerine de bakalım.

Grafik konuşma sentezi ve ses işlemeyle ilgili iki testin sonuçlarını göstermektedir. İlk test, ses işlemede gerçek zamanlı CPU performansını ölçmek için platformlar arası bir araç olan Google SynthMark, polifonik bir sentezleyici içerir ve gecikmeyi, titreşimi ve işlem verimini değerlendirir. İkinci test olan eSpeak, geliştirilmiş eSpeak-NG motorunu ve WAV ses çıkışını kullanarak The Outline of Science'tan konuşma sentezi süresini ölçer.

Çift kanallı ve tek kanallı bellek modları arasındaki fark sonuçları etkilemedi, bu nedenle işlemcileri karşılaştırıyoruz. İlk testte Loongson 3A6000 iyi sonuçlar verdi: Performansı 2,5 GHz'e düşürülmüş frekansta Core i3-12100 ile karşılaştırılabilir düzeydeydi ve nominal frekansında neredeyse Ryzen 5 1500X seviyesine ulaştı ki bu mükemmel bir sonuç.

İkinci konuşma sentezi testinde sonuçlar daha az etkileyiciydi ancak yine de iyiydi: Loongson 3A6000, Ryzen 5 1500X'ten daha hızlıydı, 2,5 GHz'e yavaşladı ve aynı frekansta Core i3-12100'den biraz daha yavaştı. Bu, Loongson'un saat başına performansının iyi olduğunu doğruluyor ancak daha iyi sonuçlar elde etmek için ek optimizasyonlar ve özel talimatların kullanılması gerekiyor. Batılı işlemcilerin nominal frekansları dikkate alındığında Core i3-12100, Çin CPU'sunu önemli ölçüde aşıyor.

Dav1d, AV1 formatındaki video için yüksek hızlı bir yazılım kod çözücüsüdür. Full HD ve 4K çözünürlüklü iki videonun kodunu çözerek test ettik. İlginç bir şekilde, sonuçlar bellek moduna bağlı olarak değişiklik gösteriyor: çift kanallı DDR4-1866, tek kanallı DDR4-3200'e kıyasla biraz daha iyi performans gösterdi.

AV1 formatındaki videonun kodunu çözerken, ses verilerini kodlarken olduğu gibi aynı sorunlar ortaya çıktı — optimizasyon eksikliği ve özel talimatların kullanılması. Sonuç olarak, Loongson 3A6000'in kod çözme hızı, 2,5 GHz'lik azaltılmış frekansta çalışan Core i3-12100'ün yarısı kadardı ve aynı frekanstaki Ryzen 5 1500X'ten bir buçuk kat daha yavaştı.

Nominal frekanslarda Intel ve AMD işlemcilerle karşılaştırıldığında fark daha da belirginleşiyor — Loongson 3A6000 rakiplerinin 2-3,5 kat gerisinde kalıyor. Bu, Çinli işlemcinin bu kıyaslamada rekabetçi olmamasını sağlıyor. Ancak aynı anda birden fazla 4K videonun kodunu çözme göreviyle karşı karşıya kalmayan ortalama bir kullanıcı için 40 FPS oldukça yeterli bir performans olabilir. Buna rağmen sonuç yine de Loongson 3A6000'i rakiplerinin belirgin şekilde gerisinde bırakıyor.

Bir sonraki test, popüler x265 kodlayıcıyı kullanarak video verilerini H.265'e kodlayan yazılıma odaklanıyor. İki çözünürlüğü test ettik: Full HD ve 4K. Yüksek kodlama performansı elde etmek amacıyla, x86 uyumlu işlemciler için SSE, AVX, AVX2 ve AVX-512 ve Loongson için LSX ve LASX gibi SIMD talimatları yaygın olarak kullanılır.

Bu testteki sonuçlar, yüksek FPS'ye ulaşılmadığını ve saniyedeki her karenin kritik olduğunu göstermektedir. Modern sistemlerde video kodlama ve kod çözme genellikle grafik işlem birimi (GPU) tarafından yapılırken, böyle bir desteğin olmadığı durumlarda bu görev merkezi işlem birimi tarafından gerçekleştirilir. Bellek hızının sonuçlar üzerinde hiçbir etkisi yoktur; temel faktörler bilgi işlem gücü ve belirli mimariler için optimizasyonun kalitesidir.

Bununla birlikte, Loongson 3A6000, bu testte yine düşük performans gösteriyor; bunun nedeni, büyük olasılıkla özel talimatlar da dahil olmak üzere, LoongArch mimarisine yönelik optimizasyon eksikliğidir. Sonuç olarak, Çin işlemcisi Core i3-12100 ve Ryzen 5 1500X'ten önemli ölçüde daha düşüktür — 2,5 GHz'e kadar azaltılmış bir frekansta bile Intel işlemciye kıyasla fark 5-6 kata kadar çıkar. Nominal frekanslarda AMD ve Intel işlemcilerle karşılaştırıldığında fark daha da belirginleşerek 5-10 kata ulaşıyor. İlginç bir şekilde rakipler arasında Intel işlemci Ryzen'den daha iyi performans gösteriyor ancak bu, video kodlamada hala çok geride olan Loongson'a yardımcı olmuyor.

Başka bir zorlu teste bakalım: H.266/VVC formatında (Fraunhofer Versatile Video Encoder) hızlı ve verimli bir video kodlayıcı olan VVenC. Yerel olarak desteklenmeyen çeşitli platformlarda SIMD'nin taşınabilir uygulaması için bir kitaplık olan SIMD Everywhere'i (SIMDe) kullanır. Ne yazık ki Çinli üreticinin ürünleri desteklenen platformlar listesinde yer almıyor. X86 işlemciler her türlü SSE ve AVX talimatını kullanıyorsa ve ARM platformları SIMD hızlandırmalı Neon işlemlerini kullanıyorsa, Loongson yine performans sorunları yaşıyor demektir.

Aslında problemin karmaşıklığı artıyor ve SIMD talimatları olmadan iyi sonuçlara ulaşmak zorlaşıyor. X86 işlemciler için optimize edilmiş kod ile LoongArch'ta çalışan kod arasındaki açık fark açıkça ortaya çıkıyor. Loongson 3A6000 çalışmasına rağmen performansı Batılı işlemci modellerine göre gözle görülür derecede düşük. Nominal frekansta Core i3-12100 ile karşılaştırıldığında performans farkı 10 kat değil ama çok daha fazla ve Ryzen 5 1500X de daha iyi sonuçlar veriyor. AMD işlemci, 2,5 GHz'e düşürülmüş frekansta bile Loongson'dan 5 kat daha hızlıdır. Çinli şirketin, bu tür önemli arızalardan kaçınmak için çeşitli yazılım ürünlerinde işlemcilerine yönelik optimizasyonlar oluşturmak üzere hâlâ yapması gereken çok iş var.

Görüntü işleme

Testlerin bu bölümü bir öncekiyle kısmen örtüşüyor, ancak onu ayrı ayrı vurgulamaya karar verdik. Çeşitli görevlerde bunları işlemek, sıkıştırmak ve açmak da dahil olmak üzere yalnızca statik 2D görüntülerle çalışmaya odaklanır.

G'MIC, görüntü dönüştürme ve işleme için birçok algoritma ve işlev sunan açık kaynaklı bir dijital görüntüleme platformudur. Çoklu iş parçacığını destekler ve yükü birden fazla çekirdeğe dağıtarak hesaplamaları hızlandırmak için OpenMP'yi kullanabilir.

Test sonuçları, üç görevin her birini tamamlamak için gereken saniye cinsinden sunulur. Bellek bant genişliğinin açık bir etkisi vardır: çift kanallı mod, daha düşük frekansta bile görüntü işlemede daha iyi sonuçlar sağlar. Bu, ilk iki testteki Loongson işlemcinin 2,5 GHz'e düşürülmüş bir frekansta çalışan Ryzen 5 1500X'in sonuçlarına yaklaşmasını sağlıyor. Ancak Core i3-12100, yavaş modda bile gözle görülür derecede daha iyi performans gösteriyor. Tüm işlemcileri nominal frekanslarında karşılaştırırken, Çin işlemcisinin ilk iki testte yabancı olduğu ortaya çıktı.

İlginç bir şekilde üçüncü alt test, Ryzen işlemcinin diğer ikisine kıyasla hızda ciddi bir düşüş göstermesiyle öne çıkıyor. Loongson, eski AMD dört çekirdekli işlemciye kıyasla normal frekanslarda bile daha iyi performans gösterdi. Nominal frekanstaki testlerde Intel işlemcinin Loongson'dan daha hızlı olduğu ortaya çıktı, ancak 2,5 GHz frekansta Çin işlemcisi de onu aştı — bu da Loongson için çok iyi bir sonuç.

Bir sonraki test olan RSVG/librsvg, SVG formatındaki vektör grafiklerle çalışırken performansı değerlendirir. Karşılaştırma, vektör grafiklerini PNG formatına dönüştürmek (rasterleştirme) için gereken süreyi ölçer. Bu, pratikte çok sayıda küçük görüntüyü işlemeniz gereken modern web sitelerine göz atarken sıklıkla karşılaşılan tipik bir görevdir.

Vektör grafik rasterleştirme testinde Loongson 3A6000 işlemci, aynı 2,5 GHz frekansında Ryzen 5 1500X ile Core i3-12100 arasında yer alarak iyi sonuçlar verdi. AMD çözümünün biraz ilerisinde, Intel işlemcinin ise biraz gerisindeydi. Bununla birlikte, Batılı işlemcilerin, özellikle de 3,3 GHz Core i3'ün daha yüksek saat hızları önemli bir avantaj sağlıyor — Core i3, gerçek dünya koşullarında iki kat daha hızlı ve Ryzen 5 de Çin işlemcisinden biraz daha hızlı. Yine de Loongson için sonuç oldukça başarılı sayılabilir.

Başka bir evrensel görüntü işleme testine bakalım — RawTherapee. Adobe Lightroom ve Aperture'a benzer, ancak açık kaynak kodlu, dijital kameralardaki RAW dosyalarını kataloglamak ve işlemek için kullanılan çapraz platformlu bir uygulamadır. Bu kıyaslama, profesyonel fotoğrafçıların ortak görevi olan RAW dosyalarının işlenme ve dönüştürülme süresini ölçer.

Ne yazık ki Loongson işlemcisi, talimat mimarisi için optimizasyon eksikliği nedeniyle bu testte yine zayıf sonuçlar gösteriyor. RAW'dan RawTherapee'ye dönüşüm hızı, 2,5 GHz'e düşürülmüş bir frekansta çalışan Ryzen 5 1500X'inkinden önemli ölçüde düşüktü. Nominal frekanslarda çalışan Core i3-12100 işlemcinin Çin işlemcisinden iki kat daha hızlı olduğu ortaya çıktı. Bu, özellikle hız farkının belirgin hale geldiği çok sayıda fotoğraf işlenirken önemli bir sorun olabilir.

Görüntü sıkıştırma ve açma işlemlerini test etmeye geçelim. tjbench, modern işlemcilerdeki SIMD talimatları kullanılarak optimize edilen libjpeg-turbo kütüphanesini kullanarak JPEG sıkıştırmasını açma performansını değerlendirmek için bir kıyaslamadır. Kütüphane, Loongson'un SIMD talimatlarını destekliyor gibi görünse de, bu desteğin etkinliği hala tartışmalıdır.

Sonuçlar Çinli işlemci için yine hayal kırıklığı yaratıyor: 2,5 GHz'e kadar yavaşlayan AMD işlemcinin gerisinde kalıyor ve hatta Core i3-12100'den bile daha fazla. Ryzen 5 1500X, nominal frekansında Loongson 3A6000'den iki kat daha hızlıdır ve Intel işlemci, görevi 3,3 kat daha hızlı gerçekleştirir. Her ne kadar çok sayıda JPEG dosyasının toplu dönüştürülmesi nadir olsa da, sonuçlar Çin işlemcisinin bu görevde önemli performans sorunları sergilediğini gösteriyor; bu durum, mimarisi için yetersiz yazılım optimizasyonundan kaynaklanıyor olabilir.

Daha fazla bilgi işlem kaynağı gerektiren görüntü kodlamayı test etmeye geçelim. OpenJPEG testi, JPEG 2000'e dönüştürülmüş 717 MB'lık büyük bir panoramik TIFF dosyası kullanır. Dönüşüm süresi sonuçları milisaniye cinsinden raporlanır.

Burada Loongson 3A6000 için çok daha olumlu sonuçlar görüyoruz. Belki de yazılımın daha yeni sürümü, talimat seti için daha iyi optimize edilmiştir, bu nedenle Çin işlemcisi, 3,5 GHz nominal frekansta neredeyse Ryzen 5 1500X'i yakalıyor ve hatta onu eşit frekanslarda geçiyor. Core i3-12100 nominal modda hala daha hızlı, ancak frekansı 2,5 GHz'e düştüğünde Loongson yine daha iyi sonuçlar veriyor. Bu, Çin işlemcisinin bu testte IPC açısından eski AMD ve Intel modellerinden daha iyi performans gösterdiği anlamına geliyor ki bu beklenmedik bir durum ama gelin diğer sıkıştırma formatlarının sonuçlarına da bakalım.

Bir sonraki test, cwebp yardımcı programını kullanarak 6000x4000 piksellik bir JPEG dosyasını WebP formatına dönüştürmek için Google'ın libwebp kitaplığını kullanan görüntü sıkıştırmayla ilgilidir. Performans saniyede megapiksel cinsinden ölçülür.

Sonuçlar yine cesaret verici değil: Görünüşe göre Loongson donanım yetenekleri için yazılım optimizasyonu arzu edilenden çok uzak. Çinli işlemci bu testte zayıf sonuçlar gösteriyor. Yalnızca Core i3-12100 ve Ryzen 5 1500X'ten tam modlarında değil, aynı zamanda 2,5 GHz'e düşürüldüğünde de en iyi ihtimalle yarı yarıya geride kalıyor.

Evet, kayıpsız sıkıştırma alt testinde sonuçlar, aynı frekanstaki AMD ve Intel işlemcilerin performansına yakındır, ancak ilk iki alt testte önemli bir gecikmenin olduğu düşünülürse, bunun bir teselli olduğu düşünülemez. Nominal frekansta Ryzen 5'in Çin işlemcisinden 2,8 kat ve Core i3'ten dört kat daha hızlı olduğu ortaya çıktı. Bu, gelecekteki testlerde daha da kötüleşebilecek üzücü bir sonuçtur.

Öncekine benzer başka bir test, görüntüyü WebP2 biçimine kodlamak için Google'ın libwebp2 kitaplığını kullanır. Şu anda geliştirilmekte olan bu format, 10 bit HDR'yi, daha verimli kayıplı ve geliştirilmiş kayıpsız sıkıştırmayı ve tam çoklu iş parçacığını destekler.

Test sonuçları yine cesaret verici değil: Loongson 3A6000 işlemci nispeten düşük performans gösteriyor. Ancak buradaki gecikme biraz daha küçüktür. Nominal frekanslarda Core i3-12100 2,5-2,7 kat daha hızlıdır ve Ryzen 5 1500X iki kattan daha az hızlıdır. Bu hala önemli bir gecikme olsa da, 2,5 GHz'de Loongson eski AMD işlemcisine yaklaşıyor ve bu da arzulanan çok şey bırakıyor.

Bu bölümdeki son test, kendisini «gezegendeki en hızlı ETC kompresörü» olarak tanıtan Etcpak'tır. Bu araç, 8Kx8K doku çözünürlüğünü kullanarak ve hem tek iş parçacıklı hem de çok iş parçacıklı modları destekleyerek dokuları olabildiğince hızlı bir şekilde ETC ve S3 formatlarına sıkıştırmak için tasarlanmıştır.

Test sonuçları son derece beklenmedikti: Loongson 3A6000 işlemci çok düşük bir doku sıkıştırma hızı gösterdi; AMD ve Intel işlemcilerle karşılaştırıldığında çok daha yavaş bir seviye. Performans farkı Ryzen 5 1500X ile karşılaştırıldığında yaklaşık 13 kat, Core i3-12100 ile karşılaştırıldığında ise 22 kata kadar çıkmaktadır. Bu, Loongson'un özel bilgi işlem mimarisi için optimizasyon eksikliğini vurgulamaktadır. Bu tür optimize edilmemiş programların Çinli işlemci kullanıcıları tarafından mümkün olduğunca nadir karşılaşılacağını umuyoruz, ancak performans değerlendirilirken bu durum dikkate alınmalıdır.

Şifreleme testleri

İşlemci testinin bir sonraki önemli bölümü şifreleme görevleridir. Modern CPU'lar, büyük miktarda veriyi gerçek zamanlı olarak şifreleme yeteneğine sahiptir ve birçoğu, AES gibi en yaygın şifreleme algoritmaları için özel talimatları destekler.

Aircrack-ng, WiFi ağlarını tespit etmek, trafiği engellemek ve WEP ve WPA/WPA2 şifreleme anahtarlarının gücünü kontrol etmek için kullanılan bir dizi araçtır. Bu tür testlerde önbellek veya hızlı bellek değil, işlem çekirdeği sayısı ve mimarinin yüksek performansı önemlidir.

Loongson 3A6000'in sonuçları, işlemcinin nominal frekanslarında Ryzen 5 1500X'in üç katından fazla ve Core i3-12100'ün sekiz katından fazla gerisinde olduğunu gösteriyor. İlginç bir şekilde Intel Core i3-12100'ün Ryzen 5 1500X'ten iki kat daha hızlı olduğu ortaya çıktı. Frekans 2,5 GHz'e düşürüldüğünde bile Loongson 3A6000, yavaşlatılan Ryzen'den 2,5 kat daha yavaş kalıyor. Belki bu bölümdeki diğer testler daha çeşitli sonuçlar gösterecektir.

Bork, Java ile yazılmış bir platformlar arası dosya şifreleme aracıdır. Test, örnek bir dosyayı şifrelemek için harcanan süreyi ölçer. Bunu destekleyen CPU'larda şifrelemenin donanım hızlandırması bu durumda kullanılmıyor gibi görünüyor.

Bu testte Loongson 3A6000 daha tatmin edici sonuçlar gösterdi. Karşılaştırma muhtemelen herhangi bir mimari için mükemmel şekilde optimize edilmemiştir. Çinli işlemci, 2,5 GHz'de Core i3-12100 seviyesinde sonuçlar gösterdi ve tam frekansında Ryzen 5 1500X'ten biraz daha hızlıydı. Nominal modda Intel Core i3-12100 hala daha hızlı ancak Loongson bu testte iyi sonuçlar verdi.

Crypto++, çeşitli kripto algoritmalarıyla çalışmak üzere tasarlanmış, C++ için açık kaynaklı bir kitaplıktır. Birçok algoritmayı ve x86 işlemciler için AES-NI uzantısının kullanımını destekler. Muhtemelen Loongson için herhangi bir ek optimizasyon yapılmamıştır, bu nedenle Çinli işlemcinin geride kalanlardan biri olması muhtemeldir. Test, desteklenen tüm algoritmalar için genel sonucu kullandı.

Maalesef optimizasyon eksikliği olumsuz bir etki yarattı. Loongson 3A6000 geride kalanlar arasındaydı: Sonuçlar ilk testteki kadar kötü olmasa da Çin CPU'su 2,5 GHz'de Ryzen 5 1500X'in neredeyse yarısı kadar yavaş ve Core i3-12100'den biraz daha yavaş. Nominal modda Intel ve AMD işlemciler sırasıyla yaklaşık 2,5 ve 4 kat avantaj gösteriyor. Sonuç olarak Loongson, kriptografik testlerde yine iyi sonuçlar gösteremedi.

Geriye kalan son test, HTTPS'ye yönelik SSL/TLS uzantısıyla yaygın olarak bilinen açık kaynaklı bir şifreleme kitaplığı olan OpenSSL'yi kullanmaktır. Kütüphane çoğu karma algoritmayı, şifrelemeyi ve popüler şifreleme standartlarını destekler. Bu testte performansı iki parametre kullanarak ölçtük: Hızın saniyedeki imza sayısıyla belirtildiği RSA4096 ve MB/sn cinsinden ölçülen SHA512.

Loongson 3A6000'in bu testteki sonuçları öncekilere göre daha iyiydi. İlk alt testte Çin işlemcisi hâlâ geride kaldı ancak fark daraldı: Nominal frekanslarda Ryzen 5 1500X ve Core i3-12100'den sırasıyla 2 ve 3,8 kat daha yavaştı. Ryzen 5 frekansı 2,5 GHz'e düşürüldüğünde fark bir buçuk kata indi.

İkinci alt testte, Loongson 3A6000'in sonuçları önemli ölçüde daha iyiydi: performans, karşılaştırmalı bir IPC seviyesini gösteren 2,5 GHz'e yavaşlayan Ryzen 5 1500X ile aynı seviyedeydi. Ancak Core i3-12100, nominal moddaki iki kattan fazla farkla yine üstünlük gösterdi. Buna rağmen OpenSSL testi Çinli bir işlemci için özellikle diğer testlerle karşılaştırıldığında nispeten başarılı sayılabilir.

Sıkıştırma ve dekompresyon

Arşivlerdeki verilerin sıkıştırılması ve sıkıştırılmış dosyaların açılması, tıpkı popüler arşivleyiciler gibi çoğu kullanıcının aşina olduğu bir işlemdir. Unix/Linux sistemlerinde en yaygın olanları da dahil olmak üzere bunlardan birkaçını kullanarak test ettik.

Gzip, Unix sistemlerinde kullanılan, Deflate (LZ77 ve Huffman) algoritmalarını temel alan popüler bir kayıpsız sıkıştırma formatıdır. Test, Linux 4.13 çekirdek kaynak kodunun iki kopyasını sıkıştırmak için gereken süreyi ölçer. Sonuçlar bellek bant genişliğinin hiçbir etkisinin olmadığını gösterdi: tek kanallı ve çift kanallı modlar benzer sıkıştırma süreleri gösterdi.

Loongson 3A6000, özellikle 2,5 GHz AMD ve Intel işlemcilerle karşılaştırıldığında bu testte iyi performans gösterdi. Bu modda Çin işlemcisinin Ryzen 5 1500X'ten biraz daha hızlı ve Core i3-12100'e yakın olduğu ve iyi IPC gösterdiği ortaya çıktı. Bununla birlikte, nominal frekanslarda çalışırken rakipler Loongson'dan önemli ölçüde üstündür: Intel işlemci iki kat daha hızlıdır ve Ryzen 5 1500X, Çin CPU'sundan yalnızca% 23 daha hızlıdır. Genel olarak bakıldığında bu Loongson için iyi bir sonuç.

7-zip, verimli ve kaynak yoğun sıkıştırma yöntemiyle bilinen popüler bir arşivleyicidir. 7-zip ile yapılan testler platformlar arasıdır ve farklı işletim sistemlerindeki sonuçları karşılaştırmanıza olanak tanır. Çift kanallı DDR4 belleğin kullanılması sıkıştırma hızı üzerinde olumlu bir etkiye sahiptir, ancak bu bağımlılık sıkıştırmayı açarken daha az belirgindir.

Loongson 3A6000 işlemcisine yönelik test sonuçları oldukça dikkat çekici çıktı. Sıkıştırıldığında Loongson, tam saatte Core i3-12100'ün yarısı kadar performans gösteriyor (ve hatta 2,5 GHz'e yavaşlatıldığında bile), ancak Ryzen 5 1500X'e yaklaşıyor ve IPC açısından AMD işlemciden daha hızlı.

İlginç bir şekilde, Loongson 3A6000, kutudan çıktığı haliyle 2,5 GHz saat hızlarında AMD ve Intel'den daha iyi performans gösterdi ve bu da biraz daha yüksek bir IPC'ye işaret ediyor. Ancak normal çalışma koşullarında Core i3 ve Ryzen 5 işlemciler daha hızlı kalıyor ancak fark o kadar da büyük değil: sırasıyla yalnızca %30 ve %12.

Sıkıştırma testinde, Huffman koduna benzer şekilde LZ77 sözlük sıkıştırmasını verimli ANS entropi kodlamasıyla birleştiren Zstd (Zstandard) algoritması kullanıldı. Test için seçilen sıkıştırma düzeyi Düzey 19 Uzun'du.

Loongson 3A6000, bu formatta sıkıştırma performansı göstererek 2,5 GHz'de Core i3-12100 ile Ryzen 5 1500X arasında yer aldı ve bu da Çin işlemcisi için iyi bir IPC'ye işaret ediyor. Ancak rakiplerin çalışma frekansının daha yüksek olması nedeniyle Intel işlemcinin bir buçuk kat daha hızlı olduğu ortaya çıktı. Kutuyu açarken sonuçlar benzer: aynı frekansta Loongson, AMD ve Intel'in daha yavaş sürümleri arasında yer alıyor, ancak nominal frekanslarda AMD ve Intel işlemciler yine onun önünde — Ryzen %25 ve Core i3 yarı yarıya.

Burrows-Wheeler algoritmasını temel alan bzip2 sıkıştırma formatı, gzip ve zip ile karşılaştırıldığında daha yüksek CPU yükü ve daha yavaş hız ile verimli sıkıştırma sağlayan çok iş parçacıklı bir uygulama sağlar. Karşılaştırma, Parallel BZIP2 kullanarak FreeBSD-13.0-RELEASE-amd64-memstick.img dosyasını sıkıştırmak ve açmak için gereken süreyi ölçer.

Bu testte Loongson 3A6000'in performansı arzu edilenin çok altında kalıyor. 2,5 GHz frekansında Çin işlemcisi her iki rakibe de kaybediyor. Nominal frekans modunda Core i3-12100 dosyayı iki kattan daha hızlı sıkıştırırken Ryzen 5 1500X %50 daha hızlıdır.

Paketi açarken durum daha iyi görünüyor. Loongson 3A6000, Ryzen 5 1500X'i 2,5 GHz'de geçiyor ve nominal frekansta ona yaklaşıyor. Yavaş modda bile Intel işlemci, Çin CPU'sundan biraz daha düşüktür, ancak nominal frekansta Core i3 hızda% 64'lük bir artış sağlar. Böylece Loongson, sıkıştırmayla karşılaştırıldığında dekompresyonda gözle görülür iyileşmeler gösteriyor.

Bu bölümdeki son test, Mozilla Firefox 84.0 web tarayıcısı için kurulum dosyalarını içeren .tar.xz arşivinin paketinden çıkarılması için gereken süreyi ölçer. Bellek bant genişliğinin sonuç üzerinde küçük bir etkisi var — yaklaşık %10, bu nedenle Loongson'un çift kanal modundaki performansını rakipleriyle karşılaştırıyoruz.

Loongson 3A6000, tüm işlemciler Loongson'un nominal saati olan 2,5 GHz'de çalışırken Ryzen 5 1500X'e göre önemli ölçüde daha iyi ve Core i3-12100'e göre biraz daha iyi bir performans sergiliyor. Bu testte Çin CPU'su, daha eski olmasına rağmen hem AMD hem de Intel işlemcilere kıyasla daha iyi IPC performansı gösteriyor. İlginç bir şekilde Loongson, 3,5 GHz nominal frekansında Ryzen seviyesine ulaşıyor. Ancak Core i3-12100, daha modern mimarisi ve DDR5 bellek desteği sayesinde her iki rakibinden bir buçuk kat önde.

Derleme ve geliştirme

Bu bölüm okuyucularımız arasında en hacimli ve belki de en popüler bölüm olmasa da yine de ilgi çekicidir. Yazılım geliştiricileri sayıca az da olsa yeni çözümlere mutlaka ilgi duyacaktır. Çin Loongson işlemcisinin ve LoongArch mimarisinin kod derlemeyi, uygulama oluşturmayı ve diğer yazılım geliştirme görevlerini nasıl ele aldığına bakacağız.

Build2, C/C++ dilinde kod oluşturmaya yönelik platformlar arası bir araç setidir. Bu bölümdeki ilk test, Build2'nin kurulum süresini kaynak koddan ölçer. İlginçtir ki, bellek bant genişliğinin sonuçlar üzerinde hiçbir etkisi olmadı ve çift kanallı DDR4 bellek herhangi bir gelişme sağlamadı.

Ne yazık ki Loongson 3A6000 henüz yüksek sonuçlara sahip olamıyor. Rakiplerin frekansı 2,5 GHz'e düştüğünde bile Çin CPU'su her iki rakibe de kaybediyor. Loongson'un IPC'si açıkça daha düşüktür. Nominal modlarda çalışırken Core i3-12100 ve Ryzen 5 1500X işlemciler gözle görülür bir avantaj sergiliyor: Intel iki kattan daha hızlı ve AMD, Çin CPU'sundan neredeyse bir buçuk kat daha hızlı.

PyBench, Python kullanarak, DahiliFunctionCalls ve NestedForLoops gibi çeşitli işlevlerin yürütme süresini ölçerek genel sistem performansını değerlendiren bir kıyaslamadır. Genel sonuç, Python'un platformdaki ortalama performansını belirlemeye yardımcı olur.

Bu testte Loongson 3A6000, önceki testlere kıyasla daha iyi sonuçlar veriyor, ancak bu da çekincesiz değil. Hız açısından 2,5 GHz'e yavaşlatılmış Ryzen 5 1500X ile aynı seviyede, bu da zaten oldukça modası geçmiş olan Zen 1 mimarisiyle karşılaştırılabilirliği gösteriyor. Daha modern Core i3-12100, 2,5 GHz frekansında bile Loongson'un önemli ölçüde önünde,% 77 oranında kazanıyor ve nominal modda fark üç katına ulaşıyor. Aynı zamanda AMD işlemci Loongson'a göre %40 daha hızlıdır.

Bu kısa bölüm iki derleme zamanı testiyle bitiyor: C++ doğrusal cebir kütüphanesi Eigen ve Erlang programlama dilinden örnekler için. Testler, belirtilen projelerin derleme süresini saniye cinsinden ölçer ve bellek bant genişliğinin bir miktar etkisi olsa da, bu küçük bir etkidir ve göz ardı edilebilir.

Her iki tasarımın da derleme hızı, Ryzen 5 1500X'in 2,5 GHz'e yavaşlatılmış Loongson işlemcisiyle kıyaslanabilir düzeyde, bu da Çinli mühendislerin Zen 1 mimarisi seviyesine ulaştığını gösteriyor. zaten modası geçmiş durumda ve hatta AMD işlemcinin önemli ölçüde daha yüksek bir frekansta çalışmasına izin vererek onu %25 — %30 daha hızlı hale getiriyor. Core i3-12100 ise nominal modda 1,9-2,4 kat daha hızlı ve 2,5 GHz'de %20-%50 daha hızlı olmasıyla önemli bir üstünlük sergiliyor. Bu, Çinli işlemcinin henüz mevcut performans seviyelerini yakalayamadığını vurguluyor.

Yüksek Performanslı Bilgi İşlem

Testin bu bölümü gerçekten birçok soruyu gündeme getiriyor. Bir yandan, yüksek performanslı bilgi işlem işlemcilerden önemli talepler getirirken diğer yandan herhangi birinin bu tür görevler için giriş seviyesi bir işlemci kullanması pek olası değildir. Ancak Loongson 3A6000 kıyaslama sonuçları, aynı mimariyi temel alan ve daha fazla çekirdeğe sahip sunucu CPU'larının performansı hakkında fikir verebilir. Yalnızca belirli bir masaüstü işlemcinin yeteneklerini değil aynı zamanda LoongArch bilgi işlem mimarisinin potansiyelini bir bütün olarak değerlendiriyoruz.

Bu bölümdeki ilk kıyaslama olan Cebirsel Çoklu Izgara (AMG), yapısal olmayan ızgaralar üzerindeki doğrusal sistemler için paralel cebirsel çok ızgaralı çözücünün performansını değerlendirir. Test sonucu, daha yüksek bir değerin daha iyi performans anlamına geldiği nihai hesaplama hızını gösterir. Beklendiği gibi, sonuçlar bellek bant genişliğine bağlı; bellek frekansının azalmasına rağmen çift kanallı mod açıkça kazanıyor.

Ne yazık ki, çift kanal modunu kullanırken bile Loongson 3A6000, 2,5 GHz'e yavaşlatılmış Ryzen 5 1500X'in yarıdan fazla hızında performans gösteriyor. Bu testteki Çin işlemcisinin IPC göstergesi arzulanan çok şey bırakıyor. 3,5 GHz hızında Ryzen 5 ve Core i3-12100 benzer sonuçlar gösteriyor, bu da bu testteki performansın büyük ölçüde bellek işlemeye bağlı olduğunu gösteriyor. Bu açıdan Intel işlemci Loongson'dan üç kat daha hızlıdır.

Yüksek Performanslı Eşlenik Gradyan (HPCG) testi, Gauss-Seidel önkoşullayıcı ile eşlenik gradyan yöntemini kullanarak yüksek boyutlu seyrek kare matrisli bir doğrusal cebirsel denklemler sistemini çözer. Algoritma, çok çekirdekli CPU'ları destekleyen MPI ve OpenMP kullanılarak uygulanır.

Bellek bant genişliğinin etkisi de burada fark ediliyor ve çift kanal modu, sistem hızında önemli bir artış sağlıyor. AMD ve Intel işlemcilerin farklı saat hızlarındaki performansı birbirine yakın kalıyor ve bu da bellek bant genişliğinin önemini vurguluyor. Bu testte Loongson 3A6000, Ryzen 5 1500X'in performansından 3,3 kat, Core i3-12100'den ise dört kat daha düşük sonuçlar ortaya koyuyor.

Daha az zorlu testlerde Loongson daha iyi performans gösterebilir. Himeno kriteri, Jacobian yöntemini kullanan Poisson basınç denklemi için doğrusal bir çözücüdür ve megaflop cinsinden performansı ölçer. Bellek bant genişliğinin net bir etkisi olsa da belirleyici faktör değildir ve AMD ve Intel işlemcilerin farklı frekanslardaki sonuçları önemli ölçüde farklılık gösterir.

Bu testte Loongson 3A6000, Ryzen 5 1500X ile neredeyse aynı sonuçları gösterdi, hatta 2,5 GHz hızında çalışırken onu geride bıraktı. Bu, Çin mimarisinin Zen 1'e kıyasla görevleri iyi bir şekilde yerine getirebildiğini gösteriyor. Bununla birlikte, DDR5 bellek kullanan daha yeni Core i3-12100 ile karşılaştırıldığında, Çin işlemcisi önemli ölçüde daha yavaştır ve nominal frekansta çalışan rakibinin yarısından daha hızlıdır. .

Mocassin testi (İyonlaşmış Bulutsuların Monte Carlo Simülasyonları), Monte Carlo yöntemini kullanarak iyonize bulutsuları simüle eder ve iki seçenek içerir; biri daha karmaşık, diğeri daha basit. Çözüm süresi saniye cinsinden ölçülür ve bellek bant genişliğinin etkisi mevcuttur ancak önceki testlerdeki kadar önemli değildir.

Loongson 3A6000 bu testte mükemmel sonuçlar verdi. Testin daha karmaşık bir versiyonunda (ilki), Çin işlemcisinin 3,5 GHz hızında çalışan Ryzen 5 1500X'ten daha hızlı olduğu ve ikinci versiyonda (daha az karmaşık) 2,5 GHz hızında Ryzen 5 1500X'in önünde olduğu ortaya çıktı. GHz. Bu, Zen 1 mimarisine kıyasla Loongson için iyi bir IPC göstergesine işaret ediyor. Üstelik Dust2D alt testinde 2,5 GHz'de Core i3-12100'ün Loongson 3A6000'den biraz daha yavaş olduğu ortaya çıktı ve bu da Çin işlemcisi için iyi bir IPC göstergesi olduğunu gösteriyor… Bununla birlikte, 3,3 GHz'lik doğal frekansında çalışırken Core i3-12100, ikinci alt testte iki kat performans sergileyerek Loongson'dan önemli ölçüde daha iyi performans gösteriyor.

NASA tarafından yüksek performanslı bilgisayar sistemlerini değerlendirmek için geliştirilen bir test olan NAS Paralel Karşılaştırmaları (NPB), değişen karmaşıklık ve boyutta görevleri içerir. Önerilen seçeneklerden ikisini inceledik ve sonuçlar saniyede milyonlarca işlem olarak ifade edildi. Bellek bant genişliğinin açık bir etkisi yalnızca ilk alt testte gözlemlenmiştir.

3D Fourier dönüşümü (3D FFT) varyantında Loongson 3A6000, Çin mimarisi için yetersiz optimizasyona işaret eden çok zayıf bir performans gösterdi. Bu testte kendi doğal frekanslarında Ryzen 5 1500X'ten dört kat, Core i3-12100'den ise altı kat daha yavaştı. Ancak ikinci testte Çin işlemcisi daha iyi performans gösterdi ve 2,5 GHz'de neredeyse Ryzen 5 seviyesinde hızlar gösterdi. Bu, Loongson'un Zen 1'e kıyasla iyi bir IPC'ye sahip olduğunu gösteriyor, ancak yalnızca bu durumda. Bu testte Core i3-12100'ün azaltılmış frekansta bir buçuk kat, nominal frekansında ise 2,6 kat daha hızlı olduğu ortaya çıktı.

Parboil, OpenMP, OpenCL ve CUDA'yı destekleyen, bilgi işlem mimarilerinin performansını değerlendirmek için Illinois Üniversitesi'nden bir kıyaslama paketidir. Bu durumda dört alt testi çalıştırmak için OpenMP'yi kullandık. Sonuçlar, görevlerin tamamlanması için geçen süreye göre ölçülür.

Bellek bant genişliği tüm alt testleri etkilemez, ancak son ikisinde önemli bir etkisi vardır — çift kanallı bellek modu Loongson'un performansını önemli ölçüde artırır. Ancak bu, AMD ve Intel'in rakipleriyle karşılaştırmak için yeterli değil: çoğu testte Loongson 3A6000, Ryzen 5 1500X ve Core i3-12100'den 2,5-3 kat daha düşük performans gösteriyor. Bu işlemcilerin frekansını 2,5 GHz'e düşürmek bile performanslarını Çin CPU'sunun hızına yaklaştırmıyor.

Bununla birlikte, ikinci alt test olan MRI Gridding'de Loongson, 3,3 GHz'lik tam çalışma frekansında Core i3-12100'den daha hızlıydı ve nominal frekansında Ryzen 5 1500X'in neredeyse iki katı kadar hızlıydı. Bunun nedeni, testi Loongson'da çalıştırmanın özelliklerinden kaynaklanıyor olabilir, ancak aynı zamanda bu algoritmanın özellikle Çin işlemcisi için iyi optimize edilmiş olduğu da ortaya çıkabilir.

Rodinia, CUDA, OpenMP ve OpenCL kullanarak hesaplama hızlandırmaya yönelik bir kıyaslama paketidir. Bu durumda GPU hızlandırma özelliği olmadığından yalnızca OpenMP'yi kullandık. Dört alt testin sonuçları saniye cinsinden yürütme süresiyle ölçülür; daha küçük zamanlar daha iyi performans anlamına gelir. Bellek bant genişliği ilk iki alt testteki performansı etkiler.

Core i3-12100 ve Ryzen 5 1500X ile karşılaştırıldığında Loongson 3A6000 işlemci aşağıdaki sonuçları gösteriyor: birinci ve ikinci alt testlerde Çin CPU'sunun 2,5 GHz'de Ryzen'den biraz daha hızlı olduğu ancak Core'dan önemli ölçüde daha düşük olduğu ortaya çıktı. i3 tam çalışma frekansında iki kattan fazla arttı. Bu, iyi IPC performansına rağmen Loongson'un rekabetçi olmak için yeterli frekansa sahip olmadığını gösteriyor.

Üçüncü alt testte Loongson, tam frekansta Core i3-12100'den 5 kat, nominal frekansta ise Ryzen 5 1500X'ten 3 kat daha yavaştı. Son alt testte ise fark sırasıyla 11 ve 6 kata çıktı. Bu önemli gecikme, yeni LoongArch mimarisi için yazılım optimizasyonunda ciddi sorunlara işaret ediyor.

Moleküler dinamik

Bu testler aynı zamanda önceki bölümde tartıştığımız (bazı CFD'ler dahil) yüksek performanslı bilgi işlem için de geçerlidir. Ancak sayıları önemli olduğundan bunları ayrı bir alt bölüme ayırmaya karar verdik.

CloverLeaf, çok iş parçacıklı işlemciler için Lagrange-Eulerian yöntemini ve OpenMP'yi kullanan bir akışkanlar dinamiği testidir. Clover_bm'nin temel hesaplamasını test ettik ve test yürütme süresi saniye cinsinden çıktı olarak verildi. Bellek bant genişliğinin sonuçlar üzerinde önemli bir etkisi vardır ve ikinci bir DDR4 çubuğunun eklenmesi, optimal bellek denetleyicisinden daha az olmasına rağmen Loongson'un performansını önemli ölçüde artırdı.

Loongson 3A6000'in hikayesi devam ediyor: Hesaplama açısından karmaşık görevlerde Çin işlemcisi en iyi sonuçları göstermiyor; bunun nedeni, yazılımın mimarisi için yetersiz optimizasyonudur. Sonuç olarak Loongson'un Ryzen 5 1500X'ten %75 daha yavaş olduğu, 2,5 GHz'e yavaşladığı ve tam hızlı AMD'nin iki kat daha hızlı olduğu ortaya çıktı. Core i3-12100, Çin işlemcisinden 3,3 kat daha iyi performans gösteriyor.

Dolfyn, demo programlarının yürütme süresini ölçen bir hesaplamalı akışkanlar dinamiği (CFD) simülasyon testidir. Bellek bant genişliğinin etkisi burada ihmal edilebilir düzeydedir ancak işlemci frekansının sonuçlar üzerinde gözle görülür bir etkisi vardır.

Loongson 3A6000 bu testte oldukça iyi bir performans sergiliyor: 2,5 GHz'de Ryzen 5 1500X ile aynı performansı gösteriyor ve IPC puanları Zen 1 ile karşılaştırılabilir. Ancak maksimum frekans hala bir rol oynuyor ve nominal modda Ryzen %40 daha hızlı. Core i3-12100 ise tam saatte Loongson 3A6000'den 2,3 kat daha hızlıdır ve bu da Çin işlemcisinin performansının iyileştirilmesi ihtiyacını vurgulamaktadır.

Büyük Ölçekli Atomik/Moleküler Devasa Paralel Simülatör (LAMMPS), karmaşık hesaplamalar için kullanılan bir moleküler dinamik paketidir. Testlerde MPI arayüzü kullanıldı ve testlerimiz için Rodopsin Protein modeli seçildi. Bellek bant genişliğinin bu kıyaslamadaki etkisi ihmal edilebilir düzeydedir.

Loongson 3A6000 bu testte oldukça iyi sonuçlar vererek Ryzen 5 1500X'i eşit frekanslarda geride bırakarak 2,5 GHz hızında Core i3-12100'e neredeyse yetişti. Bu, eski nesil AMD ve Intel işlemcilerle karşılaştırmamıza rağmen, Çin işlemcisinin iyi bir IPC göstergesine işaret ediyor. Tam hızlı Ryzen 5 1500X ile bile Loongson 3A6000 neredeyse aynı seviyede ancak Core i3-12100, daha yüksek frekansı nedeniyle Çin işlemcisinden iki kat daha hızlı, hala önemli ölçüde önde.

Livermore Yapılandırılmamış Lagrange Açık Şok Hidrodinamiği (LULESH), Sedov problemini çözmeye yönelik bir 3 boyutlu yapılandırılmamış Lagrangian hidrodinamiği simülasyonudur. Bu testte bellek bant genişliğinin performans üzerindeki etkisi minimum düzeydedir ve göz ardı edilebilir.

Loongson 3A6000 işlemci yine nispeten iyi sonuçlar verdi, 2,5 GHz'de Ryzen 5 1500X'in biraz ilerisinde, ancak aynı modda% 37 daha hızlı olan Core i3-12100'den daha düşük. Loongson'un ana sorunu yetersiz çalışma frekansıdır, çünkü Ryzen ve Core i3 tam frekansta sırasıyla %25 ve 2,2 kat çok daha hızlıdır. Daha yeni olan ve DDR5 belleği destekleyen Core i3-12100 işlemci, hem Ryzen hem de Loongson'un ciddi anlamda önünde yer alıyor. Ancak IPC açısından Çinli işlemci oldukça iyi sonuçlar gösteriyor.

Pennant, yapılandırılmamış ağlarda akışkan dinamiğinin 2 boyutlu olarak hesaplanmasına yönelik bir uygulamadır. Sonuçları saniye cinsinden ifade edilen iki alt test içerir. Bu testte, bellek bant genişliğinin performans üzerinde gözle görülür bir etkisi vardır; çift kanallı mod, her iki alt testte de sonuçları gözle görülür şekilde iyileştirir.

Ancak bu gelişmeyle bile Loongson 3A6000, 2,5 GHz'e yavaşlayan Ryzen 5 1500X'in performans seviyesine ulaşamadı — Çin işlemcisi her zaman geride kaldı. Tam hızlı Ryzen ve Core i3-12100 çeşitleri, Loongson'un sonuçlarını sırasıyla 1,5 ve 2-3 kat aşan bir performans gösterdi. Loongson bir kez daha bu testte geride kalanlar arasında yer aldı ve bunun optimizasyon eksikliğinden mi yoksa diğer mimari sorunlardan mı kaynaklandığını söylemek zor.

Incompact3d bölümündeki son kıyaslamaya bakalım. Bu, sıkıştırılamaz akışkanlar için Navier-Stokes denklemlerini çözmeye yönelik yüksek performanslı bir Fortran-MPI kodudur. Yön başına 129 hücreden oluşan bir taban çizgisi kullandık ve sonuçlar, hesaplamak için geçen saniyeler içinde sunuldu. Bellek bant genişliğinin buradaki etkisi önemlidir ve çift kanallı bellek modu, daha düşük frekanslarda bile gözle görülür bir iyileşme gösterir.

Maalesef Loongson 3A6000 bu testte pek iyi performans göstermedi. Core i3-12100'ün tam hızlı versiyonunun yarısından fazla yavaş olduğu ve nominal frekansında Ryzen 5 1500X'ten %30'dan fazla daha düşük olduğu ortaya çıktı. Aynı zamanda 3A6000'in 2,5 GHz'de Ryzen 5'ten yalnızca %17 daha yavaş olduğu ortaya çıktı, bu da nispeten iyi bir IPC performansına işaret ediyor. Ancak Zen 1 işlemcilerin yedi yıl önce ortaya çıktığını ve yakında beşinci neslin tanıtılacağını da hesaba katmak gerekiyor — Çinli mühendislerin mevcut standartları yakalamak için yapacak çok işi var.

Makine öğrenimi

Makine öğreniminde kaynak yoğun hesaplamaların mevcut konusunu göz ardı edemezdik. Bu tür görevler için genellikle daha verimli GPU'ların kullanılmasına rağmen, bu bölümde ilginç olan iki test olacak. Ancak genel amaçlı CPU'lar da bu alanda kullanım alanı bulmaktadır.

NumPy (Sayısal Python), Python dili için çok boyutlu diziler ve bunlarla çalışmak için üst düzey matematiksel işlevler için destek sağlayan açık kaynaklı bir kütüphanedir.

Loongson 3A6000'i NumPy kullanarak test etmenin sonuçları pek cesaret verici değil: Çin işlemcisi 2,5 GHz'e düşürülmüş frekansta Ryzen 5 1500X'e bile yenildi. Fark kritik olmasa da dikkat çekicidir. Tam hızlı Ryzen 5, Loongson'dan 1,7 kat daha hızlıdır ve 3,3 GHz'deki Core i3-12100 neredeyse üç kat daha hızlıdır. Böylece Intel işlemci, AMD ve Loongson'a kıyasla matris hesaplamalarında gözle görülür bir avantaj ortaya koyuyor.

TNN, Tencent'in mobil cihazlardan güçlü GPU sunucularına kadar iyi ölçeklenebilen, yüksek performanslı, açık kaynaklı, platformlar arası bir derin öğrenme çerçevesidir. Test için mevcut dört modelden yalnızca ikisini kullandık.

Loongson bu testte oldukça iyi bir performans sergileyerek Ryzen 5 1500X'in 2,5 GHz'lik azaltılmış frekanstaki performansına yaklaştı. Bu, saat döngüsü başına yürütülen talimat sayısı açısından Çin işlemcisinin Zen 1'e yakın olduğunu gösterir. Bununla birlikte, Core i3-12100, diğer testlerde olduğu gibi, hem nominal frekansta hem de Loongson'dan önemli ölçüde öndedir. Çin işlemci seviyesine indirildiğinde. Ancak Intel'in 2,5 kat gerisinde kalması diğer testlerdeki sonuçlara göre çok ciddi görünmüyor.

Enerji tüketimi

Loongson 3A6000'in güç tüketiminin bu bağlamda değerlendirilmesi daha çok bilgi amaçlıdır, çünkü bu, yüksek düzeyde tüketime sahip üst düzey bir işlemci değildir. Testlerde kullanılan 3A6000-HV modelinin belirtilen pik güç tüketimi 80 W'tır ancak pratikte bu değerlere ulaşılamamıştır.

Üst düzey Intel ve AMD modelleri için, hız aşırtma ve nominal güç tüketimini geçici olarak aşan çalışma voltajı teknolojileri nedeniyle TDP değerleri genellikle gerçek en yüksek güç tüketiminden daha düşüktür. Loongson 3A6000 gibi basit işlemcilerde genellikle TDP değerine ulaşılamaz ve büyük ölçüde frekans özelliklerine, sıcaklık özelliklerine ve diğer parametrelere bağlıdır. Anakart üreticileri performansı artırmak için güç ve voltaj sınırlarını da artırabilir.

Loongson 3A6000'in pratik testleri, frekansının sürekli olarak beyan edilen parametrelere karşılık geldiğini, herhangi bir yük altında 2,5 GHz'i ne aştığını ne de altına düştüğünü gösterdi. Bu, tek iş parçacıklı modda daha yüksek frekanslara ulaşabilen ve tüm çekirdekler tam yük altındayken frekansı düşürebilen modern AMD ve Intel işlemcilerin tersidir. Loongson'a göre durum daha basit ve daha öngörülebilir.

Sistemlerin güç tüketimini bu işlemcilerle üç senaryoda karşılaştırdık: Boştayken, yüksek tanımlı videolar izlerken ve matematiksel hesaplamalar için yoğun kaynak kullanan uygulamaları çalıştırırken maksimum tüketim modunda. Video testi için hem video kartını hem de merkezi işlemciyi yükleyebilen, H.264 formatında 1920x1080 piksel çözünürlüklü video içeren yerleşik bir medya oynatıcı kullandık. Desteklenen iki işletim sistemi arasında güç tüketimi açısından farklılıklar olduğunu, dolayısıyla verilerin her iki işletim sistemi için de gösterildiğini lütfen unutmayın.

Ryzen 5 1500X'in entegre grafik çekirdeği olmaması ve harici grafik kartı kullanılmasının genel sistem tüketiminde önemli bir artışa neden olması nedeniyle güç tüketimi karşılaştırmaları yalnızca Loongson ve Core i3-12100 tabanlı sistemler arasında yapılmaktadır.

Boştayken, Loongson destekli bir bilgisayar, Intel tabanlı bir sistemden biraz daha az enerji tüketir, ancak aradaki fark önemli değildir. Bu, Çin işlemcisinin en ekonomik modda iyi verimliliğini gösterir. Maksimum tüketim modunda, bilimsel hesaplamayı çalıştırırken, iki Linux sistemi arasındaki sonuçlar UOS'un enerji açısından biraz daha verimli olduğunu gösterdi. Loongson tabanlı sistem için 74-77 W'lık nihai tüketim, Intel işlemcili bir PC için 86 W'tan önemli ölçüde daha düşüktü, ancak Intel gözle görülür derecede daha iyi performans sağlıyor.

Video izleme modu en büyük ilgiyi uyandırdı. Loongson işlemcisine yönelik donanım desteğindeki farklılıklar nedeniyle, UOS sistemi önemli ölçüde daha iyi video kod çözme performansı gösterdi — unutmayın, işletim sistemiyle önceden yüklenmiş medya oynatıcıyı ek yazılım olmadan kullandık. Loongnix sisteminde kod çözmenin çoğu, işlemcinin işlem çekirdeklerini yükleyerek yazılımda gerçekleştirilirken, UOS'taki oynatıcı, video verilerini işlemek için özel bloklar kullanır. Sonuç olarak Loongnix tabanlı sistem 64 W'a kadar enerji tüketirken, UOS yalnızca 46 W, Core i3-12100 sistemi ise 60 W tüketiyordu. Bu, yüksek enerji verimliliği elde etmek için Çin işlemcisinin yüksek kaliteli yazılım desteğine ihtiyacı olduğunu gösteriyor.

Genel olarak Loongson 3A6000 işlemci, Core i3-12100'den biraz daha az güç tüketiyor. Bununla birlikte, Intel işlemci genellikle önemli ölçüde daha yüksek performans sağlar — genellikle 1,5-2 kat veya daha fazla. Dolayısıyla Loongson 3A6000 özellikle enerji açısından verimli değildir. Belki Core i3-10100 ile karşılaştırıldığında Çin işlemcisi benzer bir performansla biraz daha düşük güç tüketimi gösterebilir, ancak fark pek önemli olmayacaktır.

Sıcaklık rejimine gelince, basit ve minimalist soğutmalı bir sistemden ciddi bir ısınma beklememelisiniz. Uygulamada, Loongson 3A6000 işlemci, yerleşik sensör ve izleme sistemine göre 60 dereceden fazla ısınmadı. Bu sıcaklık seviyesi endişe edilecek bir durum değildir; aşırı ısınma yalnızca soğutma sistemi olmadığında meydana gelebilir. Standart bir hava soğutucu bile Loongson 3A6000'i soğutma konusunda oldukça yeteneklidir.

Sonuçlar

Test sonuçlarına göre Çinli Loongson şirketinin oldukça iyi bir işlemci yaratarak önemli bir iş çıkardığını söyleyebiliriz. Loongson 3A6000 mükemmel bir ürün olmamasına ve modern AMD ve Intel işlemcilerin seviyesine ulaşamamasına rağmen Çinli mühendisler önemli ilerlemeler kaydetmeyi başardılar. Örneğin 3A6000'in dallanma tahmincisi Zen 2 seviyesinde, SMT'nin eş zamanlı çoklu iş parçacığı teknolojisi de bu seviyeye yakın. DDR4 bellek denetleyicisi önceki 3A5000 modeline göre geliştirilmiş olsa da DDR5'i destekleyen AMD ve Intel çözümlerinden hala uzak. Bu iyileştirmeler önemli performans kazanımları sağlıyor ve 3A6000'deki LA664 çekirdeği, 2,5 GHz'de Ryzen 5 1500X ile karşılaştırılabilir sonuçlar sağlıyor.

Ancak hâlâ yapılması gereken işler var ve gelecekte donanım ve yazılımda daha fazla iyileştirme bekleyebiliriz. Loongson 3A6000, Çin'in Batı mikroelektroniğine olan bağımlılığını azaltması için önemli bir adımdır. Tarama ve ofis uygulamaları gibi çoğu temel görev için 3A6000'in performansı yeterlidir. Asıl sorun, özellikle LoongArch mimarisi için optimize edilmemiş yazılımlar için, yazılım desteğiyle ilgili sorunlar olmaya devam ediyor.

Loongson 3A6000 bazı kıyaslamalarda iyi performans gösterse de modern AMD ve Intel işlemcilerin yanı sıra Ryzen 5 1500X gibi eski işlemcilerin bile gerisinde kalıyor. En yeni nesil işlemcilerle karşılaştırıldığında hem performansta hem de enerji verimliliğinde önemli bir gecikme olduğu görülüyor. Çin işlemcisindeki SIMD talimat setlerini her zaman etkili bir şekilde kullanmayan yazılımlarda da sorunlar ortaya çıkıyor ve bu da gerçek dünyadaki görevlerdeki performansı olumsuz etkileyebiliyor.

Ek olarak, Loongson 3A6000 olağanüstü bir güç verimliliğine sahip değildir ve güç tüketimi Core i3-10100 ve diğer rakiplerle karşılaştırılabilir düzeydedir. Çinli şirketin IPC'yi iyileştirme ve frekansları artırma potansiyeli olsa da modern Batılı işlemcilerin seviyesine ulaşmak için hâlâ yapacak çok işleri var. Bu sadece gelişmiş mimariyi değil, aynı zamanda gelişmiş üretim teknolojilerini de gerektirecektir.

3A6000 için kullanılan mevcut 12nm işlem teknolojisi, işlemcinin yeteneklerini sınırlıyor, ancak AMD ve Intel'in mevcut çözümleri bile ideal değil. Loongson küresel pazarda önemli bir oyuncu olmak istiyorsa Intel ve AMD gibi önde gelen üreticilerle rekabet edebilmek için yapacak çok işi var. Çinli şirketlerin ABD yaptırımları nedeniyle yarı iletken üretiminde kısıtlamalarla karşı karşıya kaldıklarını ve yerli üretim yeteneklerine uyum sağlamaları gerektiğini belirtmek önemlidir. Bu onların ilerlemesini yavaşlatabilir ancak mevcut ortamda neler başarabileceklerine olan ilgi hala yüksek.

Slayt yalnızca daha yüksek sayıda çekirdek ve iş parçacığına sahip sunucu işlemcilerini değil aynı zamanda artan frekanslara sahip yeni çekirdeklere ve güncellenmiş entegre video çekirdeklerine dayanan masaüstü bilgisayarlara yönelik gelecekteki modelleri de gösterir. İlginç olan, Çinli Loongson şirketinin bu yıl 7 nm süreç teknolojisine geçmeyi planlaması. Gelecek yıla kadar yeni ürünlerin gelmesi pek mümkün olmasa da 7nm'ye geçiş, mevcut modellere göre %20-30'luk bir performans artışı sağlayabilir.

ABD yaptırımları nedeniyle işlemci üretimi yalnızca Çin'deki SMIC fabrikasında mümkün oluyor ve bu da TSMC'ye göre üretkenliği ve verimliliği sınırlıyor. Ancak 7nm'ye geçiş, mevcut 12nm sürecinden önemli bir adım olacak ve Çin yarı iletken endüstrisi için ileri bir başarıyı temsil edecek.

Eğer sonraki Loongson modelleri gerçekten de 7nm sürecini kullanırsa, daha yüksek saat hızlarına ve tek kalıpta daha fazla çekirdeğe olanak tanıyacak ve bu da bu işlemcilerin rekabet gücünü büyük ölçüde artıracak. Loongson 3A6000 halihazırda pek çok göreve uygun olsa da şirketin, daha modern modellerin yanı sıra 2-3 yıl önce geçerli olan AMD ve Intel işlemcilerin seviyesine ulaşmak için hâlâ yapması gereken çok iş var.

Loongson 3A6000, Çinli üreticinin potansiyelini gösteriyor ve ilerlemenin devam etmesi ve Çinli işleyicilerin rekabetçi bir ortamda gelişmesi önemli. Bu, Loongson için yalnızca büyük bir Çin pazarı açmakla kalmayacak, aynı zamanda Rusya da dahil olmak üzere uluslararası pazarlara girme fırsatı da yaratabilecek.

Bunun Loongson 3A6000 işlemci ve ona dayalı sistemler hakkındaki materyalin yalnızca ilk kısmı olduğunu hatırlatmak isteriz. İkinci yazımızda Çin işlemci tabanlı, kendi mimarisine sahip bir bilgisayarın pratik kullanımına bakacağız. Hem bitmiş bir PNXC bilgisayarı hem de Asus anakartı üzerine kurulmuş bir bilgisayarı test edeceğiz. Ayrıca Loongson için mevcut işletim sistemlerini tartışacağız ve x86 uyumlu işlemcilere ve Windows işletim sistemine dayalı bilgisayarlara alışkın olan kullanıcılar için bu işlemcileri kullanmanın karmaşıklıklarını ve olası dezavantajlarını ayrıntılı olarak inceleyeceğiz.