Potrebujem GPU pre stabilnú difúziu? Sprievodca PC, stabilné difúzne referenčné hodnoty: Ktorý GPU prevádzkuje AI najrýchlejšie (aktualizované) | Hardvér Toma
Stabilné difúzne referenčné hodnoty: Ktorý GPU beží AI najrýchlejšie (aktualizované)
Za chvíľu sa dostaneme k niektorým ďalším teoretickým výpočtovým výkonnostným číslom, ale opäť zvážte príklad RTX 2080 Ti a RTX 3070 TI. Tenzorové jadrá 2080 Ti nepodporujú riedkosť a majú až 108 tflopov výpočtov FP16. RTX 3070 TI podporuje riedkosť so 174 TFLOPS FP16 alebo 87 TFLOPS FP16 bez riedkosti. . Rovnaká logika platí pre ďalšie porovnania, ako napríklad 2060 a 3050 alebo 2070 Super a 3060 Ti.
Potrebujem GPU pre stabilnú difúziu?
Zaujíma vás, či potrebujete GPU pre stabilnú difúziu? Prišli ste na správne miesto.
Stabilná difúzia je nepochybne rýchly a intuitívny nástroj na generovanie AI ako Dall-e a Midjourney. Jeho výsledky sú pôsobivé, takže práve teraz má milióny používateľov. . Keď už hovoríme o tom, budeme hovoriť o tom, či stabilná difúzia môže fungovať bez GPU, alebo či budete stále potrebovať grafickú kartu na správne fungovanie.
GPU alebo grafické karty, sú malé kúsky techniky, ktoré vážne upgradujú akékoľvek herné alebo kreatívne profesionálne skúsenosti. Sú nevyhnutné na vytvorenie AI generovaného umenia na komerčnejšej alebo profesionálnejšej úrovni.
Esential AI Tools
. . .
Zažite úplnú silu generátora obsahu AI, ktorý poskytuje výsledky prémií v sekundách. . Prihláste sa na bezplatnú skúšobnú verziu. Čítaj viac
.00015 za slovo!
Detektor Winston AI
Winston AI: Najdôveryhodnejší detektor AI. . Čítaj viac
Iba 0 dolárov.01 na 100 slov
Originalita.AI je najpresnejšia detekcia AI.V rámci testovacieho súboru údajov 1200 vzoriek údajov dosiahol presnosť 96%, zatiaľ čo jeho najbližší konkurent dosiahol iba 35%. Užitočné rozšírenie Chrome. Zistenie naprieč e -mailmi, dokumentmi Google a webovými stránkami. Čítaj viac
. Sprievodca PC je podporovaný na čítačke. .
Potrebujete teda grafickú kartu zo stabilnej difúzie, aby fungovala? ? .
Je GPU potrebný na stabilnú difúziu?
Áno, pre stabilnú difúziu bude fungovať hladko bez akýchkoľvek problémov, musíte mať na počítači GPU. Na minimum sa pozrite na modely Nvidia 8-10 GB NVIDIA. Okrem toho sa uistite, že máte v systéme PC RAM 16 GB, aby ste sa vyhli akejkoľvek nestabilite.
. . Pokiaľ ide o použitie GPU, navrhujeme modely NVIDIA RTX 4080 a 4090 so 16 alebo 24 GB VRAM pre najlepšie výsledky. .
Je možné spustiť stabilnú difúziu na GPU AMD?
Áno, môžete spustiť stabilnú difúziu aj na GPU AMD, okrem modelov NVIDIA Series Models. Ak však chcete použiť AMD, uistite sa, že máte model nad RX470. Okrem toho, aby ste dosiahli najlepšie výsledky, nezabudnite mať ďalších 8 GB alebo viac, aby ste sa vyhli akejkoľvek nepríjemnostiach.
Časté otázky
Môže stabilný difúzny fungovať na procesoroch Apple Mac?
Áno, stabilná difúzia podporuje knihy Apple Mac. Podporuje však iba najnovšie modely M1 a M1 založené na kremíku. Akýkoľvek model predtým nie je pre najlepšie výsledky. Dokonca aj starší model M1 a M2 bude v poriadku, ak splní požiadavky.
Mať GPU je v dnešnom technologickom svete povinnou požiadavkou. Pokúste sa mať najnovší a najrýchlejší model pre GPU alebo iné grafické podpory. . Aj keď existuje niekoľko spôsobov, ako ho spustiť bez GPU, nie sú také spoľahlivé, ako sa môžu zdať. .
. Zlepšujú desaťnásobné hry a tvorivé zážitky. .
Stabilné difúzne referenčné hodnoty: Ktorý GPU beží AI najrýchlejšie (aktualizované)

Umelá inteligencia a hlboké učenie sú v súčasnosti neustále v titulkoch, či už ide o chatgpt generovanie zlá rada, autá s vlastným riadením, umelci obvinení z používania AI, lekárskej rady od AI a ďalších. Väčšina z týchto nástrojov sa spolieha na komplexné servery s množstvom hardvéru na výcvik, ale pomocou vyškolenej siete je možné vykonať inferenciu na vašom počítači pomocou svojej grafickej karty. ?
Poskytli sme sa stabilnú difúziu, populárny tvorca AI obrazu, na najnovších NVIDIA, AMD a dokonca Intel GPU, aby ste videli, ako sa stohujú. Ak ste sa náhodou pokúsili získať stabilnú difúziu v prevádzke na svojom vlastnom počítači, môžete mať nejaké tušenie z toho, aké zložité – alebo jednoduché! . Krátke zhrnutie je, že GPU NVIDIA vládnu Roost, pričom väčšina softvéru je navrhnutá pomocou CUDA a iných nástrojov NVIDIA Tools. .
Nakoniec sme použili tri rôzne stabilné difúzne projekty pre naše testovanie, hlavne preto, že na každom GPU nepracoval žiadny balík. . .Verzia AI’s Shark – skontrolovali sme výkon na GPU NVIDIA (v režimoch Vulkan aj Cuda) a zistili sme, že to bolo. nedostatočný. Spustenie GPU spoločnosti Intel bolo o niečo zložitejšie kvôli nedostatku podpory, ale stabilná difúzia Openvin nám dala nejaké veľmi základná funkčnosť.
Zrieknutie sa zodpovednosti sú v poriadku. Nesmerovali sme žiadne z týchto nástrojov, ale hľadali sme veci, ktoré sa dali ľahko spustiť (pod oknami), ktoré sa tiež zdali byť primerane optimalizované. . Výsledky RTX 40-rady boli medzitým spočiatku nižšie, ale George Sv8arj poskytol túto opravu, kde nahradenie Pytorch Cuda DLLS poskytlo zdravé zvýšenie výkonu.
Výsledky AMD sú tiež trochu zmiešané vrecko: RDNA 3 GPU fungujú veľmi dobre, zatiaľ čo GPU RDNA 2 sa zdajú byť priemerné. Kývnutie.Ai Dajte nám vedieť, že stále pracujú na „vyladených“ modeloch pre RDNA 2, čo by malo trochu zvýšiť výkon (potenciálne dvojnásobok), keď budú k dispozícii. Nakoniec, na GPU spoločnosti Intel, aj keď sa zdá, že konečný výkon sa slušne spája s možnosťami AMD, v praxi je čas na vykreslenie podstatne dlhší – trvá 5–10 sekúnd, kým sa úloha skutočnej generácie začne a pravdepodobne veľa Deje sa ďalšie veci na pozadí, ktoré ich spomaľujú.
Používame tiež rôzne stabilné difúzne modely kvôli výberu softvérových projektov. Kývnutie.Verzia žralokov AI používa SD2.1, zatiaľ čo automatické 1111 a Openvin používajú SD1.4 (aj keď je možné povoliť SD2.. .
Naše testovacie parametre sú rovnaké pre všetky GPU, aj keď neexistuje žiadna možnosť pre negatívnu výzvu vo verzii Intel (aspoň nie, že by sme mohli nájsť). , . . Všimnite si, že nastavenia, ktoré sme si vybrali, boli vybrané na prácu na všetkých troch projektoch SD; Niektoré možnosti, ktoré dokážu zlepšiť priepustnosť, sú k dispozícii iba na zostavení Automatic 1111, ale viac na tom neskôr.
POPAPOCALyptické mesto Steampunk, prieskum, filmové, realistické, hyper podrobné, fotorealistické maximálne detaily, volumetrické svetlo, (((zaostrenie))), široký uhlík, ((((jasne osvetlené))), (((vegetácia))), blesk , vinič, ničenie, devastácia, wartorn, zrúcaniny
Negatívna výzva:
100
Usmernenie bez klasifikátora:
15.0
Algoritmus vzorkovania:
. Automatic 1111 poskytuje najviac možností, zatiaľ čo zostavenie Intel OpenVino vám nedáva na výber.
Tu sú výsledky z nášho testovania série AMD RX 7000/6000, série NVIDIA RTX 40/30 a GPU série Intel Arc A. .
Ako sa očakávalo, GPU NVIDIA poskytuje vynikajúci výkon – niekedy aj masívnymi maržami – v porovnaní s čímkoľvek od AMD alebo Intel. . Generovanie každého obrázka trvá niečo viac ako tri sekundy a dokonca aj RTX 4070 TI dokáže vkročiť okolo 3090 Ti (ale nie, ak zakážete Xformers).
Veci spadnú celkom konzistentným spôsobom z najlepších kariet pre GPU NVIDIA, od 3090 až po 3050. . 7900 kariet vyzerajú celkom dobre, zatiaľ čo každá karta série RTX 30 končí porazením dielov AMD 6000-série (zatiaľ). . .
Správna optimalizácia by mohla zdvojnásobiť výkon na kartách série RX 6000. Kývnutie.AI hovorí, že v nasledujúcich dňoch by mala mať modely pre RDNA 2, kedy by celkové postavenie malo začať lepšie korelovať s teoretickým výkonom. .AI, urobili sme tiež testovanie niektorých GPU NVIDIA pomocou tohto projektu a pomocou modelov Vulkan boli karty NVIDIA podstatne pomalšie ako pri zostavovaní automatickej 1111 (15 (15.52 IT/S na 4090, 13.31 na 4080, 11..76 na 3090 – nemohli sme otestovať ostatné karty, pretože ich je potrebné povoliť najskôr).
Na základe výkonu 7900 kariet pomocou vyladených modelov sme tiež zvedaví na karty NVIDIA a koľko sú schopní mať úžitok z ich tenzorových jadier. .7 -násobok výkonu, aj keď zľavujeme nedostatok. V praxi je momentálne 4090 iba asi o 50% rýchlejšie ako XTX s verziami, ktoré sme použili (a to klesne na 13%, ak vynecháme výsledok nižšej presnosti Xformers). Rovnaká logika sa vzťahuje aj na oblúkové karty spoločnosti Intel.
. Máme podozrenie, že súčasný projekt stabilného difúzie OpenVino, ktorý sme použili, tiež ponecháva veľa priestoru na zlepšenie. ..
Celkovo sú potom pomocou zadaných verzií karty NVIDIA RTX 40 najrýchlejšou voľbou, po ktorej nasledujú karty 7900 a potom GPU série RTX 30 GPU. RX 6000-Series Modorodí a GPU ARC vyzerajú všeobecne chudobne. Veci by sa mohli radikálne meniť pomocou aktualizovaného softvéru a vzhľadom na popularitu AI očakávame, že je len otázkou času, kým uvidíme lepšie ladenie (alebo nájdeme ten správny projekt, ktorý je už naladený tak, aby poskytoval lepší výkon).
. . Ale výsledky sú tu celkom zaujímavé.
Po prvé, RTX 2080 Ti končí prekonaním RTX 3070 Ti. . A čo je dôležitejšie, tieto čísla naznačujú, že optimalizácie „Sparsity“ spoločnosti Nvidia v architektúre Ampere sa vôbec nepoužívajú – alebo možno jednoducho nie sú použiteľné.
Za chvíľu sa dostaneme k niektorým ďalším teoretickým výpočtovým výkonnostným číslom, ale opäť zvážte príklad RTX 2080 Ti a RTX 3070 TI. Tenzorové jadrá 2080 Ti nepodporujú riedkosť a majú až 108 tflopov výpočtov FP16. RTX 3070 TI podporuje riedkosť so 174 TFLOPS FP16 alebo 87 TFLOPS FP16 bez riedkosti. Skutočnosť, že 2080 TI porazí 3070 Ti, jasne naznačuje, že riedkosť nie je faktorom. Rovnaká logika platí pre ďalšie porovnania, ako napríklad 2060 a 3050 alebo 2070 Super a 3060 Ti.
. 5700 XT pristane tesne pred 6650 XT, ale 5700 pristane pod 6600. Na papieri by karta XT mala byť rýchlejšia až 22%. . .
. . .
Opäť nie je jasné, ako je optimalizovaný niektorý z týchto projektov. . Preto sme si mysleli, že by bolo zaujímavé pozrieť sa na maximálny teoretický výkon (TFLOPS) z rôznych GPU. . Výsledky spoločnosti NVIDIA zahŕňajú aj nedostatok – v podstate schopnosť preskočiť násobenie o 0 až polovicu buniek v matrici, čo je údajne dosť častý výskyt s pracovnými zaťažením hlbokého učenia.
Tieto tenzorové jadrá na Nvidia jasne zabalia úder (sivé/čierne tyče sú bez riedkosti) a naše stabilné difúzne testovanie sa nezhoduje presne s týmito číslami – dokonca ani blízko. Napríklad na papieri je RTX 4090 (s použitím FP16) až o 106% rýchlejšie ako RTX 3090 Ti, zatiaľ čo v našich testoch to bolo o 43% rýchlejšie bez Xformers a 50% rýchlejšie s Xformermi. .
. . . Najrýchlejší A770 GPU pristátí medzi RX 6600 a RX 6600 XT, A750 padá hneď za RX 6600 a A380 je asi jedna štvrtá rýchlosť A750. .
Vnútorné pomery na oblúku však vyzerajú správne. Teoretický výpočtový výkon na A380 je asi štvrtý A750, a to je miesto, kde práve teraz pristane, pokiaľ ide o stabilný difúzny výkon. .
Ďalšou vecou, ktorú si treba všimnúť, je, že teoretické výpočet na AMD RX 7900 XTX/XT sa v porovnaní so sériou RX 6000 vylepšil veľa v porovnaní so sériou RX 6000. Budeme musieť zistiť, či vyladené modely série 6000 zatvárajú medzery, ako NOD.AI uviedla, že očakáva približne 2x zlepšenie výkonnosti na RDNA 2. Šírka pásma pamäte nebola kritickým faktorom, aspoň pre cieľové rozlíšenie 512×512, ktoré sme použili – modely 3080 10 GB a 12 GB pristávajú relatívne blízko seba.
Tu je iný pohľad na teoretický výkon FP16, tentokrát sa zameriava iba na to, čo môžu rôzne GPU robiť pomocou shader Complations. . AMD a Intel GPU naopak majú dvojitý výkon pri výpočtoch shaderov FP16 v porovnaní s FP32.
Je zrejmé, že tento druhý pohľad na výpočet FP16 nezodpovedá nášmu skutočnému výkonu o nič lepší ako graf s tenzorovými a maticovými jadrami, ale možno existuje ďalšia zložitosť pri nastavovaní výpočtov matíc, a tak si vyžaduje úplný výkon. niečo navyše. Čo nás privádza k poslednému grafu.
Tento posledný graf ukazuje výsledky nášho testovania s vyšším rozlíšením. Netestovali sme nové GPU AMD, pretože sme museli používať Linux na kartách AMD RX 6000 a zrejme séria RX 7000 potrebuje novšie jadro Linuxu a nemohli sme ho dostať do práce. .
RTX 4090 je teraz o 72% rýchlejší ako 3090 Ti bez Xformers a neuveriteľných o 134% rýchlejšie s Xformermi. . .
Vyzerá to, že zložitejšie cieľové rozlíšenie 2048×1152 začína lepšie využívať potenciálne výpočtové zdroje, a možno dlhšie časy behu znamenajú, že tenzorové jadrá môžu úplne ohnúť svoj sval.
V konečnom dôsledku je to prinajlepšom snímka v čase stabilného difúzneho výkonu. . Uvidíme o revízii tejto témy viac v nasledujúcom roku, dúfajme, že s lepším optimalizovaným kódom pre všetky rôzne GPU.
Zostaňte na špičke
Pripojte sa k odborníkom, ktorí čítajú Tomov hardvér pre Inside Track On Enthusiast PC Tech News – a majú viac ako 25 rokov. Pošleme najnovšie správy a hĺbkové recenzie CPU, GPU, AI, Hardvéru výrobcu a viac priamo do vašej doručenej pošty.
Odoslaním svojich informácií súhlasíte s zmluvnými podmienkami a zásadami ochrany osobných údajov a vo veku 16 rokov alebo viac.

Jarred Walton je hlavným redaktorom spoločnosti Tom’s Hardware, ktorý sa zameriava na všetko GPU. Od roku 2004 pracuje ako technologický novinár a píše pre AnandTech, Maximal PC a PC Gamer. Od prvých „3d spomaľovači“ S3 až po dnešný GPU, Jarred drží krok so všetkými najnovšími grafickými trendmi a je to ten, kto sa pýta na výkon hry.
