<bgdev />free

Вход Регистрация

Лаптоп за Deep Learning и Large Language модели
0

0 1 2 3 4 ...25 26 27 28 29 ...51 52 53 54 55

#157591 (ツ) waldorf
Създадено на 18.11.2025 , видяно: 432 пъти.
|

Засега са по двойки, защото ме мързи да гледам дали switch-a, който имаме поддържа ROCE или само Infiniband.

Аааа - те служебни :-D

Точно си помислих, че си бръкнал в джобите за 4 броя по 3к ...

#157592 (ツ) |
Последно редактирано на 18.11.2025 от |, видяно: 428 пъти.
waldorf

Аааа - те служебни :-D

Точно си помислих, че си бръкнал в джобите за 4 броя по 3к ...

Разбира се, че са служебни. Нали затова ми плащат, да харча служебни пари. :)

На предишната работа беше още по-добре, защото бяха пари на данъкоплатците. Там щях да купя не 4, а 64. :)

#157593 (ツ) BIGBUGEX
Последно редактирано на 18.11.2025 от BIGBUGEX, видяно: 423 пъти.

Добре добре. Всички се уредихме с нов хардуер. Междувременно писах на тия от интел че така не може да продължава и да се вземат в ръце. Да видим какво ще пишат...

#157601 (ツ) |
Създадено на 19.11.2025 , видяно: 388 пъти.
waldorf

А честито! Те не се ли връзват по две само? Или може и 4-те да се надушат по мрежата?

На теория мога да ги вържа и в пръстен, понеже са с по два порта, но не знам дали nccl ще хареса такава топология. IP раутинга се прави лесно, но не знам какво става като се използва RDMA.

#157614 (ツ) waldorf
Създадено на 19.11.2025 , видяно: 360 пъти.
|

На теория мога да ги вържа и в пръстен, понеже са с по два порта, но не знам дали nccl ще хареса такава топология. IP раутинга се прави лесно, но не знам какво става като се използва RDMA.

Е те ако са с по два порта може и някакъв daisy chain да им направиш? Освен това, мисля, че имаха и бърз усб порт с който също може да си комуникират?

Аз си мислех, че имат само по един читав порт и с едно кабелче връзваш две и толкова, а то имало как и за по харна топология.

#157616 (ツ) |
Последно редактирано на 19.11.2025 от |, видяно: 344 пъти.
waldorf

Е те ако са с по два порта може и някакъв daisy chain да им направиш? Освен това, мисля, че имаха и бърз усб порт с който също може да си комуникират?

Аз си мислех, че имат само по един читав порт и с едно кабелче връзваш две и толкова, а то имало как и за по харна топология.

Ами с два порта четири компютъра може само пръстен май. Иначе USB-то няма как да е достатъчно бързо, че да си струва да се връзва с такова.

#157660 (ツ) waldorf
Създадено на 20.11.2025 , видяно: 299 пъти.
|

Ами с два порта четири компютъра може само пръстен май. Иначе USB-то няма как да е достатъчно бързо, че да си струва да се връзва с такова.

Thunderbolt 5 е 80гбита. Не е чак толкова бавно. Е, не е Connect X na 200 ама за бюджетно решение става :)

Ще тестваш ли как се държи клъстър Спаркове сравнен с наточено мак студио или ртх 6000 про?

#157672 (ツ) |
Създадено на 20.11.2025 , видяно: 292 пъти.
waldorf

Thunderbolt 5 е 80гбита. Не е чак толкова бавно. Е, не е Connect X na 200 ама за бюджетно решение става :)

Ще тестваш ли как се държи клъстър Спаркове сравнен с наточено мак студио или ртх 6000 про?

Sparka няма Thunderbolt. Иначе за Макове определено има смисъл.

Мислех, че някой вече е правил сравнение. Аз още не съм се забавлявал с тях, дори не съм мерил скоростта на мрежата да видя дали съм използвал правилните кабели.

#157695 (ツ) |
Създадено на 20.11.2025 , видяно: 271 пъти.

Хмм, кабелите ми не са свестни, 4GB/s с единия вид и 11 GB/s с другия. Трябва да купя нови кабели.

#157711 (ツ) waldorf
Последно редактирано на 22.11.2025 от waldorf, видяно: 232 пъти.
|

Sparka няма Thunderbolt. Иначе за Макове определено има смисъл.

Мислех, че някой вече е правил сравнение. Аз още не съм се забавлявал с тях, дори не съм мерил скоростта на мрежата да видя дали съм използвал правилните кабели.

Не съм намирал читаво. То не е и лесно да се сравняват защото са доста различни като параметри и съответно силата им е в различни посоки и не, че няма припокриване ама разликите май са повече. Мака е с 512гб - няма друга система с толкова много памет достъпна за гпу на тази цена (или поне аз не знам). РТХ 6000 про е само с 96 ама пък там ГПУ-то и скоростта към паметта са много по бързи. Спарка като, че ли се пада някъде по средата. То е интересно и да се съпостави производителност спрямо цена?

#157843 (ツ) |
Последно редактирано на 25.11.25 17:07 от |, видяно: 125 пъти.

Понеже Спарковете имат по два ROCE порта, свързах три директно спарк1порт0<->спарк2порт0, спарк1порт1<->спарк3порт0, спарк2порт1<->спарк3порт1.

Така без суитч ще могат да се пускат модели, които се събират в 384 GB памет.

Засега са с 100 Gbps кабели докато пристигнат 200 Gbps.

Тази седмица не знам дали ще мога да се забавлявам много с тях (Ден на благодарността и т.н.), но може би другата ще си поиграя по-сериозно.

#157844 (ツ) waldorf
Последно редактирано на 25.11.25 17:13 от waldorf, видяно: 117 пъти.

Ако им направиш daisy chain или както там се казваше дали няма да успееш да ги нанижеш и четирите на 100/200ГБита?

#157845 (ツ) |
Последно редактирано на 25.11.25 17:33 от |, видяно: 111 пъти.
waldorf

Ако им направиш daisy chain или както там се казваше дали няма да успееш да ги нанижеш и четирите на 100/200ГБита?

Daisy chain не работи с RDMA, защото картите не могат да работят като суитчове и просто да препращат пакетите нататък. Трябва дирекна връзка.

На теория може да се направи нещо по въпроса (all reduce така или иначе върти данните в пръстен), но трябва да се променят nccl или gloo или каквото друго използват моделите.

#157846 (ツ) waldorf
Създадено на 25.11.25 17:56 , видяно: 105 пъти.

Е то това да са в една мрежа не е ли някакъв bridge с който да ги навържеш двата интерфейса? Е, няма да е толкова бързо като с истински суич ама все пак може и да може да го излъжеш. Друг е въпроса дали си струва де. 100 или 200гб ако трябва да се рутират с процесора може и да не е опция.

#157848 (ツ) |
Създадено на 25.11.25 19:41 , видяно: 95 пъти.
waldorf

Е то това да са в една мрежа не е ли някакъв bridge с който да ги навържеш двата интерфейса? Е, няма да е толкова бързо като с истински суич ама все пак може и да може да го излъжеш. Друг е въпроса дали си струва де. 100 или 200гб ако трябва да се рутират с процесора може и да не е опция.

"Лъгането" включва да не се използва RDMA, а всичко да минава през IP. Според мен не си струва.

#157851 (ツ) waldorf
Последно редактирано на 25.11.25 22:22 от waldorf, видяно: 81 пъти.

Ако знаеш само колко от евтините домашни рутерченца работят точно така. Един окастрен линукс, 4 порта, вифи модем, бавно мипс ядро. Ама те повечето са за 100/1000 мбита и при тях става. А за 100-200 гбита едва ли си струва да товариш процесора с рутиране на ИП пакети. Интересно дали нВидия не са вкарали някакъв хардуер който да си менка директно пакети между двата порта. Тогава може и да има някакъв шанс. То ще се чуе де, като почнат повече хора да ги ръчкат и да изцеждат максимума от машината.

#157854 (ツ) |
Създадено на 26.11.25 00:02 , видяно: 65 пъти.
waldorf

Ако знаеш само колко от евтините домашни рутерченца работят точно така. Един окастрен линукс, 4 порта, вифи модем, бавно мипс ядро. Ама те повечето са за 100/1000 мбита и при тях става. А за 100-200 гбита едва ли си струва да товариш процесора с рутиране на ИП пакети. Интересно дали нВидия не са вкарали някакъв хардуер който да си менка директно пакети между двата порта. Тогава може и да има някакъв шанс. То ще се чуе де, като почнат повече хора да ги ръчкат и да изцеждат максимума от машината.

Проблема с Layer 3 routing при Спарка е не толкова товаренето на процесора, а че използва поне 2 пъти повече memory bandwidth. Като се има предвид, че скоростта на паметта е ахилесовата пета на Спарка, това изобщо не изглежда добра идея.

Съмнявам се, че има хардуер за пренасяне на пакети от единия порт на другия, това не е толкова лесно колкото звучи. Най-малкото хедърите трябва да се пренапишат.

#157859 (ツ) BIGBUGEX
Създадено на 13:42 , видяно: 34 пъти.

Абе чува се нещо че гугъл вземат размерите на нвидия с някъв нов аи чип.

0 1 2 3 4 ...25 26 27 28 29 ...51 52 53 54 55

Лаптоп за Deep Learning и Large Language модели
0

AsmBB v3.0 (check-in: 7544654b24928b93); SQLite v3.47.0 (check-in: 03a9703e27c44437);
©2016..2024 John Found; Licensed under EUPL. Powered by Assembly language Created with Fresh IDE