<bgdev />free

| |  


All tags 2023 9may ai algorithm alpha amd american api argon2 arm asm asmbb assembler attachment awareness balgaria bay888 bcrypt bender beta bgdev-next bgdev-next.👍 big.data bitchnigga bitcoin bmw boi borg brexit bug bulgaria business c cad chat cloud computer-names console crossorigin deprivation desktop dna dotnet email eupl falling feature forum foundation fp fresh fun game github goats google gpl gpt gpt.3.5 gypsies happiness harvard hash improvement include investment it java javascript js kleta kleta.maqka.balg lambi language learning leftovers legend level levenshtein.dist libx license linkedlist linux ma mcafee mele microsoft minimag minimalism negro net nginx nigga not.a.bug oop paradigm parler patterns perception persuasion pipe play.station politics populi pornhub pow pro programming protonmail python reba rust sci-fi scripting seks seo server shell sleep smartbeauty soft-skills sqlite srabska sse starship sugerface syntax tablet tailwindcss telegram theme thug troll80lvl tutanota typescript uacme ui uk unix untermensch upload uptime usa utilities ux vb via viber virtual.reality vox vps vulnerable war wasm weapons-grade web windows word x86 xbox xss youtube zig ziglang Übermensch БОКЕБЪЛГАРИН БЪ БЪлгария Белезниците Били Били.Белезниците БялДонор Веган Виста Възраждане ГЛУПАК Гана Глиста ЕС Казарма Копейкин Мода.и.овча.мисъ НЕКАДЪРНИК НРБ ПО-ЗЛЕ.И.ОТ.РАБИ Подкасти Разни Румен СИК СКУМ СетенЧук Скум ТИР Туче Украйна Урсула Яначков авангард аз айфонджия алгоритми амбиции анархизъм антиваксъри армения аудио аутисти бази.данни бакъп без без.пръчове безпросвета бенчмарк биготи биомаса бира боклук борисов ботев брадва булшит бъг бъгове бял ваксина вандал век венерика викинги вицове вишу война вървежен гана ганорник гей гейщина германия герои гешев глупак говеда групировка гюбек данъкоплатец двойни.стандарти дедотия демокрация дизайн дисциплина добитък докери долар донори држава дришльо дрон ебане еврогейски.съюз езици експеримент електроника електроника.s2 емиграция ендпойнт енум ерген ергономия жалкар задача затоплизъм защита здраве златен злато игри идеали идиократ идиократи идиокрация идиот избори избори.рабин изкуство икономика имбецили имейл инвестиране инокулация инструмента интервю ипад искам.да.си.реда казах камшикодържач капитализъм карабах караница картечница кино клавиатура ковид19 колайдер колям.кур комари комплексар комунизъм консолидация конспирации космонавтика кофа кофит-19 краставица криптовалути курви кучелюбци лайно лаладжия лаптоп либерастия литература лоши.практики луд лъжеучени лъжец любов майни майтапи малоумници мафия мениджмънт месо местене метавселена метафизика механика мистика мисъл мода мода.овча.мисъл модерация морал мутра мутри наука национализъм не.it негър некадърник некадърници неон нидерландия овча овчи олигофрени организация офтопик парички партия педал пенджури пенсия пишока плюскане победа погромист поезия политика порно посредствен почивка празници прасе превод предалщина програмиране проект проста простотии против.правилата проф пръч пръч.дришльо пръчка психика психични.болести психология пустиняк путин путката путьо рабин рабин.е.шибан.пе работа радост разврат разни разработка расизъм резерват рейтинг реклама рекламен религия рест ризи ропче ропчета русия руски.език рутина самоковска сасипаха секира село селяндур сериали сериозно.програм сетен сеянин симулация скопяване скръм слушалки сортиране софия софтуер софтуни социализъм спектрометър спринтове сране стандарти стил стуйо стюи сушилня сцена съвет съм сън сървър сърничка таб ташаци телевизия тема територията терминология термояд технологии титли традиция тролинг тръмп туба туче тъпак тъпанари тъпня уиндоус украйна умнокрасивци фалит фантастика фашизъм фейк.акаунти физика филми форум форумни.проекти футбол хазарт хамали харабия хардуер хахаха хомофобия хостинг храна хумор цайко цайси целофан цензура цензурра циганин чалга чалгар чекии чернокраки честота чипове чнг чужбина чук шпация щайга юан яката яко ям 🔨 😂 🪓


Задача НЕ за интервю

  

0 1 2 3 4 ...12 13 14 15 16 ...26 27 28 29 30 31 32 33 34 35 36


  ФейкПрофил  Създадено на 01.10.2020, видяно: 1563 пъти. #13379

Абе това trie колко памет харчи ? Аз се заиграх, но ми заема 2ГБ :(



  |  Създадено на 01.10.2020, видяно: 1561 пъти. #13380
johnfound
|
johnfound

А сега малко зарибявка. rofl Последни резултати на Pentium N3540:

0: Dist: 4, Time: 751 ms
1: Dist: 4, Time: 700 ms
2: Dist: 4, Time: 723 ms
3: Dist: 4, Time: 23 ms
4: Dist: 40, Time: 753 ms
5: Dist: 4, Time: 404 ms
6: Dist: 9, Time: 654 ms
7: Dist: 6, Time: 755 ms
8: Dist: 4, Time: 226 ms
9: Dist: 6, Time: 686 ms

Това според мене е по-бързо от варианта с trie на числотрошачката на Пайпа.

Напомням, че това е процесор с пасивно охлаждане на нетбук Acer.

Дали мога да бия и GPU-то? rofl

Nice. Ако си спомням правилно средното време с GPU-то беше някъде около 60 ms обаче.

Е, на твоята числотрошачка и моята програма ще е по-бърза. А пък на моето "GPU", времето сигурно няма да е 60ms (ако въобще тръгне).

Пък и това, мисля, не е тавана. Имам още някой и друг фокус в ръкава. ;-)

Освен това твоят код (предполагам) не е многонишков.



  johnfound  Създадено на 01.10.2020, видяно: 1550 пъти. #13385
|

Освен това твоят код (предполагам) не е многонишков.

Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.



  |  Създадено на 01.10.2020, видяно: 1547 пъти. #13386
johnfound
|

Освен това твоят код (предполагам) не е многонишков.

Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.

Казвам, че не е многонишков в момента, и ако се пусне на всички ядра, това ще увеличи производителността му. Защото кода на GPU-то се изпълнява на много нишки и затова е толкова бърз.



  synergie  Създадено на 01.10.2020, видяно: 1542 пъти. #13387

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?



  johnfound  Последно редактирано на 01.10.2020 от johnfound, видяно: 1535 пъти. #13388

OK, за съжаление имам някакви технически проблеми и затова не мога да синхронизирам репозиторитата по мобилната мрежа.

Така че, сорса ще го атачна тука, а в репозиторито - довечера.

А също, атачвам и текущата компилирана версия.

Времената, последно са (на Pentium N3540):

0: Dist: 4, Time: 562 ms
1: Dist: 4, Time: 526 ms
2: Dist: 4, Time: 544 ms
3: Dist: 4, Time: 20 ms
4: Dist: 40, Time: 561 ms
5: Dist: 4, Time: 306 ms
6: Dist: 9, Time: 476 ms
7: Dist: 6, Time: 564 ms
8: Dist: 4, Time: 172 ms
9: Dist: 6, Time: 504 ms

Както се вижда, малко по-добри са от анонсираните.

Attached files:
FileSizeUploadedDownloadsMD5 hash
Levenshtein.asm9423 bytes01.10.20201674ab00f4ed720a49db984d9efc151e37b
mmxLeven.tar.gz3802604 bytes01.10.2020148d4519e210b3efb2581318706ab9570cb


  johnfound  Създадено на 01.10.2020, видяно: 1531 пъти. #13389
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...



  gat3way  Създадено на 01.10.2020, видяно: 1527 пъти. #13392

Дойде ли време да оптимизираме гпу кода или още не е бито ? :)



  |  Създадено на 01.10.2020, видяно: 1522 пъти. #13394
johnfound
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...

Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.



  johnfound  Създадено на 01.10.2020, видяно: 1518 пъти. #13395
|
johnfound
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...

Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.

Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.



  |  Създадено на 01.10.2020, видяно: 1517 пъти. #13396
gat3way

Дойде ли време да оптимизираме гпу кода или още не е бито ? :)

Ако предположим, че кода на Джон скалира линейно на 128-ядрения Epyc би трябвало да бие GPU-то. Пък и на 48-ядрения Интел Зион.



  |  Създадено на 01.10.2020, видяно: 1512 пъти. #13397
johnfound

Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.

Пропуснал съм го. Ако успея да се свържа със сървъра ще пробвам.



  johnfound  Последно редактирано на 01.10.2020 от johnfound, видяно: 1490 пъти. #13432

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

На Pentium N3540:

0: Dist: 4, Time: 341 ms
1: Dist: 4, Time: 320 ms
2: Dist: 4, Time: 332 ms
3: Dist: 4, Time: 11 ms
4: Dist: 40, Time: 339 ms
5: Dist: 4, Time: 187 ms
6: Dist: 9, Time: 289 ms
7: Dist: 6, Time: 342 ms
8: Dist: 4, Time: 105 ms
9: Dist: 6, Time: 308 ms

Средното време е 226ms на стринг.



  ФейкПрофил  Последно редактирано на 01.10.2020 от ФейкПрофил, видяно: 1482 пъти. #13436

Аз съм в шок. Верно ще излезе, че на ръка се пишат по-бързи програми



  |  Създадено на 01.10.2020, видяно: 1478 пъти. #13438
johnfound

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

Хмм, нещо не е наред. Това е с кода ти от вчера:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 7, Time: 7602 ms, Index: 97865
1: Dist: 7, Time: 6479 ms, Index: 90390
2: Dist: 7, Time: 6635 ms, Index: 91065
3: Dist: 7, Time: 3736 ms, Index: 1720
4: Dist: 45, Time: 6723 ms, Index: 34233
5: Dist: 7, Time: 5246 ms, Index: 49718
6: Dist: 12, Time: 5567 ms, Index: 52634
7: Dist: 8, Time: 6299 ms, Index: 80663
8: Dist: 7, Time: 4567 ms, Index: 26926
9: Dist: 8, Time: 5616 ms, Index: 60852
10: Dist: 63, Time: 7345 ms, Index: 58761


  |  Създадено на 01.10.2020, видяно: 1474 пъти. #13439
johnfound

Хм, всички са в шок и не пишат. rofl

С кода който пусна тази сутрин (мое време) е наред:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 4, Time: 1150 ms
1: Dist: 4, Time: 897 ms
2: Dist: 4, Time: 608 ms
3: Dist: 4, Time: 19 ms
4: Dist: 40, Time: 607 ms
5: Dist: 4, Time: 330 ms
6: Dist: 9, Time: 515 ms
7: Dist: 6, Time: 610 ms
8: Dist: 4, Time: 185 ms
9: Dist: 6, Time: 545 ms
10: Dist: 58, Time: 665 ms


  johnfound  Създадено на 01.10.2020, видяно: 1473 пъти. #13440
|
johnfound

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

Хмм, нещо не е наред. Това е с кода ти от вчера:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 7, Time: 7602 ms, Index: 97865
1: Dist: 7, Time: 6479 ms, Index: 90390
2: Dist: 7, Time: 6635 ms, Index: 91065
3: Dist: 7, Time: 3736 ms, Index: 1720
4: Dist: 45, Time: 6723 ms, Index: 34233
5: Dist: 7, Time: 5246 ms, Index: 49718
6: Dist: 12, Time: 5567 ms, Index: 52634
7: Dist: 8, Time: 6299 ms, Index: 80663
8: Dist: 7, Time: 4567 ms, Index: 26926
9: Dist: 8, Time: 5616 ms, Index: 60852
10: Dist: 63, Time: 7345 ms, Index: 58761

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.



  |  Създадено на 01.10.2020, видяно: 1470 пъти. #13441
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.



  johnfound  Създадено на 01.10.2020, видяно: 1467 пъти. #13442
|
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.

Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.



  |  Създадено на 01.10.2020, видяно: 1464 пъти. #13443
johnfound
|
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.

Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.

Само съм махнал реда с лоудъра.

Attached files:
FileSizeUploadedDownloadsMD5 hash
Levenshtein.asm.save10739 bytes01.10.2020133cda744cab8b8755834e9ff1458d3dc6d

0 1 2 3 4 ...12 13 14 15 16 ...26 27 28 29 30 31 32 33 34 35 36


Задача НЕ за интервю

  



AsmBB v3.0 (check-in: 7544654b24928b93); SQLite v3.47.0 (check-in: 03a9703e27c44437);
©2016..2024 John Found; Licensed under EUPL; Powered by Assembly language Created with Fresh IDE