<bgdev />free

Вход Регистрация

Задача НЕ за интервю
7

0 1 2 3 4 ....12 13 14 15 16 ....26 27 28 29 30 31 32 33 34 35 36
#13379 (ツ) ФейкПрофил
Създадено на 01.10.2020, видяно: 1353 пъти.

Абе това trie колко памет харчи ? Аз се заиграх, но ми заема 2ГБ :(

#13380 (ツ) |
Създадено на 01.10.2020, видяно: 1351 пъти.
johnfound
|
johnfound

А сега малко зарибявка. rofl Последни резултати на Pentium N3540:

0: Dist: 4, Time: 751 ms
1: Dist: 4, Time: 700 ms
2: Dist: 4, Time: 723 ms
3: Dist: 4, Time: 23 ms
4: Dist: 40, Time: 753 ms
5: Dist: 4, Time: 404 ms
6: Dist: 9, Time: 654 ms
7: Dist: 6, Time: 755 ms
8: Dist: 4, Time: 226 ms
9: Dist: 6, Time: 686 ms

Това според мене е по-бързо от варианта с trie на числотрошачката на Пайпа.

Напомням, че това е процесор с пасивно охлаждане на нетбук Acer.

Дали мога да бия и GPU-то? rofl

Nice. Ако си спомням правилно средното време с GPU-то беше някъде около 60 ms обаче.

Е, на твоята числотрошачка и моята програма ще е по-бърза. А пък на моето "GPU", времето сигурно няма да е 60ms (ако въобще тръгне).

Пък и това, мисля, не е тавана. Имам още някой и друг фокус в ръкава. ;-)

Освен това твоят код (предполагам) не е многонишков.

#13385 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1340 пъти.
|

Освен това твоят код (предполагам) не е многонишков.

Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.

#13386 (ツ) |
Създадено на 01.10.2020, видяно: 1337 пъти.
johnfound
|

Освен това твоят код (предполагам) не е многонишков.

Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.

Казвам, че не е многонишков в момента, и ако се пусне на всички ядра, това ще увеличи производителността му. Защото кода на GPU-то се изпълнява на много нишки и затова е толкова бърз.

#13387 (ツ) synergie
Създадено на 01.10.2020, видяно: 1332 пъти.

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

#13388 (ツ) johnfound
Последно редактирано на 01.10.2020 от johnfound, видяно: 1325 пъти.

OK, за съжаление имам някакви технически проблеми и затова не мога да синхронизирам репозиторитата по мобилната мрежа.

Така че, сорса ще го атачна тука, а в репозиторито - довечера.

А също, атачвам и текущата компилирана версия.

Времената, последно са (на Pentium N3540):

0: Dist: 4, Time: 562 ms
1: Dist: 4, Time: 526 ms
2: Dist: 4, Time: 544 ms
3: Dist: 4, Time: 20 ms
4: Dist: 40, Time: 561 ms
5: Dist: 4, Time: 306 ms
6: Dist: 9, Time: 476 ms
7: Dist: 6, Time: 564 ms
8: Dist: 4, Time: 172 ms
9: Dist: 6, Time: 504 ms

Както се вижда, малко по-добри са от анонсираните.

Attached files:
FileSizeUploadedDownloadsMD5 hash
Levenshtein.asm9423 bytes01.10.20201374ab00f4ed720a49db984d9efc151e37b
mmxLeven.tar.gz3802604 bytes01.10.2020119d4519e210b3efb2581318706ab9570cb
#13389 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1321 пъти.
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...

#13392 (ツ) gat3way
Създадено на 01.10.2020, видяно: 1317 пъти.

Дойде ли време да оптимизираме гпу кода или още не е бито ? :)

#13394 (ツ) |
Създадено на 01.10.2020, видяно: 1312 пъти.
johnfound
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...

Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.

#13395 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1308 пъти.
|
johnfound
synergie

От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?

Епик - това процесора на Пайпа ли е? Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...

Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.

Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.

#13396 (ツ) |
Създадено на 01.10.2020, видяно: 1307 пъти.
gat3way

Дойде ли време да оптимизираме гпу кода или още не е бито ? :)

Ако предположим, че кода на Джон скалира линейно на 128-ядрения Epyc би трябвало да бие GPU-то. Пък и на 48-ядрения Интел Зион.

#13397 (ツ) |
Създадено на 01.10.2020, видяно: 1302 пъти.
johnfound

Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.

Пропуснал съм го. Ако успея да се свържа със сървъра ще пробвам.

#13432 (ツ) johnfound
Последно редактирано на 01.10.2020 от johnfound, видяно: 1280 пъти.

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

На Pentium N3540:

0: Dist: 4, Time: 341 ms
1: Dist: 4, Time: 320 ms
2: Dist: 4, Time: 332 ms
3: Dist: 4, Time: 11 ms
4: Dist: 40, Time: 339 ms
5: Dist: 4, Time: 187 ms
6: Dist: 9, Time: 289 ms
7: Dist: 6, Time: 342 ms
8: Dist: 4, Time: 105 ms
9: Dist: 6, Time: 308 ms

Средното време е 226ms на стринг.

#13436 (ツ) ФейкПрофил
Последно редактирано на 01.10.2020 от ФейкПрофил, видяно: 1272 пъти.

Аз съм в шок. Верно ще излезе, че на ръка се пишат по-бързи програми

#13438 (ツ) |
Създадено на 01.10.2020, видяно: 1268 пъти.
johnfound

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

Хмм, нещо не е наред. Това е с кода ти от вчера:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 7, Time: 7602 ms, Index: 97865
1: Dist: 7, Time: 6479 ms, Index: 90390
2: Dist: 7, Time: 6635 ms, Index: 91065
3: Dist: 7, Time: 3736 ms, Index: 1720
4: Dist: 45, Time: 6723 ms, Index: 34233
5: Dist: 7, Time: 5246 ms, Index: 49718
6: Dist: 12, Time: 5567 ms, Index: 52634
7: Dist: 8, Time: 6299 ms, Index: 80663
8: Dist: 7, Time: 4567 ms, Index: 26926
9: Dist: 8, Time: 5616 ms, Index: 60852
10: Dist: 63, Time: 7345 ms, Index: 58761
#13439 (ツ) |
Създадено на 01.10.2020, видяно: 1264 пъти.
johnfound

Хм, всички са в шок и не пишат. rofl

С кода който пусна тази сутрин (мое време) е наред:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 4, Time: 1150 ms
1: Dist: 4, Time: 897 ms
2: Dist: 4, Time: 608 ms
3: Dist: 4, Time: 19 ms
4: Dist: 40, Time: 607 ms
5: Dist: 4, Time: 330 ms
6: Dist: 9, Time: 515 ms
7: Dist: 6, Time: 610 ms
8: Dist: 4, Time: 185 ms
9: Dist: 6, Time: 545 ms
10: Dist: 58, Time: 665 ms
#13440 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1263 пъти.
|
johnfound

Хм, всички са в шок и не пишат. rofl

А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.

Хмм, нещо не е наред. Това е с кода ти от вчера:


allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

0: Dist: 7, Time: 7602 ms, Index: 97865
1: Dist: 7, Time: 6479 ms, Index: 90390
2: Dist: 7, Time: 6635 ms, Index: 91065
3: Dist: 7, Time: 3736 ms, Index: 1720
4: Dist: 45, Time: 6723 ms, Index: 34233
5: Dist: 7, Time: 5246 ms, Index: 49718
6: Dist: 12, Time: 5567 ms, Index: 52634
7: Dist: 8, Time: 6299 ms, Index: 80663
8: Dist: 7, Time: 4567 ms, Index: 26926
9: Dist: 8, Time: 5616 ms, Index: 60852
10: Dist: 63, Time: 7345 ms, Index: 58761

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

#13441 (ツ) |
Създадено на 01.10.2020, видяно: 1260 пъти.
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.

#13442 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1257 пъти.
|
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.

Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.

#13443 (ツ) |
Създадено на 01.10.2020, видяно: 1254 пъти.
johnfound
|
johnfound

Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...

Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.

Явно е имало бъг, който си фикснал без да разбереш в следващата версия.

Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.

Само съм махнал реда с лоудъра.

Attached files:
FileSizeUploadedDownloadsMD5 hash
Levenshtein.asm.save10739 bytes01.10.2020110cda744cab8b8755834e9ff1458d3dc6d
0 1 2 3 4 ....12 13 14 15 16 ....26 27 28 29 30 31 32 33 34 35 36

Задача НЕ за интервю
7

AsmBB v3.0 (check-in: a316dab8b98d07d9); SQLite v3.42.0 (check-in: 831d0fb2836b71c9);
©2016..2023 John Found; Licensed under EUPL. Powered by Assembly language Created with Fresh IDE