Абе това trie колко памет харчи ? Аз се заиграх, но ми заема 2ГБ :(
|
Създадено на 01.10.2020, видяно: 1562 пъти. #13380
Освен това твоят код (предполагам) не е многонишков.
johnfound
Създадено на 01.10.2020, видяно: 1551 пъти. #13385
Освен това твоят код (предполагам) не е многонишков.
Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.
|
Създадено на 01.10.2020, видяно: 1548 пъти. #13386
Освен това твоят код (предполагам) не е многонишков.
Това пък откъде накъде? Съвсем нормално ще си работи с колкото си искаш нишки.
Казвам, че не е многонишков в момента, и ако се пусне на всички ядра, това ще увеличи производителността му. Защото кода на GPU-то се изпълнява на много нишки и затова е толкова бърз.
synergie
Създадено на 01.10.2020, видяно: 1543 пъти. #13387
От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?
johnfound
Създадено на 01.10.2020, видяно: 1532 пъти. #13389
От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?
Епик - това процесора на Пайпа ли е?
Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...
gat3way
Създадено на 01.10.2020, видяно: 1528 пъти. #13392
Дойде ли време да оптимизираме гпу кода или още не е бито ? :)
|
Създадено на 01.10.2020, видяно: 1523 пъти. #13394
От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?
Епик - това процесора на Пайпа ли е?
Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...
Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.
johnfound
Създадено на 01.10.2020, видяно: 1519 пъти. #13395
От чисто любопитство, не-ММХ версията разбра ли се за колко време минава на Епика и за колко минава Gо версията?
Епик - това процесора на Пайпа ли е?
Ако да - то не. Пайпа щеше да компилира и май успя, но не публикува никакви резултати...
Компилирах, но не поддържа изпълняването на 32-битови програми. Предполагам, че е проблем с ядрото, защото не мисля, че липсват някакви библиотеки от които зависи. Щях да компилирам ново ядро, но в момента нямам достъп до сървъра.
Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.
|
Създадено на 01.10.2020, видяно: 1518 пъти. #13396
Дойде ли време да оптимизираме гпу кода или още не е бито ? :)
Ако предположим, че кода на Джон скалира линейно на 128-ядрения Epyc би трябвало да бие GPU-то. Пък и на 48-ядрения Интел Зион.
|
Създадено на 01.10.2020, видяно: 1513 пъти. #13397
Видя ли този пост - ако добавиш MUSL .so файла, ще тръгне, без значение дали имаш поддръжка за 32 битови програми или не.
Пропуснал съм го. Ако успея да се свържа със сървъра ще пробвам.
А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.
На Pentium N3540:
0: Dist: 4, Time: 341 ms
1: Dist: 4, Time: 320 ms
2: Dist: 4, Time: 332 ms
3: Dist: 4, Time: 11 ms
4: Dist: 40, Time: 339 ms
5: Dist: 4, Time: 187 ms
6: Dist: 9, Time: 289 ms
7: Dist: 6, Time: 342 ms
8: Dist: 4, Time: 105 ms
9: Dist: 6, Time: 308 ms
Аз съм в шок. Верно ще излезе, че на ръка се пишат по-бързи програми
|
Създадено на 01.10.2020, видяно: 1479 пъти. #13438
Хм, всички са в шок и не пишат.
А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.
|
Създадено на 01.10.2020, видяно: 1475 пъти. #13439
Хм, всички са в шок и не пишат.
С кода който пусна тази сутрин (мое време) е наред:
allegro:~/tmp/work/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775
0: Dist: 4, Time: 1150 ms
1: Dist: 4, Time: 897 ms
2: Dist: 4, Time: 608 ms
3: Dist: 4, Time: 19 ms
4: Dist: 40, Time: 607 ms
5: Dist: 4, Time: 330 ms
6: Dist: 9, Time: 515 ms
7: Dist: 6, Time: 610 ms
8: Dist: 4, Time: 185 ms
9: Dist: 6, Time: 545 ms
10: Dist: 58, Time: 665 ms
johnfound
Създадено на 01.10.2020, видяно: 1474 пъти. #13440
Хм, всички са в шок и не пишат.
А аз опитах как ще изглежда с XMM регистрите и 16 стринга наведнъж. Има подобрение, но определено не е двойно, така че вероятно трябва да се види дали спомагателния код не трябва да се пипа още.
Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...
Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.
|
Създадено на 01.10.2020, видяно: 1471 пъти. #13441
Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...
Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.
Явно е имало бъг, който си фикснал без да разбереш в следващата версия.
johnfound
Създадено на 01.10.2020, видяно: 1468 пъти. #13442
Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...
Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.
Явно е имало бъг, който си фикснал без да разбереш в следващата версия.
Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.
|
Създадено на 01.10.2020, видяно: 1465 пъти. #13443
Даже не знам какво да кажа... Не стига, че е бавно, ами и резултатите не са верни... Нещо се е прецакало при компилирането. Или пък има бъг, който се проявява точно на този процесор...
Я опитай с файловете с данните от бинарния пакет, който съм атачвал - да не би нещо четенето на данните да е проблем.
Явно е имало бъг, който си фикснал без да разбереш в следващата версия.
Ще погледна, но няма логика... Обикновено къмитвам в репозиторито само работещ код... Дай файла от който си компилирал.