<bgdev />free

Вход Регистрация

Задача НЕ за интервю
7

0 1 2 3 4 ....12 13 14 15 16 ....27 28 29 30 31 32 33 34 35 36
#13444 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1415 пъти.
|

Само съм махнал реда с лоудъра.

Чакай сега - ти не го ли пускаше със MUSL? Тогава реда трябва да си стои.

А проблема е, че аз използвам редактиран файл Dataset.csv в който съм махнал втората колона.

Атачвам го, да не се мъчиш да го редактираш. С него програмите работят правилно.

Attached files:
FileSizeUploadedDownloadsMD5 hash
DatasetOneColumn.tar.gz3414442 bytes01.10.20201251406d11001b14cf4934382426aa9a1e9
#13445 (ツ) |
Създадено на 01.10.2020, видяно: 1410 пъти.
johnfound
|

Само съм махнал реда с лоудъра.

Чакай сега - ти не го ли пускаше със MUSL? Тогава реда трябва да си стои.

А проблема е, че аз използвам редактиран файл Dataset.csv в който съм махнал втората колона.

Атачвам го, да не се мъчиш да го редактираш. С него програмите работят правилно.

А, ок, ще го махна.

Не пускам с musl, нещо даде грешка като го компилирах, липсват някакви 32-битови библиотеки.

#13446 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1408 пъти.
|

Не пускам с musl, нещо даде грешка като го компилирах, липсват някакви 32-битови библиотеки.

Странно - на musl никакви библиотеки не му трябват. Той самият е имплементация на стандартната C библиотека. По-скоро компилатора ти не може да компилира 32 битов код...

#13447 (ツ) |
Създадено на 01.10.2020, видяно: 1405 пъти.
johnfound
|

Не пускам с musl, нещо даде грешка като го компилирах, липсват някакви 32-битови библиотеки.

Странно - на musl никакви библиотеки не му трябват. Той самият е имплементация на стандартната C библиотека. По-скоро компилатора ти не може да компилира 32 битов код...

Linker-a се оплаква:


/usr/bin/ld: i386:x86-64 architecture of input file `/usr/lib/gcc/x86_64-linux-gnu/9/libgcc.a(_mulxc3.o)' is incompatible with i386 output
/usr/bin/ld: obj/src/internal/floatscan.lo: in function `decfloat':
floatscan.c:(.text.decfloat+0x66e): undefined reference to `__udivdi3'

#13448 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1398 пъти.
|
johnfound
|

Не пускам с musl, нещо даде грешка като го компилирах, липсват някакви 32-битови библиотеки.

Странно - на musl никакви библиотеки не му трябват. Той самият е имплементация на стандартната C библиотека. По-скоро компилатора ти не може да компилира 32 битов код...

Linker-a се оплаква:


/usr/bin/ld: i386:x86-64 architecture of input file `/usr/lib/gcc/x86_64-linux-gnu/9/libgcc.a(_mulxc3.o)' is incompatible with i386 output
/usr/bin/ld: obj/src/internal/floatscan.lo: in function `decfloat':
floatscan.c:(.text.decfloat+0x66e): undefined reference to `__udivdi3'

Е, то аз в Ц-то съм много зле... Така че, уви, нищо не ми говори.

#13449 (ツ) |
Създадено на 01.10.2020, видяно: 1394 пъти.
johnfound
|
johnfound
|

Не пускам с musl, нещо даде грешка като го компилирах, липсват някакви 32-битови библиотеки.

Странно - на musl никакви библиотеки не му трябват. Той самият е имплементация на стандартната C библиотека. По-скоро компилатора ти не може да компилира 32 битов код...

Linker-a се оплаква:


/usr/bin/ld: i386:x86-64 architecture of input file `/usr/lib/gcc/x86_64-linux-gnu/9/libgcc.a(_mulxc3.o)' is incompatible with i386 output
/usr/bin/ld: obj/src/internal/floatscan.lo: in function `decfloat':
floatscan.c:(.text.decfloat+0x66e): undefined reference to `__udivdi3'

Е, то аз в Ц-то съм много зле... Така че, уви, нищо не ми говори.

Според мен му липсва 32-битовата libgcc библиотека, която имплементира разни неща от които зависи генерирания от gcc код. Честно казано не ме интересува чак толкова много, защото работи и без него. Ако искаш прати последния код, за който публикува резултати, ще го пробвам и него.

#13450 (ツ) johnfound
Последно редактирано на 01.10.2020 от johnfound, видяно: 1390 пъти.
|

Честно казано не ме интересува чак толкова много, защото работи и без него. Ако искаш прати последния код, за който публикува резултати, ще го пробвам и него.

Това би трябвало да ти свали последната версия от бранча "MMX":

fossil update MMX 

Компилирането по същият начин. Пак трябва да махнеш реда с MUSL.

#13451 (ツ) |
Последно редактирано на 01.10.2020 от |, видяно: 1377 пъти.
johnfound
|

Честно казано не ме интересува чак толкова много, защото работи и без него. Ако искаш прати последния код, за който публикува резултати, ще го пробвам и него.

Това би трябвало да ти свали последната версия от бранча "MMX":

fossil update MMX 

Компилирането по същият начин. Пак трябва да махнеш реда с MUSL.


0: Dist: 4, Time: 597 ms
1: Dist: 4, Time: 559 ms
2: Dist: 4, Time: 539 ms
3: Dist: 4, Time: 14 ms
4: Dist: 40, Time: 406 ms
5: Dist: 4, Time: 180 ms
6: Dist: 9, Time: 267 ms
7: Dist: 6, Time: 317 ms
8: Dist: 4, Time: 96 ms
9: Dist: 6, Time: 284 ms
10: Dist: 58, Time: 342 ms

Сега погледнах GPU-то е 6 ms, ne 60. :)

#13452 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1372 пъти.
|

0: Dist: 4, Time: 597 ms
1: Dist: 4, Time: 559 ms
2: Dist: 4, Time: 539 ms
3: Dist: 4, Time: 14 ms
4: Dist: 40, Time: 406 ms
5: Dist: 4, Time: 180 ms
6: Dist: 9, Time: 267 ms
7: Dist: 6, Time: 317 ms
8: Dist: 4, Time: 96 ms
9: Dist: 6, Time: 284 ms
10: Dist: 58, Time: 342 ms

Сега погледнах GPU-то е 6 ms, ne 60. :)

Това въобще, на какъв компютър го пускаш? Нещо много бавно ми изглежда - Нетбука ми с пасивното охлаждане е по-бърз двойно... Да не го пускаш на някакъв емулатор?

#13453 (ツ) |
Създадено на 01.10.2020, видяно: 1370 пъти.
johnfound
|

0: Dist: 4, Time: 597 ms
1: Dist: 4, Time: 559 ms
2: Dist: 4, Time: 539 ms
3: Dist: 4, Time: 14 ms
4: Dist: 40, Time: 406 ms
5: Dist: 4, Time: 180 ms
6: Dist: 9, Time: 267 ms
7: Dist: 6, Time: 317 ms
8: Dist: 4, Time: 96 ms
9: Dist: 6, Time: 284 ms
10: Dist: 58, Time: 342 ms

Сега погледнах GPU-то е 6 ms, ne 60. :)

Това въобще, на какъв компютър го пускаш? Нещо много бавно ми изглежда - Нетбука ми с пасивното охлаждане е по-бърз двойно... Да не го пускаш на някакъв емулатор?


allegro:~/tmp/work/AsmLeven$ tail -28 /proc/cpuinfo
processor	: 255
vendor_id	: AuthenticAMD
cpu family	: 23
model		: 49
model name	: AMD EPYC 7742 64-Core Processor
stepping	: 0
microcode	: 0x8301038
cpu MHz		: 1496.102
cache size	: 512 KB
physical id	: 1
siblings	: 128
core id		: 63
cpu cores	: 64
apicid		: 255
initial apicid	: 255
fpu		: yes
fpu_exception	: yes
cpuid level	: 16
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc cpuid extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt tce topoext perfctr_core perfctr_nb bpext perfctr_llc mwaitx cpb cat_l3 cdp_l3 hw_pstate ssbd mba ibrs ibpb stibp vmmcall fsgsbase bmi1 avx2 smep bmi2 cqm rdt_a rdseed adx smap clflushopt clwb sha_ni xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local clzero irperf xsaveerptr wbnoinvd arat npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold avic v_vmsave_vmload vgif umip rdpid overflow_recov succor smca
bugs		: sysret_ss_attrs spectre_v1 spectre_v2 spec_store_bypass
bogomips	: 4263.93
TLB size	: 3072 4K pages
clflush size	: 64
cache_alignment	: 64
address sizes	: 48 bits physical, 48 bits virtual
power management: ts ttp tm hwpstate cpb eff_freq_ro [13] [14]

#13455 (ツ) johnfound
Последно редактирано на 01.10.2020 от johnfound, видяно: 1367 пъти.
|
allegro:~/tmp/work/AsmLeven$ tail -28 /proc/cpuinfo

Ъ!, ми то това не изглежда сериозно. То вярно, нетбукския N3550 изглежда по-бърз:

rocessor	: 3
vendor_id	: GenuineIntel
cpu family	: 6
model		: 55
model name	: Intel(R) Pentium(R) CPU  N3540  @ 2.16GHz
stepping	: 8
microcode	: 0x838
cpu MHz		: 2666.669
cache size	: 1024 KB
physical id	: 0
siblings	: 4
core id		: 3
cpu cores	: 4
apicid		: 6
initial apicid	: 6
fpu		: yes
fpu_exception	: yes
cpuid level	: 11
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology tsc_reliable nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 movbe popcnt tsc_deadline_timer rdrand lahf_lm 3dnowprefetch epb pti ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid tsc_adjust smep erms dtherm ida arat md_clear
bugs		: cpu_meltdown spectre_v1 spectre_v2 mds msbds_only
bogomips	: 4335.88
clflush size	: 64
cache_alignment	: 64
address sizes	: 36 bits physical, 48 bits virtual
power management:

И тактовата честота е по-висока и bogomips-овете. Епика, само дето има значително повече ядра...

#13457 (ツ) |
Създадено на 01.10.2020, видяно: 1362 пъти.
johnfound

И тактовата честота е по-висока и bogomips-овете. Епика, само дето има значително повече ядра...

Това е положението. :) Пробвах да изпълня програмата на най-новия ми Интел, но нещо крашва.


sonata~/tmp/AsmLeven$ ./Levenshtein
Dictionary (SetA) length: 99775

Segmentation fault

processor	: 95
vendor_id	: GenuineIntel
cpu family	: 6
model		: 85
model name	: Intel(R) Xeon(R) Platinum 8260 CPU @ 2.40GHz
stepping	: 7
microcode	: 0x500002b
cpu MHz		: 1001.021
cache size	: 36608 KB
physical id	: 1
siblings	: 48
core id		: 29
cpu cores	: 24
apicid		: 123
initial apicid	: 123
fpu		: yes
fpu_exception	: yes
cpuid level	: 22
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault epb cat_l3 cdp_l3 invpcid_single intel_ppin ssbd mba ibrs ibpb stibp ibrs_enhanced tpr_shadow vnmi flexpriority ept vpid ept_ad fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm cqm mpx rdt_a avx512f avx512dq rdseed adx smap clflushopt clwb intel_pt avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local dtherm ida arat pln pts pku ospke avx512_vnni md_clear flush_l1d arch_capabilities
bugs		: spectre_v1 spectre_v2 spec_store_bypass swapgs
bogomips	: 4805.90
clflush size	: 64
cache_alignment	: 64
address sizes	: 46 bits physical, 48 bits virtual
power management:
#13459 (ツ) johnfound
Последно редактирано на 01.10.2020 от johnfound, видяно: 1357 пъти.
|

Това е положението. :) Пробвах да изпълня програмата на най-новия ми Интел, но нещо крашва.

Е, то крашването може да е нещо от подравняванията - има там тънки моменти... Ще ги видя.

А иначе, на сървъра на форума резултата е:

0: Dist: 4, Time: 219 ms
1: Dist: 4, Time: 208 ms
2: Dist: 4, Time: 220 ms
3: Dist: 4, Time: 8 ms
4: Dist: 40, Time: 223 ms
5: Dist: 4, Time: 122 ms
6: Dist: 9, Time: 188 ms
7: Dist: 6, Time: 220 ms
8: Dist: 4, Time: 68 ms
9: Dist: 6, Time: 202 ms

Средно: 150ms

Intel Core Processor (Skylake, IBRS), 3792MHz

#13460 (ツ) |
Последно редактирано на 01.10.2020 от |, видяно: 1349 пъти.

Това е на един от по-древните сървъри, който мисля да изхвърлям скоро, защото не го използвам:


0: Dist: 4, Time: 256 ms
1: Dist: 4, Time: 241 ms
2: Dist: 4, Time: 249 ms
3: Dist: 4, Time: 8 ms
4: Dist: 40, Time: 254 ms
5: Dist: 4, Time: 140 ms
6: Dist: 9, Time: 213 ms
7: Dist: 6, Time: 255 ms
8: Dist: 4, Time: 78 ms
9: Dist: 6, Time: 227 ms
10: Dist: 58, Time: 278 ms

Intel(R) Xeon(R) CPU E5-2637 v3 @ 3.50GHz

#13465 (ツ) |
Създадено на 01.10.2020, видяно: 1341 пъти.
johnfound
|
allegro:~/tmp/work/AsmLeven$ tail -28 /proc/cpuinfo

Ъ!, ми то това не изглежда сериозно. То вярно, нетбукския N3550 изглежда по-бърз:

И тактовата честота е по-висока и bogomips-овете. Епика, само дето има значително повече ядра...

Все пак като разделиш на 128 (колкото са "процесорите" на един чип), скоростта излиза към 4 ms, което е по-малко от 6-те ms на Теслата.

#13478 (ツ) johnfound
Създадено на 01.10.2020, видяно: 1330 пъти.

Тука атачвам компилираните файлове за последната версия. Тя би трябвало вече да няма проблеми с изравняването на данните и да работи добре на по-нови процесори...

Моите тестове на N3540:

0: Dist: 4, Time: 263 ms
1: Dist: 4, Time: 246 ms
2: Dist: 4, Time: 257 ms
3: Dist: 4, Time: 10 ms
4: Dist: 40, Time: 260 ms
5: Dist: 4, Time: 145 ms
6: Dist: 9, Time: 222 ms
7: Dist: 6, Time: 263 ms
8: Dist: 4, Time: 82 ms
9: Dist: 6, Time: 237 ms

Средно време: 178ms на стринг.

Сорсовете са в репозиторито, бранч "MMX".

Attached files:
FileSizeUploadedDownloadsMD5 hash
mmxLeven2.tar.gz3801454 bytes01.10.202012650b44b2d7f1eb01db40da4f61ca654c6
#13483 (ツ) Delegate
Създадено на 02.10.2020, видяно: 1314 пъти.

МНого добре. Идва около 20 пъти по-бързо от C# версията ми на G1840 2.8 Ghz

Dictionary (SetA) length: 99775

0: Dist: 12, Time: 438 ms
1: Dist: 12, Time: 422 ms
2: Dist: 12, Time: 422 ms
3: Dist: 12, Time: 297 ms
4: Dist: 42, Time: 406 ms
5: Dist: 12, Time: 359 ms
6: Dist: 17, Time: 375 ms
7: Dist: 14, Time: 422 ms
8: Dist: 12, Time: 328 ms
9: Dist: 14, Time: 391 ms
10: Dist: 60, Time: 437 ms
#13484 (ツ) johnfound
Създадено на 02.10.2020, видяно: 1312 пъти.
Delegate

МНого добре. Идва около 20 пъти по-бързо от C# версията ми на G1840 2.8 Ghz

Dictionary (SetA) length: 99775

0: Dist: 12, Time: 438 ms
1: Dist: 12, Time: 422 ms
2: Dist: 12, Time: 422 ms
3: Dist: 12, Time: 297 ms
4: Dist: 42, Time: 406 ms
5: Dist: 12, Time: 359 ms
6: Dist: 17, Time: 375 ms
7: Dist: 14, Time: 422 ms
8: Dist: 12, Time: 328 ms
9: Dist: 14, Time: 391 ms
10: Dist: 60, Time: 437 ms

Да, само дето резултатите са грешни. rofl rofl rofl

Тоя последния атачмънт ли пускаш?

#13486 (ツ) Delegate
Създадено на 02.10.2020, видяно: 1309 пъти.

Мда, последния :)

#13489 (ツ) johnfound
Създадено на 02.10.2020, видяно: 1304 пъти.
Delegate

Мда, последния :)

Наистина кофти. Има един малко спорен код в последната версия.

Я опитай с варианта в атачмънта - замени само изпълнимия файл. (Или ти под Windows ги пускаш?)

Attached files:
FileSizeUploadedDownloadsMD5 hash
Levenshtein3791 bytes02.10.202012107b665f12cf899ee5b5bb835098cde32
0 1 2 3 4 ....12 13 14 15 16 ....27 28 29 30 31 32 33 34 35 36

Задача НЕ за интервю
7

AsmBB v3.0 (check-in: a316dab8b98d07d9); SQLite v3.42.0 (check-in: 831d0fb2836b71c9);
©2016..2023 John Found; Licensed under EUPL. Powered by Assembly language Created with Fresh IDE