Compare commits
2 Commits
labs/04
...
fa92aeebd4
| Author | SHA1 | Date | |
|---|---|---|---|
| fa92aeebd4 | |||
| 623731461f |
@ -1,67 +0,0 @@
|
||||
global main
|
||||
|
||||
extern printf
|
||||
|
||||
%define CLOCK_REALTIME 0
|
||||
|
||||
; struct timespec { time_t tv_sec; long tv_nsec; }
|
||||
struc timespec
|
||||
.tv_sec: resq 1
|
||||
.tv_nsec: resq 1
|
||||
endstruc
|
||||
|
||||
section .note.GNU-stack ; чтобы не жаловался линкер
|
||||
|
||||
section .bss
|
||||
|
||||
start: ; uses timespec model
|
||||
times 2 resq 1
|
||||
|
||||
finish:
|
||||
times 2 resq 1
|
||||
|
||||
section .data
|
||||
|
||||
fstring db "Operations took %ul seconds and %ul milliseconds", 10, 0
|
||||
flen equ $-fstring
|
||||
|
||||
section .text
|
||||
|
||||
main: ; лично в моей системе time_t представляет из себя long int
|
||||
mov rax, 228 ; Системный вызов получения времени
|
||||
mov rdi, CLOCK_REALTIME
|
||||
mov rsi, start
|
||||
syscall
|
||||
|
||||
; insert your code here
|
||||
mov rcx, 20000
|
||||
|
||||
looper:
|
||||
mov rax, start
|
||||
loop looper
|
||||
|
||||
mov rax, 228
|
||||
mov rdi, CLOCK_REALTIME
|
||||
mov rsi, finish
|
||||
syscall
|
||||
|
||||
; считаем время для секунда и миллисекунд
|
||||
; секунды
|
||||
mov rsi, [finish + timespec.tv_sec]
|
||||
sub rsi, [start + timespec.tv_sec]
|
||||
|
||||
; миллисекунды
|
||||
mov rdx, [finish + timespec.tv_nsec]
|
||||
sub rdx, [start + timespec.tv_nsec]
|
||||
|
||||
mov rdi, fstring
|
||||
mov rax, 0
|
||||
sub rsp, 8
|
||||
call printf
|
||||
add rsp, 8
|
||||
|
||||
exit:
|
||||
mov rax, 60
|
||||
mov rdi, 0
|
||||
syscall
|
||||
|
||||
@ -1,13 +0,0 @@
|
||||
ASM = nasm
|
||||
ASM_FLAGS = -felf64 -g
|
||||
LINK = ld
|
||||
|
||||
%: %.o
|
||||
$(LINK) -o $@ $^
|
||||
|
||||
%.o: %.asm
|
||||
$(ASM) $(ASM_FLAGS) $^ -o $@
|
||||
|
||||
clean:
|
||||
rm -f *.o
|
||||
rm -f $(subst .asm, $(empty), $(wildcard *.asm))
|
||||
@ -1,24 +0,0 @@
|
||||
ASM = nasm
|
||||
CXX = gcc
|
||||
CXX_FLAGS = -Og -static
|
||||
ASM_FLAGS = -felf64 -g
|
||||
LINK = ld
|
||||
|
||||
task3: task3_c.o task3.o
|
||||
$(CXX) -Og $^ -o $@ -g
|
||||
|
||||
task3_c.o: task3.c
|
||||
$(CXX) -Og -c $^ -o $@ -g
|
||||
|
||||
task2: task2.o
|
||||
$(CXX) $(CXX_FLAGS) $^ -o $@
|
||||
|
||||
%: %.o
|
||||
$(LINK) -o $@ $^
|
||||
|
||||
%.o: %.asm
|
||||
$(ASM) $(ASM_FLAGS) $^ -o $@
|
||||
|
||||
clean:
|
||||
rm -f *.o
|
||||
rm -f $(subst .asm, $(empty), $(wildcard *.asm))
|
||||
@ -1,4 +1,4 @@
|
||||
# Лабораторная работа 4
|
||||
|
||||
На данный момент нормального README не будет, потому что у меня немного нет времени его офомить. Как только сдам лабу - напишу тут немного больше
|
||||
## Способы адресации и сегментная организация памяти
|
||||
|
||||
|
||||
@ -1,33 +0,0 @@
|
||||
global _start
|
||||
|
||||
section .data
|
||||
|
||||
%macro FILL_ASC 1
|
||||
%assign NUM 0
|
||||
%rep %1
|
||||
db NUM
|
||||
%assign NUM NUM + 1
|
||||
%endrep
|
||||
%endmacro
|
||||
|
||||
example: FILL_ASC 256
|
||||
|
||||
section .text
|
||||
|
||||
_start:
|
||||
; В качестве базы возьму inc
|
||||
; регистровая
|
||||
inc ecx
|
||||
mov rax, example
|
||||
; косвенно-регистровая
|
||||
inc byte [rax]
|
||||
; "Индексно-базовая", хотя у меня почти все может быть базой
|
||||
inc byte [rax + rbx]
|
||||
; "Индексно-базовая" со смещением
|
||||
inc byte [rax + rbx + 122]
|
||||
|
||||
; Ну в целом... все
|
||||
mov rax, 60
|
||||
mov rdi, 0
|
||||
syscall
|
||||
|
||||
@ -1,139 +0,0 @@
|
||||
global main
|
||||
|
||||
extern printf
|
||||
|
||||
struc timespec ; структура, в которой линукс хранит время. Тут нужна для удобства в будущем
|
||||
.tv_sec: resq 1
|
||||
.tv_nsec: resq 1
|
||||
endstruc
|
||||
|
||||
%include "timer.inc"
|
||||
|
||||
section .note.GNU-stack
|
||||
|
||||
section .data
|
||||
example: times 128 db 127
|
||||
|
||||
section .bss
|
||||
; uses timespec model
|
||||
start: resq 2
|
||||
finish: resq 2
|
||||
deltatime: resq 2
|
||||
|
||||
section .text
|
||||
|
||||
%macro PUSH_M 1-*
|
||||
%rep %0
|
||||
push %1
|
||||
%rotate 1
|
||||
%endrep
|
||||
%endmacro
|
||||
|
||||
%macro RPOP_M 1-*
|
||||
%rotate -1
|
||||
%rep %0
|
||||
pop %1
|
||||
%rotate -1
|
||||
%endrep
|
||||
%endmacro
|
||||
|
||||
%define CLOCK_REALTIME 0
|
||||
%macro TIME_1_000_000 0-1+ ; принимает команду, которую будет пытаться обмерить по времени
|
||||
PUSH_M rax, rdi, rsi, rcx
|
||||
mov rax, 228 ; Время начала
|
||||
mov rdi, CLOCK_REALTIME
|
||||
mov rsi, start
|
||||
syscall
|
||||
RPOP_M rax, rdi, rsi, rcx
|
||||
|
||||
mov rcx, 10000000000; выполняем миллион раз
|
||||
%%loop:
|
||||
%1
|
||||
loop %%loop
|
||||
|
||||
PUSH_M rax, rdi, rsi, rcx
|
||||
mov rax, 228 ; Время конца
|
||||
mov rdi, CLOCK_REALTIME
|
||||
mov rsi, finish
|
||||
syscall
|
||||
RPOP_M rax, rdi, rsi, rcx
|
||||
|
||||
; считаем секунды
|
||||
push rax ; можно было бы оптимизировать, но мне лень макросы переписывать
|
||||
mov rax, [finish + timespec.tv_sec]
|
||||
sub rax, [start + timespec.tv_sec]
|
||||
mov [deltatime + timespec.tv_sec], rax
|
||||
|
||||
; считаем наносекунды
|
||||
mov rax, [finish + timespec.tv_nsec]
|
||||
sub rax, [start + timespec.tv_nsec]
|
||||
jns %%save_result
|
||||
dec qword [deltatime + timespec.tv_sec] ; занимаем миллиард наносекунд
|
||||
add rax, 1000000000 ; прибавляем занятый разряд
|
||||
%%save_result:
|
||||
mov [deltatime + timespec.tv_nsec], rax
|
||||
pop rax
|
||||
%endmacro
|
||||
|
||||
%macro PRINT_DELTATIME 1
|
||||
;sub rsp, 8
|
||||
mov rdi, str_template
|
||||
mov rsi, %1
|
||||
mov rdx, [deltatime + timespec.tv_sec]
|
||||
mov rcx, [deltatime + timespec.tv_nsec]
|
||||
call printf
|
||||
;add rsp, 8
|
||||
%endmacro
|
||||
|
||||
main:
|
||||
push rbp
|
||||
mov rbp, rsp
|
||||
sub rsp, 16
|
||||
xor rax, rax ; поскольку приходим сюда из компилятора, лучше обнулить
|
||||
TIME_1_000_000
|
||||
PRINT_DELTATIME nop_command
|
||||
|
||||
TIME_1_000_000 inc rax
|
||||
PRINT_DELTATIME reg_command
|
||||
|
||||
mov rax, example
|
||||
TIME_1_000_000 inc byte [rax]
|
||||
PRINT_DELTATIME rel_reg
|
||||
|
||||
mov rax, example
|
||||
xor rbx, rbx
|
||||
TIME_1_000_000 inc byte [rax + rbx]
|
||||
PRINT_DELTATIME ind_base
|
||||
|
||||
mov rax, example
|
||||
xor rbx, rbx
|
||||
TIME_1_000_000 inc byte [rax + rbx + 122]
|
||||
PRINT_DELTATIME ind_base_disp
|
||||
|
||||
; Под конец давайте посчитаем тактовую частоту на примере той же самой команды
|
||||
rdtsc
|
||||
mov [rbp - 4], edx
|
||||
mov [rbp - 8], eax
|
||||
mov rcx, 10000000000
|
||||
mov rax, example
|
||||
xor rbx, rbx
|
||||
.loop:
|
||||
inc byte [rax + rbx + 122]
|
||||
loop .loop
|
||||
rdtsc
|
||||
sub eax, [rbp - 8]
|
||||
sbb edx, [rbp - 4]
|
||||
mov [rbp - 8], eax
|
||||
mov [rbp - 4], edx
|
||||
|
||||
mov [rbp - 16], rsp
|
||||
and rsp, -16
|
||||
mov rdi, tick_count
|
||||
mov rsi, [rbp - 8]
|
||||
call printf
|
||||
|
||||
mov rsp, rbp
|
||||
pop rbp
|
||||
xor rax, rax ; сообщаем gcc, что все закончилось успешно
|
||||
ret
|
||||
|
||||
@ -1,96 +0,0 @@
|
||||
global fill_arr1
|
||||
global fill_arr2
|
||||
|
||||
section .note.GNU-stack
|
||||
|
||||
section .text
|
||||
|
||||
%macro PUSH_M 1-*
|
||||
%rep %0
|
||||
push %1
|
||||
%rotate 1
|
||||
%endrep
|
||||
%endmacro
|
||||
|
||||
%macro RPOP_M 1-*
|
||||
%rotate -1
|
||||
%rep %0
|
||||
pop %1
|
||||
%rotate -1
|
||||
%endrep
|
||||
%endmacro
|
||||
|
||||
fill_arr1:
|
||||
push rbp
|
||||
mov rbp, rsp
|
||||
PUSH_M rdi, rsi, rdx
|
||||
; Вычисляем сколько числе в строке
|
||||
mov rax, [rbp - 16]
|
||||
xor rdx, rdx
|
||||
div qword [rbp - 24]
|
||||
push rax ; сохраняем в локальные переменные. rbp - 32
|
||||
; Вычисляем сколько проходов цикла необходимо
|
||||
mov rax, [rbp - 24]
|
||||
xor rdx, rdx
|
||||
mov rcx, 2
|
||||
div rcx
|
||||
push rax ; rbp-40
|
||||
|
||||
; Надеюсь rdi не успел поменяться
|
||||
; заполняем память
|
||||
push rbx
|
||||
mov rbx, [rbp - 32]
|
||||
mov rcx, [rbp - 40]
|
||||
mov rax, 777 ; специально такое число, чтобы выделялось
|
||||
.next_row:
|
||||
push rcx
|
||||
mov rcx, [rbp - 32]
|
||||
rep stosd
|
||||
lea rdi, [rdi + 4 * rbx] ; пропускаем строку
|
||||
pop rcx
|
||||
loop .next_row
|
||||
pop rbx
|
||||
|
||||
add rsp, 16 ; чистим 2 доп переменные, образовавшиеся в процессе вычислений
|
||||
RPOP_M rdi, rsi, rdx
|
||||
pop rbp
|
||||
ret
|
||||
|
||||
fill_arr2:
|
||||
push rbp
|
||||
mov rbp, rsp
|
||||
PUSH_M rdi, rsi, rdx
|
||||
; Вычисляем сколько числе в строке
|
||||
mov rax, [rbp - 16]
|
||||
xor rdx, rdx
|
||||
div qword [rbp - 24]
|
||||
push rax ; сохраняем в локальные переменные. rbp - 32
|
||||
; Вычисляем сколько проходов цикла необходимо
|
||||
mov rax, [rbp - 24]
|
||||
xor rdx, rdx
|
||||
mov rcx, 2
|
||||
div rcx
|
||||
push rax ; rbp-40
|
||||
|
||||
; Надеюсь rdi не успел поменяться
|
||||
; заполняем память
|
||||
push rbx
|
||||
mov rbx, [rbp - 32]
|
||||
mov rcx, [rbp - 40]
|
||||
mov rax, 777 ; специально такое число, чтобы выделялось
|
||||
.next_row:
|
||||
push rcx
|
||||
mov rcx, [rbp - 32]
|
||||
.fill:
|
||||
mov [rdi], rax
|
||||
lea rdi, [rdi + 4]
|
||||
loop .fill
|
||||
lea rdi, [rdi + 4 * rbx] ; пропускаем строку
|
||||
pop rcx
|
||||
loop .next_row
|
||||
pop rbx
|
||||
|
||||
add rsp, 16 ; чистим 2 доп переменные, образовавшиеся в процессе вычислений
|
||||
RPOP_M rdi, rsi, rdx
|
||||
pop rbp
|
||||
ret
|
||||
@ -1,43 +0,0 @@
|
||||
#include <stdio.h>
|
||||
#include <time.h>
|
||||
|
||||
extern void fill_arr1(int* arr, size_t size, size_t row_count);
|
||||
extern void fill_arr2(int* arr, size_t size, size_t row_count);
|
||||
|
||||
double measure_fill_time(void(*function)(int*, size_t, size_t), int* arr, size_t size, size_t row_count)
|
||||
{
|
||||
const size_t times = 10000000;
|
||||
clock_t begin = clock();
|
||||
for (size_t i = 0; i < times; i++)
|
||||
{
|
||||
function(arr, size, row_count);
|
||||
}
|
||||
clock_t end = clock();
|
||||
return (double)(end - begin)/(CLOCKS_PER_SEC);
|
||||
}
|
||||
|
||||
int main()
|
||||
{
|
||||
const int arr_size = 256;
|
||||
int array1[arr_size];
|
||||
|
||||
printf("String methods took %fs to loop 10,000,000 times\n", measure_fill_time(fill_arr1, array1, arr_size, 16));
|
||||
|
||||
for (size_t i = 0; i < arr_size; i++)
|
||||
{
|
||||
printf("%d ", array1[i]);
|
||||
}
|
||||
printf("\b \n");
|
||||
|
||||
int array2[arr_size];
|
||||
|
||||
printf("Lea methods took %fs on to loop 10,000,000 times\n", measure_fill_time(fill_arr2, array2, arr_size, 16));
|
||||
for (size_t i = 0; i < arr_size; i++)
|
||||
{
|
||||
printf("%d ", array2[i]);
|
||||
}
|
||||
printf("\b \n");
|
||||
|
||||
return 0;
|
||||
}
|
||||
|
||||
@ -1,13 +0,0 @@
|
||||
|
||||
section .data
|
||||
str_template: db "Command %s took %lld seconds and %lld nanoseconds to execute 1 000 000 000 times", 10, 0
|
||||
template_len equ $-str_template
|
||||
|
||||
nop_command: db '`empty loop`', 0
|
||||
reg_command: db '`inc ebx`', 0
|
||||
rel_reg: db '`inc byte [rax]`', 0
|
||||
ind_base: db '`inc byte [rax + rbx]`', 0
|
||||
ind_base_disp: db '`inc byte [rax + rbx + 122]`', 0
|
||||
|
||||
tick_count: db 'Last command also took %lli ticks to complete', 10, 0
|
||||
|
||||
70
05-subroutines-params/task.asm
Normal file
70
05-subroutines-params/task.asm
Normal file
@ -0,0 +1,70 @@
|
||||
global task_regs
|
||||
global task_stack
|
||||
|
||||
section .note.GNU-stack
|
||||
|
||||
section .text
|
||||
|
||||
task_regs: ; rdi - указатель первое на число, rsi - указатель второе на число, rdx - результат
|
||||
push rax
|
||||
mov rax, [rdi]
|
||||
mov [rdx], rax
|
||||
mov rax, [rdi + 8]
|
||||
mov [rdx + 8], rax
|
||||
mov rax, [rsi + 8]
|
||||
add [rdx + 8], rax
|
||||
mov rax, [rsi]
|
||||
adc [rdx], rax
|
||||
pop rax
|
||||
ret
|
||||
|
||||
task_stack: ; разрядность - 1 байт. Дальше читаем сколько надо. Читает в 2 раза больше разрядности
|
||||
push rbp
|
||||
mov rbp, rsp
|
||||
mov al, [rbp + 8]
|
||||
test al, 64
|
||||
jnz .64bit
|
||||
test al, 32
|
||||
jnz .32bit
|
||||
test al, 16
|
||||
jnz .16bit
|
||||
test al, 8
|
||||
.8bit:
|
||||
xor rax, rax
|
||||
mov al, [rbp + 9]
|
||||
mov ah, [rbp + 10]
|
||||
mov cl, [rbp + 11]
|
||||
mov ch, [rbp + 12]
|
||||
add al, cl
|
||||
adc ah, ch
|
||||
jmp .end
|
||||
.16bit:
|
||||
xor rax, rax
|
||||
mov ax, [rbp + 11] ; старшая часть 1-го
|
||||
mov dx, [rbp + 15] ; старшая часть 2-го
|
||||
mov cx, [rbp + 9] ; младшая
|
||||
mov bx, [rbp + 13] ;младшая
|
||||
add cx, bx
|
||||
adc ax, dx
|
||||
pushfq ; Сохраним флаги на всякий
|
||||
sal eax, 16
|
||||
mov ax, cx
|
||||
popfq
|
||||
jmp .end
|
||||
.32bit:
|
||||
xor rax, rax
|
||||
mov eax, [rbp + 11] ; старшая часть 1-го
|
||||
mov edx, [rbp + 15] ; старшая часть 2-го
|
||||
mov ecx, [rbp + 9] ; младшая
|
||||
mov ebx, [rbp + 13] ;младшая
|
||||
add ecx, ebx
|
||||
adc eax, edx
|
||||
pushfq ; Сохраним флаги на всякий
|
||||
sal rax, 32
|
||||
mov eax, ecx
|
||||
popfq
|
||||
jmp .end
|
||||
.64bit:
|
||||
;crush
|
||||
.end:
|
||||
ret
|
||||
55
05-subroutines-params/task1.c
Normal file
55
05-subroutines-params/task1.c
Normal file
@ -0,0 +1,55 @@
|
||||
#include <stdio.h>
|
||||
|
||||
typedef struct
|
||||
{
|
||||
unsigned long h;
|
||||
unsigned long l;
|
||||
} LongNum;
|
||||
|
||||
typedef unsigned char byte;
|
||||
|
||||
extern void task_regs(LongNum* a, LongNum* b, LongNum* result);
|
||||
|
||||
extern unsigned long task_stack(); // Для передачи через Си потребуется функцкия-обертка
|
||||
|
||||
unsigned long stack_wrapper(void* arr, byte bits)
|
||||
{
|
||||
unsigned long result = 0;
|
||||
byte shift = bits >> 3;
|
||||
printf("shift is %d", shift);
|
||||
__asm__(
|
||||
"pushq %%rsp\n\t"
|
||||
"movq $2, %%rcx\n\t"
|
||||
"subq $2, %%rsp\n\t"
|
||||
"movb %2, (%%rsp)\n\t"
|
||||
"xorq %%rdx, %%rdx\n\t"
|
||||
"pop %%dx\n\t"
|
||||
"stack_push_loop:\n\t"
|
||||
"subq %%rdx, %%rsp\n\t"
|
||||
"movq (%1), %%rsp\n\t"
|
||||
"addq %%rdx, %1\n\t"
|
||||
"loopq stack_push_loop\n\t"
|
||||
"call stack_wrapper\n\t"
|
||||
"addq %%rdx, %%rdx\n\t" // умножаем на 2
|
||||
"addq %%rdx, %%rsp\n\t"
|
||||
"popq %%rsp"
|
||||
:"=a"(result)
|
||||
:"b"(arr), "d"(shift)
|
||||
:"%rcx"
|
||||
);
|
||||
result = task_stack();
|
||||
return result;
|
||||
}
|
||||
|
||||
int main()
|
||||
{
|
||||
LongNum a = { 0x00000000, 0x01000000}; // По факту передача через стек)
|
||||
LongNum b = { 0x10100010, 0x0900000f};
|
||||
LongNum c;
|
||||
|
||||
task_regs(&a, &b, &c);
|
||||
printf("asdfasfasfasfda %lx %lx", c.h, c.l); // Проверим, что сложили +- корректно
|
||||
int nums[2] = {88, 11};
|
||||
stack_wrapper(nums, sizeof(int));
|
||||
return 0;
|
||||
}
|
||||
Reference in New Issue
Block a user