diff --git a/01-asm-basics/README.md b/01-asm-basics/README.md index 7541b52..a8fcceb 100644 --- a/01-asm-basics/README.md +++ b/01-asm-basics/README.md @@ -139,3 +139,8 @@ void set_input_mode() UPD 12.09.24 22:00: в самый последний момент преподаватель решил в своей методички пингануть адрес в памяти, который в ms-dos отведен для хранени данных BIOS, а конкретнее ту часть, которая отведена под системные часы насколько я понимаю. В случае DOS это вполне себе реальная память, которая вполне себе реально существует более того, в досе процессор находится в режиме реальных адресов. Linux в свою очередь относится к приколам с обращением к произвольному участку памяти как к уязвимостям, поэтому не дает просто почитать или пописать в непромапаную память. Но это пол беды на самом-то деле, ведь вся память у любой программы виртуальная и уже на уровне операционной системы и процессора перегонятся в виртуальную, поэтому даже если я воспользуюсь `mmap` и промапаю соответствующий адрес в памяти, в нем будет просто лежать мусор и не более. Поэтому последнюю часть работы, где достается время из памяти BIOS я пропускаю за невозможностью ее выполнить на машине на базе Linux +## Замеры времени ассемблерной команды + +Мне лабораторную работу зачли и без этой части, но если кто-то будет сдавать ему лабу так же как и я, такое возможно не проканает, поэтому для решения задачи замера приложен файлик time.asm (по крайней мере должен быть, если я не забыл). В нем в комментариях я постарался пояснить все этапы замера времени. Но для базового понимания придется сделать некоторые пояснения относительно организационных решений. В методичке преподаватели предпочли обратиться к чтению из промапаной области памяти BIOS, так называемой BIOS data area. Неплохой вариант, если есть прямой доступ к памяти устройства, поскольку BIOS хранит в памяти довольно много полезных данных. Однако из пользовательских программ простучать эту память не получается, потому что linux будет выдавать ошибку даже если такие программы запускать под рутом. + +Однако как же тогда получать время и делать другие манипуляции? Довольно просто на самом деле - системными вызовами. Системный вызов - это программное прерывание, которое просит операционную систему в режиме ядра выполнить какую-то работу: получить время, установить время, поменять разрешения на порты, сменить режимы терминала и очень многое другое вплоть до создания X-server'а. Найти системные вызовы можно прогуглив `linux syscalls table`. От себя порекомендую этот [сайт](https://syscalls.mebeim.net/?table=x86/64/x64/latest). Они вытаскивают системные вызовы из каждой версии ядра. Также возможный, пусть и требующий значительно больше знаний вариант - посмотреть стандартную библиотеку вашего компилятора C. Дело в том, что сам язык C довольно мал и весь его огромный функционал завязан на не таком уж и большом количестве зарезервированных слов и конструкций. В целом сопоставление между C и ассемблером, если компилировать без оптимизаций компилятора (`-O0`), выходит довольно однозначное. И эта же особенность заставляет постоянно переписывать те библиотеки в C, которые зависят от системы или архитектуры. **Не мудрено, что и системные вызовы тоже хранятся где-то в заголовках**. Однако я тут ничего не подскажу, так как так и не понял, где эти номера нормально записаны. Если вы знаете - пишите. diff --git a/01-asm-basics/time.asm b/01-asm-basics/time.asm index 458ce24..f5eae33 100644 --- a/01-asm-basics/time.asm +++ b/01-asm-basics/time.asm @@ -1,10 +1,21 @@ +; Эта директива делает функцию видимой. +; По умолчанию в ассемблере используется _start, +; но поскольку для вывода на экран я пользуюсь +; С'шной функцией prinf, для корректного подключения библиотек на этапе линковки global main +; Объявляю, что буду ссылаться на метку printf, которой нет внутри кода программы +; extern вообще обзначает, что метка объявлена где-то еще extern printf +; тут объявлен макрос CLOCK_REALTIME, который на этапе ассемблирования заменится на число 0 +; Использован он тут, так как является clock_id, о котором будет сказано позже. И я не уверен +; что на всех системах это число будет одинаково. Свое я посмотрел в файлах компилятора. %define CLOCK_REALTIME 0 -; struct timespec { time_t tv_sec; long tv_nsec; } +; так в ассемблере задаются структуры. Существуют они лишь на уровне препроцессора +; да и применение их весьма специфично. Но подробнее лучше погуглите +; struct timespec { time_t tv_sec; long tv_nsec; } - это шаблон из C struc timespec .tv_sec: resq 1 .tv_nsec: resq 1 @@ -12,18 +23,23 @@ endstruc section .note.GNU-stack ; чтобы не жаловался линкер +; Секция с данными, ее особенность в том, что нужно указать лишь сколько нужно зарезервировать section .bss - -start: ; uses timespec model - times 2 resq 1 +; вообще можно было бы использовать istruc и создать эти 2 структуры в .data, но я решил, +; что не хочу тратить время на инициализацию того, что и так будет перезаписано +; обе эти инструкции просто нужны чтобы застолбить по 16 памяти на каждый замер времени +; потому что time_t и long имеют размер 8 байт, а поля 2 +start: + resq 2 finish: - times 2 resq 1 + resq 2 +; Секция с данными, которые заранее заполняются чем-то section .data - fstring db "Operations took %ul seconds and %ul milliseconds", 10, 0 - flen equ $-fstring + fstring db "Operations took %ul seconds and %ul nanoseconds", 10, 0 ; строки стиля C должны оканчиваться нулем + flen equ $-fstring ; длина строки. $ - это текущий адрес. Подробнее не буду рассказывать - мне лень section .text @@ -33,13 +49,15 @@ main: ; лично в моей системе time_t представляет и mov rsi, start syscall - ; insert your code here - mov rcx, 20000 + ; здесь место для кода под замер времени + mov rcx, 20000 ; сколько раз нужно прогнать цикл + ; цикл looper: mov rax, start - loop looper + loop looper ; про это чуть позже узнаете + ; замеряем время второй раз mov rax, 228 mov rdi, CLOCK_REALTIME mov rsi, finish @@ -50,18 +68,30 @@ main: ; лично в моей системе time_t представляет и mov rsi, [finish + timespec.tv_sec] sub rsi, [start + timespec.tv_sec] - ; миллисекунды + ; наносекунды mov rdx, [finish + timespec.tv_nsec] sub rdx, [start + timespec.tv_nsec] + ; вызываем функцию printf. Согласно соглашению о вызовах fastcall + ; при вызове функций для передачи аргументов используются регистры по порядку следования аргументов + ; rdi, rsi, rdx, rcx, r8, r9, а остальные пушатся в ассемблер. + ; Свои заморочки там с числами с плавающей точкой, но об этом не сейчас mov rdi, fstring mov rax, 0 + ; Вот тут все во имя выравнивания стека. Об этом я сейчас рассказывать не буду, только если попросят в readme чиркану sub rsp, 8 + ; собственно вызов функции. На самом деле это обычный jmp, который предварительно пушит в стек адрес возврата. + ; в будущем будьте аккуратнее с этими приколами, потому что при встрече ключевого слова ret ассемблер всегда. + ; подчеркиваю ВСЕГДА прочитает 8 байт со стека и передаст туда управление. И как бы что там будет - одному богу ведомо + ; Так что в ваших же интересах следить за тем, чтобы в стеке лежали правильные байты call printf + ; поскольку выравнивание больше не нужно, возвращаем стек в исходное состояние add rsp, 8 exit: + ; Тут происходит системный вызов выхода из приложения. Если его не увидит + ; linux, то он решит, что программа завершилась аварийно mov rax, 60 - mov rdi, 0 + mov rdi, 0 ; код ошибки. если вернется 0 - считается, что ошибок не произошло syscall