Программирование на языке assembler

Автор работы: Пользователь скрыл имя, 15 Марта 2013 в 19:59, доклад

Описание работы

Після створення процесора 8086 фірма Intel розробила більш досконалі процесори об’єднані під назвою I 80x86, така назва означає, що всі команди мікропроцесора, які виконуються на молодших моделях обов’язково виконуються на старше, отже все ПЗ, які розроблені для процесора 8086 успішно будуть працювати і на останніх моделях 80486 і Pentium. Ми будемо розглядати процесори з точки зору програміста. Не дивлячись на різноманітність моделей процесорів, найбільш важливим з точки зору біології програмування є 8086 як базова модель і 80386 , як перший процесор фірми Intel, який в повному об’ємі реалізував принцип багатозадачності.

Файлы: 1 файл

Assembler.doc

— 316.50 Кб (Скачать файл)

К примеру:

data    segment

mas_w   dw      25 dup (0)

:

code    segment

:       

lea     si,mas_w        ;mas_w - перемещаемый операнд 

 

 

  • В этом фрагменте mas_w - символьное имя, значением которого является начальный адрес области памяти размером 25 слов. Полный физический адрес этой области памяти будет известен только после загрузки программы в память для выполнения. 
  • Счетчик адреса - специфический вид операнда. Он обозначается знаком $.  
    Специфика этого операнда в том, что когда транслятор ассемблера встречает в исходной программе этот символ, то он подставляет вместо него текущее значение счетчика адреса. Значение счетчика адреса, или, как его иногда называют, счетчика размещения, представляет собой смещение текущей машинной команды относительно начала сегмента кода.  
    В формате листинга счетчику адреса соответствует вторая или третья колонка (в зависимости от того, присутствует или нет в листинге колонка с уровнем вложенности). Если взять в качестве пример любой листинг, то видно, что при обработке транслятором очередной команды ассемблера счетчик адреса увеличивается на длину сформированной машинной команды. Важно правильно понимать этот момент.  
    К примеру, обработка директив ассемблера не влечет за собой изменения счетчика. Директивы, в отличие от команд ассемблера, - это лишь указания транслятору на выполнение определенных действий по формированию машинного представления программы, и для них транслятором не генерируется никаких конструкций в памяти. В качестве примера использования в команде значения счетчика адреса можно привести следующий:

jmp $+3 ;безусловный переход на команду mov 

cld ;длина команды cld составляет 1 байт 

mov al,1   

При использовании  подобного выражения для перехода не забывайте о длине самой  команды, в которой это выражение  используется, так как значение счетчика адреса соответствует смещению в сегменте команд данной, а не следующей за ней команды. В нашем примере команда jmp занимает 2 байта. Но будьте осторожны, длина команды зависит от того, какие в ней используются операнды. Команда с регистровыми операндами будет короче команды, один из операндов которой расположен в памяти. В большинстве случаев эту информацию можно получить, зная формат машинной команды и анализируя колонку листинга с объектным кодом команды.  Регистровый операнд - это просто имя регистра. В программе на ассемблере можно использовать имена всех регистров общего назначения и большинства системных регистров.

mov al,4 ;константу 4 заносим в регистр al 

mov dl,pass+4 ;байт по адресу pass+4 в регистр

dl 

add al,dl ;команда с регистровыми

операндами

  • Базовый и индексный операнды. Этот тип операндов используется для реализации косвенной базовой, косвенной индексной адресации или их комбинаций и расширений. 
  • Структурные операнды используются для доступа к конкретному элементу сложного типа данных, называемого структурой. 
  • Записи (аналогично структурному типу) используются для доступа к битовому полю некоторой записи.

Операнды являются элементарными  компонентами, из которых формируется  часть машинной команды, обозначающая объекты, над которыми выполняется операция.  
В более общем случае операнды могут входить как составные части в более сложные образования, называемые выражениями.  
Выражения представляют собой комбинации операндов и операторов, рассматриваемые как единое целое.

Результатом вычисления выражения может быть адрес некоторой ячейки памяти или некоторое константное (абсолютное) значение.

Возможные типы операндов мы уже  рассмотрели. Перечислим теперь возможные  типы операторов ассемблера и синтаксические правила формирования выражений ассемблера.

Арифметические операторы Операторы сдвига Операторы сравнения Логические операторы Индексный оператор Оператор переопределения типа Оператор переопределения сегмента Оператор именования типа структуры Оператор получения сегментной составляющей адреса выражения Оператор получения смещения выражения 

В табл. 2 приведены поддерживаемые языком ассемблера операторы и перечислены их приоритеты. Дадим краткую характеристику операторов:

  • Арифметические операторы. К ним относятся:
    • унарные "+" и "-";
    • бинарные "+" и "-";
    • умножения "*";
    • целочисленного деления "/";
    • получения остатка от деления "mod".

Эти операторы  расположены на уровнях приоритета 6, 7, 8 в табл. 2. Например,

tab_size equ 50 ;размер массива в байтах

size_el equ 2 ;размер элементов

:

;вычисляется число элементов массива и заносится в

регистр cx 

mov cx,tab_size / size_el ;оператор "/"

  • Рис. 5. Синтаксис арифметических операций
  • Операторы сдвига выполняют сдвиг выражения на указанное количество разрядов (рис. 6). Например,

mask_b equ 10111011

:

mov al,mask_b shr 3 ;al=00010111

  • Рис. 6. Синтаксис операторов сдвига
  • Операторы сравнения (возвращают значение "истина" или "ложь") предназначены для формирования логических выражений (см. рис. 7 и табл. 1). Логическое значение "истина" соответствует цифровой единице, а "ложь" - нулю. Например,

 

tab_size equ 30 ;размер таблицы

mov al,tab_size ge 50 ;загрузка размера

таблицы в al 

cmp al,0 ;если tab_size < 50, то 

je m1 ;переход на m1

:

m1: :


  • В этом примере если значение tab_size больше или равно 50, то результат в al равен 0ffh, а если tab_size меньше 50, то al равно 00h. Команда cmp сравнивает значение al с нулем и устанавливает соответствующие флаги в flags/eflags. Команда je на основе анализа этих флагов передает или не передает управление на метку m1.
  • Рис. 7. Синтаксис операторов сравнения
  • Таблица 1. Операторы сравнения

Оператор

Значение

eq

ИСТИНА, если выражение_1 равно выражение_2

ne

ИСТИНА, если выражение_1 не равно выражение_2

lt

ИСТИНА, если выражение_1 меньше выражение_2>ИСТИНА, если выражение_1 не равно выражение_2

le

ИСТИНА, если выражение_1 меньше или равно  выражение_2

gt

ИСТИНА, если выражение_1 больше выражение_2

ge

ИСТИНА, если выражение_1 больше или равно  выражение_2


  • Логические операторы выполняют над выражениями побитовые операции (рис. 8). Выражения должны быть абсолютными, то есть такими, численное значение которых может быть вычислено транслятором. Например:

 

flags   equ     10010011        

mov    al,flags xor 01h        ;al=10010010;пересылка в al поля flags с                                       

;инвертированным пр

 

авым битом


 

 

 

  • Рис. 8. Синтаксис логических операторов
  • Индексный оператор [ ]. Не удивляйтесь, но скобки тоже являются оператором, и транслятор их наличие воспринимает как указание сложить значение выражение_1 за этими скобками с выражение_2, заключенным в скобки (рис. 9). Например,

mov     ax,mas[si]      ;пересылка слова по адресу mas+(si) в регистр ax


  • Рис. 9. Синтаксис индексного оператора
  • Заметим, что в литературе по ассемблеру принято следующее обозначение: когда в тексте речь идет о содержимом регистра, то его название берут в круглые скобки. Мы также будем придерживаться этого обозначения.  
    К примеру, в нашем случае запись в комментариях последнего фрагмента программы mas + (si) означает вычисление следующего выражения: значение смещения символического имени mas плюс содержимое регистра si.
  • Оператор переопределения типа ptr применяется для переопределения или уточнения типа метки или переменной, определяемых выражением (рис. 10).  
    Тип может принимать одно из следующих значений: byte, word, dword, qword, tbyte, near, far. Например,

d_wrd   dd      0

...       

mov     al,byte ptr d_wrd+1 ;пересылка второго байта из двойного слова


  • Поясним этот фрагмент программы. Переменная d_wrd имеет тип двойного слова. Что делать, если возникнет необходимость обращения не ко всей переменной, а только к одному из входящих в нее байтов (например, ко второму)? Если попытаться сделать это командой  
    mov al,d_wrd+1, то транслятор выдаст сообщение о несовпадении типов операндов. Оператор ptr позволяет непосредственно в команде переопределить тип и выполнить команду.
  • Рис. 10. Синтаксис оператора переопределения типа
  • Оператор переопределения сегмента : (двоеточие) заставляет вычислять физический адрес относительно конкретно задаваемой сегментной составляющей: "имя сегментного регистра", "имя сегмента" из соответствующей директивы SEGMENT или "имя группы" (рис. 11). Этот момент очень важен, поэтому поясню его подробнее. При обсуждении сегментации мы говорили о том, что микропроцессор на аппаратном уровне поддерживает три типа сегментов - кода, стека и данных. В чем заключается такая аппаратная поддержка? К примеру, для выборки на выполнение очередной команды микропроцессор должен обязательно посмотреть содержимое сегментного регистра cs и только его. А в этом регистре, как мы знаем, содержится (пока еще не сдвинутый) физический адрес начала сегмента команд. Для получения адреса конкретной команды микропроцессору остается умножить содержимое cs на 16 (что означает сдвиг на четыре разряда) и сложить полученное 20-битное значение с 16-битным содержимым регистра ip. Примерно то же самое происходит и тогда, когда микропроцессор обрабатывает операнды в машинной команде. Если он видит, что операнд - это адрес (эффективный адрес, который является только частью физического адреса), то он знает, в каком сегменте его искать - по умолчанию это сегмент, адрес начала которого записан в сегментном регистре ds.  
    А что же с сегментом стека? Посмотрите раздел "Программная модель микропроцессора", там, где мы описывали назначение регистров общего назначения.  
    В контексте нашего рассмотрения нас интересуют регистры sp и bp. Если микропроцессор видит в качестве операнда (или его части, если операнд - выражение) один из этих регистров, то по умолчанию он формирует физический адрес операнда используя в качестве его сегментной составляющей содержимое регистра ss. Что подразумевает термин "по умолчанию"? Вспомните "рефлексы", о которых мы говорили на уроке 1. Это набор микропрограмм в блоке микропрограммного управления, каждая из которых выполняет одну из команд в системе машинных команд микропроцессора. Каждая микропрограмма работает по своему алгоритму. Изменить его, конечно же, нельзя, но можно чуть-чуть подкорректировать. Делается это с помощью необязательного поля префикса машинной команды (см. формат машинной команды). Если мы согласны с тем, как работает команда, то это поле отсутствует. Если же мы хотим внести поправку (если, конечно, она допустима для конкретной команды) в алгоритм работы команды, то необходимо сформировать соответствующий префикс.  
    Префикс представляет собой однобайтовую величину, численное значение которой определяет ее назначение. Микропроцессор распознает по указанному значению, что этот байт является префиксом, и дальнейшая работа микропрограммы выполняется с учетом поступившего указания на корректировку ее работы. Сейчас нас интересует один из них - префикс замены (переопределения) сегмента. Его назначение состоит в том, чтобы указать микропроцессору (а по сути, микропрограмме) на то, что мы не хотим использовать сегмент по умолчанию. Возможности для подобного переопределения, конечно, ограничены. Сегмент команд переопределить нельзя, адрес очередной исполняемой команды однозначно определяется парой cs:ip. А вот сегменты стека и данных - можно. Для этого и предназначен оператор ":". Транслятор ассемблера, обрабатывая этот оператор, формирует соответствующий однобайтовый префикс замены сегмента. Например,

.code

...       

jmp     met1    ;обход обязателен, иначе поле ind

будет трактоваться ;как очередная команда

ind     db      5       ;описание поля данных в сегменте команд

met1:

...

mov al,cs:ind ;переопределение сегмента позволяет работать с                       

;данными, определенными внутри сегмента кода


  • Рис. 11. Синтаксис оператора переопределения сегмента
  • Оператор именования типа структуры . (точка) также заставляет транслятор производить определенные вычисления, если он встречается в выражении. 
  • Оператор получения сегментной составляющей адреса выражения seg возвращает физический адрес сегмента для выражения (рис. 12), в качестве которого могут выступать метка, переменная, имя сегмента, имя группы или некоторое символическое имя.

Рис. 12. Синтаксис оператора получения сегментной составляющей

  • Оператор получения смещения выражения offset позволяет получить значение смещения выражения (рис. 13) в байтах относительно начала того сегмента, в котором выражение определено.

Рис. 13. Синтаксис оператора получения смещения

Например,

 

.data

pole    dw      5

...

.code

...       

 mov     ax,seg  pole       

mov     es,ax        

mov     dx,offset       pole    ;теперь в паре es:dx полный адрес pole


 

 

Как и в языках высокого уровня, выполнение операторов ассемблера при  вычислении выражений осуществляется в соответствии с их приоритетами (см. табл. 2). Операции с одинаковыми приоритетами выполняются последовательно слева направо. Изменение порядка выполнения возможно путем расстановки круглых скобок, которые имеют наивысший приоритет.

Таблица 2. Операторы и их приоритет

Оператор

Приоритет

length, size, width, mask, (, ), [, ], <, >

1

.

2

:

3

ptr, offset, seg, type, this

4

high, low

5

+, - (унарные)

6

*, /, mod, shl, shr

7

+, -, (бинарные)

8

eq, ne, lt, le, gt, ge

9

not

10

and

11

or, xor

12

short, type

13

Информация о работе Программирование на языке assembler