Ответить на тему  [ 1 сообщение ] 
 
Автор Сообщение
Администратор
Аватар пользователя

Зарегистрирован: 27 ноя 2011, 01:03
Сообщений: 226
Откуда: Москва
Сообщение Сравнительный анализ элегантности архитектур процессоров


Непредвзятый сравнительный анализ элегантности архитектур различных процессоров


Изучение древних языков в первую очередь позволяет
освободить мысль от оков слова, которое воспринимается
как единственное данное... Даже элементарные грамматические
упражнения зачастую заставляют учащегося древним языкам освободиться
от кажущегося ему единственным способа выражения, почувствовать и увидеть
свою мысль настолько многосторонне, насколько ни для кого другого это недоступно.
Александр Гимадеев


Введение


Непрекращающиеся "священные" войны по поводу "x86 процессоры - дерьмо, xxx процессоры - rules" неприятны в первую очередь тем, что они унижают и дисквалифицируют x86-программистов в глазах всей остальной программистской общественности. Они лишают новичков уважения к x86-архитектуре.

Причем подавляющее большинство защитников x86-архитектуры, с представителями других процессорных семейств знакомы в лучшем случае понаслышке, а противники x86-архитектуры (львиную долю которых составляют поклонники PDP-11), склонны ухватываться за отдельные, непринципиальные архитектурные особенности, которые в x86 реализованы несколько иначе, чем в их любимом процессоре. В общем, аргументы обеих сторон носят глубоко необъективный и бездоказательный характер, сводящийся в основном к ругани и наездам в стиле: "...мне пришлось как-то переносить Форт с PDP-11 на i8086, причем последний я видел впервые... так от архитектуры i8086 до сих пор тошнит (особенно по сравнению с PDP-11)", "господи, до чего трудно было преодолеть рвотный барьер, осваивая после 5 лет работы на PDP-11 это интеловское смоляное чучелко. :( Кто работал на PDP-11, думаю, подтвердит".

Мыщъх'ем была предпринята попытка если не поставить точку в этом вопросе, то по крайней мере дать спорящим сторонам свежую пищу для размышлений (как знать, быть может после этого в конференциях вместо реплик "сам дурак" наконец-то зазвучат нормальные технические аргументы). Сразу оговоримся, что ниже будут сравниваться исключительно программные модели нескольких, наиболее "культовых" процессоров. В первую очередь это, конечно, PDP-11 - легендарнейший процессор всех времен и народов, породивший огромное количество клонов (и отечественные кальки К1801, в частности), многие из которых исправно работают и поныне; затем серию процессоров 68K от Motorola, известную в первую очередь по Эпплам ранних моделей и едва не ставшую основой для IBM PC. Наконец, для полноты картины мы рассмотрим процессоры семейства DEC Alpha. Мне могут возразить, что сравнивать Альфу со всеми вышеперечисленными процессорами не совсем корректно, поскольку он совсем из другой категории. Именно так! И поэтому это лишь усиливает контраст! (Кроме того, Альфа окутана таким количеством мифов, домыслов и легенд, что близкое знакомство с ней никому не помешает).

Сравнительный анализ охватывает как ключевые архитектурные концепции, так и индивидуальные непринципиальные архитектурные особенности - такие, например, как наличие в PDP-11 команды обнуления, отсутствующей в x86 и вынуждающей программистов использовать либо пересылку непосредственного нуля, либо логическую операцию XOR, что с одной стороны ничуть не ухудшает технические характеристики программы, но с другой - создает впечатление уродства архитектуры.


Система команд


Это ведь действительно так - x86 обладает самой
идиотской архитектурой и самым нелепым набором команд
из всех ныне существующих процессоров. Так что, желание
изучить его досконально кажется мне весьма сомнительным.
V. S. Lugovsky aka Mauhuur


Отличительной особенностью x86 является чрезвычайно богатый набор машинных команд, количество которых в старших моделях Pentium'ов достигает пятисот, что значительно превышает количество команд во всех остальных популярных процессорах, вместе взятых! Разумеется, само по себе число поддерживаемых машинных команд еще ни о чем не говорит, напротив - даже вызывает некоторые сомнения в их элегантности. Вспоминается анекдот десятилетней давности: встречаются как-то представители двух функционально одинаковых заводов, один из которых расположен в СССР, а другой - в Японии. Вот японский представитель и говорит "На моем заводе работают восемь человек". А русскому стыдно сказать, что у него работает целая тысяча и он, слегка приукрашивая действительность, скашивает количество работающих до девяти. На следующий день заметно нервничающий японец спрашивает нашего: слушай, я всю ночь не спал, но так и не смог понять: что же у тебя девятый рабочий делает-то?

Действительно, чтобы полноценно программировать на ассемблере x86, нужно очень многому научиться и лишь немногим программистам удается удержать весь этот набор команд у себя в голове. Постоянным спутником программистов становятся тысячи страниц технической документации и вместо того, чтобы сосредоточиться непосредственно на решаемой задаче, программист вынужден снова и снова штудировать многочисленные руководства, пытаясь разобраться - в какую же форму следует облечь свою программистскую мысль, чтобы донести ее до "тупой" машины. Ассемблерные программисты уже улыбнулись? И правильно! Ведь большая часть этих пятисот команд относится к векторной и мультимедийной обработке, т.е. прямо-таки скажем, к весьма специфичным областям. Избыточность - она, конечно, карман не тянет (во всяком случае, карман программиста, про производителей процессоров мы намеренно не говорим), но вот многословность, междоусобная обособленность и косность системы команд уродуют листинги только так! Вот только несколько примеров: отсутствие адресации память-память не позволяет обрабатывать переменные, находящиеся в памяти без пересылки их содержимого во временный регистр (и это при том, что количество регистров общего назначения в x86 процессоров крайне невелико); команды x86 сопроцессора используют свои - причем, крайне примитивные - способы адресации, а потому и синтаксически, и архитектурно обосабливаются от целочисленных команд, что существенно затрудняет как их изучение, так и работу с ними; ряд машинных команд жестко связан со строго определенными регистрами и за счет этого произвола многие из них практически полностью обессмысливаются (в частности, привязка счетчика цикла к регистру ECX/CX не позволяет реализовывать вложенные циклы). Наконец, раздельная адресация оперативной памяти и портов ввода/вывода...

Процессоры семейства PDP-11 и 68K обходятся значительно меньшим количеством команд, причем удобство их ассемблера было столь велико, что позволяло ему на равных конкурировать с Си и другими языками высокого уровня. Теперь, конечно, программистские веяния изменились и ассемблер неожиданно выпал из их внимания, однако недостатки системы команд x86-процессоров тут совершенно не при чем (хотя некоторые и не разделяют такой точки зрения).

Ограниченный объем журнальной статьи не позволяет мыщъх'у рассказать о достоинствах и недостатках каждого из процессоров во всех подробностях, но это, собственно, и не нужно. Зачем жевать уже жеванное (мыщъх'и к жвачным животным не относятся!), когда табличный материал грызть намного удобнее! Перелопатив кучу страниц документации, мыщъх отделил зерна от плевел и складировал их посреди своей норы, получив в итоге очень внушительную (но зато легкоусваиваемую!) таблицу 1, готовую к непосредственному употреблению (желательно с пивом).


353_1.gif
353_1.gif [ 7.91 KiB | Просмотров: 9451 ]

Рисунок 1. Формат машинных команд x86-процессоров.



/*
* Hello World in gas/NetBSD
* AT/T-Syntax
*
* Compile:
* gas hw.s
* ld -s -o hw a.out
*/

.data

msg:
.string "Hello World\n"

len:
.long . - msg


.text
.globl _start

_start:
push $len /* Laenge */
push $msg /* Adresse */
push $1 /* Stdout */
movl $0x4, %eax /* write */
call _syscall
addl $12, %esp /* Stack bereinigen */

push $0
movl $0x1, %eax /* exit */
call _syscall

_syscall:
int $0x80
ret

Листинг 1. "Hello, World" на x86-ассемблере.

353_2.jpg
353_2.jpg [ 13.82 KiB | Просмотров: 9451 ]

Рисунок 2. Формат машинных команд процессоров PDP-11.

;; Hello world in MIDAS

title hello

start: .open [.uao,,'tty ? 0 ? 0]
.lose %lsfil
move 1, [440700,,[asciz "Hello, world"]]
loop ildb 2,1
skipn 2
.logou 1,
.iot 2
jrst loop

end

Листинг 2. "Hello, World" на PDP-ассемблере.

353_3.gif
353_3.gif [ 2.9 KiB | Просмотров: 9451 ]

Рисунок 3. Формат машинных команд 68k-процессоров.

start:
; Message-String ausgeben
move.l #msg,-(a7)
move.w #9,-(a7)
trap #1
addq.l #6,a7

; auf Taste warten
move.w #1,-(a7)
trap #1
addq.l #2,a7

; Programm beenden
clr -(a7)
trap #1

msg: dc.b "Hello World",10,13,0

Листинг 3. "Hello, World" на 68k-ассемблере.

353_4.gif
353_4.gif [ 4.46 KiB | Просмотров: 9451 ]

Рисунок 4. Формат машинных команд процессора DEC Alpha 21264.


Сводная таблица сравнительной элегантности программной модели различных процессоров



x86PDP68KDEC Alpha
Основные характеристики
Тип процессораCISCCISCCISCRISC
Система команд
Система командБезоперандная, одно и двух операнднаяБезоперандная, одно и двух операнднаяБезоперандная, одно и двух операнднаяБезоперандная, одно, двух и трех операндная
Размер машинной командыОт 1 до 16 байт1, 2 или 3 словаОт 1 до 12 словОдно двойное слово
Типы командПересылки данныхПересылки данныхПересылки данныхПересылки данных
АрифметическиеАрифметическиеАрифметическиеАрифметические
ЛогическиеЛогическиеЛогическиеЛогические
УправленияУправленияУправленияУправления
СистемныеСистемныеСистемныеСистемные
Система кодировки машинных командСинтаксис команд чрезвычайно сложен, инструкции имеют переменную длину и множество факультативных контекстно-чувствительных полейСинтаксис команд чрезвычайно прост, логичен, интуитивно понятенСинтаксис команд довольно сложен, инструкции имеют переменную длину и множество факультативных контекстно-чувствительных полейСинтаксис команд упрощен до предела
Система кодировки команд оптимизированаПо компактностиПо скорости выполнения и легкости чтения в машинных кодахНе оптимизированаПо скорости выполнения в ущерб компактности
ПараллелизмПараллелизм не заложен явно, более того - система команд всячески препятствует созданию суперскалярных процессоровПараллелизм не заложен явно, но создание суперскалярных процессоров в данной системе команд осуществляется легкоПараллелизм не заложен явно, более того - система команд всячески препятствует созданию суперскалярных процессоровПараллелизм не заложен явно, но система команд оптимизирована под параллельное исполнение
ВыравниваниеНаличие команд длиной в байт, вызывает проблемы с выравниваем кодаВсе команды кратны размеру слова и потому всегда выровненыВсе команды кратны размеру слова и потому всегда выровненыВсе команды равны размеру слова и потому всегда выровнены
Происхождение набора командНасильно навязан Data Point, заказавшей Intel разработку чипа для своих терминалов. стремление руководства Intel обеспечить обратную совместимость процессоров последующих поколений с неизбежностью привела к отказу от лучших решений в пользу уже имеющихся.Оригинальный набор команд, разработанный без учета обратной совместимости, что превратило PDP-11 в могильщика огромного количества ранее написанного программного кода и причем очень хорошего кода.Базирующийся на PDP-11, но существенно пересмотренный и переработанный набор командНет данных (по видимому, оригинальная разработка DEC)
Особенности адресации
Минимально адресуемая ячейка памятиБайтБайтБайтБайт
Возможность адресации битовОтсутствуетОтсутствуетЧастично реализованаОтсутствует
Виды адресации основного процессора24 вида адресации: примитивная, несимметричная адресация6 видов адресации: богатая, симметричная18 видов адресации: богатая симметричная адресация, наследующая все лучшее из PDP-11 и добавляющая к ним все сильнейшее из x863 вида адресации: крайне бедная, несимметричная адресация
Регистровая адресацияРегистровая адресацияРегистровая адресацияРегистровая адресация
Непосредственная адресацияНепосредственная адресацияНепосредственная адресация-
Косвенная адресация по непосредственному значению, регистру, сумме одного/двух регистров и непосредственного значения с поддержкой масштабирования в 2, 4 и 8Косвенная адресация по непосредственному значению, регистру или сумме регистра с числомКосвенная адресация по непосредственному значению, регистру или сумме регистра с числом с масштабированием на 2, 4 и 8.Косвенная адресация по сумме регистра с 16-битным смещением
-Дважды косвенная адресация (операнд указатель на указатель)Дважды косвенная адресация (операнд указатель на указатель)-
-Адресация с автоувеличением (автоуменьшением) операнда до/после взятия его значенияАдресация с автоувеличением (автоуменьшением) операнда до/после взятия его значения-
Виды адресации сопроцессораРегистры сопроцессора объединены в кольцевой стек, адресуемый относительно его вершины, причем ряд команд оперирует только значениями, лежащими на вершине стека; адресация команд, взаимодействующих с оперативной памятью, базово-индексная; MMX-команды поддерживают два вида адресации: регистровую и косвенную-Полноценная адресация сопроцессора, включая групповые пересылки данныхВещественные команды используют те же самые способы адресации, что целочисленные
Порты адресуются как памятьНетДаДаДа
Объем непосредственно адресуемой памяти4 Гб (12 Гб, если использовать раздельные стеки для кода, стека и данных, и 16[20] Гб, если динамическую память вынести в отдельный сегмент64 Кб4 Гбот 243 до 264 в зависимости от реализации
Модель памятиСегментная, линейнаяПлоская, страничнаяПлоскаяПлоская
Представление адресов16/32 бит указатель [+ сегмент]16 бит указатель [+ базовый адрес страницы]32 бит указатель43 или 48 бит, расширяемые до 64 бит и транслируемые в 44-битный физический адрес, указатель
Представление смещений (в базово-индексной адресации)16/32 бит8/16 бит8/32 бит16 бит (позор джунглям!)
Возможность получения эффективного адресаДаНетДаДа
МасштабированиеЕсть, на 2, 4, 8 в любой командеНетЕсть на 2, 4, 8 в любой командеНа 4 и 8 только в команде сложения
Поддержка виртуальной памятиДа, встроеннаяЧастичноДа, встроеннаяДа, встроенная
Регистры
Типы регистровЦелочисленные регистры общего назначения (данных и адресов)Целочисленные регистры общего назначения (данных и адресов)Целочисленные регистры данныхЦелочисленные регистры общего назначения (данных и адресов)
-Регистры адресов-
-Вещественные регистры сопроцессора, 80 битВещественные регистры сопроцессора
Кольцевой стек регистров сопроцессора
Векторные регистры сопроцессора
Регистры специального назначенияРегистры специального назначенияРегистры специального назначенияРегистр-указатель команд
Системные регистры-Системные регистрыСистемные регистры
Разрядность целочисленных регистров8, 16, 32163264
Разрядность вещественных регистров64, 80 и 128 бит-80 бит64?
Регистры равноправныРегистры неравноправны: многие команды работают с фиксированными регистрами или огранивают выбор регистраРегистры полностью равноправныРегистры неравноправны и делятся на регистры данных (целочисленные и вещественные) и адресные регистры, но внутри "своих" категорий все они равноправныРегистры равноправны, за исключением того, что вещественные регистры не могут быть указателями
Кол-во регистров общего назначения7 32-битных РОН, 4 из которых устроены так: L8, H8, L16, 32, т.е. трактуются либо как два 8 битных регистра, либо один 16 битный, либо один 32-битный;6 16-битных регистров16 РОН - 8 регистров данных и 8 адресных регистров32 целочисленных регистра
8 80-битных FPU регистров, начиная с P-III: 8 128-битных XMM регистров-8 80-битных регистров сопроцессора32 вещественных регистра
Работа с половинками регистровчастичнонетнетнет
Взаимодействие со специальными регистрами
Непосредственная адресация регистра указателя стекаПоддерживаетсяПоддерживаетсяПоддерживается-
Непосредственная адресация регистра указателя командОтсутствуетПоддерживаетсяПоддерживаетсяОтсутствует
Операнды
Размер операндов основного процессора16, 32 и частично 8 бит16 бит, ограниченно 8 бит8, 16, 32 и очень ограниченно 64 бита64 бит, для операндов в 8, 16 и 32 доступны лишь операции расширения, чтения/записи
Размер операндов сопроцессора32, 64, 80 и начиная с P-III - 128 бит-1 бит - 256 байт32, 64 бит, что позор
Операции над операндами памятиВсе возможные, при условии, что второй операнд не находится в памятиВсе возможныеВсе возможныеЧтение и запись только
Операции над портамиЧтение и запись (включая циклическую обработку), причем в строго определенные регистрыВсе возможныеВсе возможныеЧтение и запись только
Черная дыра, также называемая битовой корзинойОтсутствуетОтсутствуетОтсутствуетПрисутствует - это регистр R31/F31; чтение дает ноль, запись игнорируется
Арифметика
АрифметикаС насыщением (saturation) беззнаковая,---
С насыщением знаковая---
Циклическая (wraparound) беззнаковаяЦиклическая беззнаковаяЦиклическая беззнаковаяЦиклическая беззнаковая
Циклическая знаковаяЧастично: циклическая знаковаяЦиклическая знаковаяЦиклическая знаковая
Поддержка векторных операцийДа, начиная с Pentium MMXОтсутствуетОтсутствуетОтсутствует
Типы данных
Типы данных основного процессораОграниченно биты?Биты-
Ограниченно битовые поля?Битовые поля-
BCD-BCD-
Строки--
Байтовые целыеБайтовые целыеБайтовые целыеОграниченно байты
Словные целыеСловные целыеСловные целыеОграниченно слова
Двухсловные целые-Двухсловные целыеОграниченно двойные слова
--Четвертные целыеЧетвертные слова
Типы данных сопроцессораfloat-floatVAX F_floating (32-bit)/ IEEE single (32-bit)
double-doubleVAX G_floating (64-bit) - IEEE double (64-bit)
extend-extend-
16-бит целые-16-бит целые-
32-бита целые-32-бита целые-
64-бита целые-64-бита целые-
64-битные BCD-??-битные BCD-
packed byte---
packed word---
packed doubleword---
quadword---
Управление ходом выполнения программы
Команды условных/безусловных переходовПрисутствуютПрисутствуютПрисутствуютПрисутствуют
Условные команды пересылки и/или назначения данныхПрисутствуютПрисутствуютПрисутствуютПрисутствуют
Кол-во и коды условийС (перенос/заем)CCС (перенос/заем)
P (четность)---
A (вспомогательный перенос)---
Z (ноль)ZZZ (ноль),
S (знак),N (знак),N (знак),-
O (переполнение)V (переполнение),V (переполнение),-
--X (расширение)-
Ветвления по условиямC == 0C == 0C == 0C == 0
C == 1C == 1C == 1C == 1
Z == 0Z == 0Z == 0Z == 0
Z == 1Z == 1Z == 1Z == 1
S == 1N == 1N == 1-
S == 0N == 0N == 0
S == OS == OS == O-
S != OS != OS != O
O == 0V == 0V == 0-
O == 1V == 1V == 1
P == 0---
P == 1---
C == 1 | Z == 1C == 1 | Z == 1C == 1 | Z == 1C == 1 | Z == 1
С == 0 & Z == 0С == 0 & Z == 0С == 0 & Z == 0С == 0 & Z == 0
Z == 0 & S == OZ == 0 & S == OZ == 0 & S == O-
Z == 1 | S != OZ == 1 | S != OZ == 1 | S != O-
Z == 1 | S != OZ == 1 | S != OZ == 1 | S != O
CX == 0--
ECX == 0--
--Low Bit Is Clear
--Low Bit Is Set
Влияние флагов сопроцессора на команды управления программойНепосредственно не влияют, поэтому флаг сопроцессора приходится проталкивать через память в регистр флагов или анализировать его вручную-Для анализа состояния имеется специальный набор командУправление прозрачно
Команды пересылки изменяют флагиНетДаДаКоманды пересылки как таковые отсутствуют; имеются команды чтения/записи данных в/из памяти из/в регистр, не изменяющие флагов; для пересылки регистра А в регистр Б используйте мат. операции, например, ADD Б, A, R31
Дистанция условных переходов4 Гб64 К4 Гб4 Мб (позор)
Управление механизмом предсказаний ветвленийОтсутствует, процессор предсказывает ветвления автоматическиОтсутствует, процессор не предсказывает ветвленияОтсутствует, процессор не предсказывает ветвленияВозможность задания направления срабатывания в каждом ветвлении
Сохранение старого значение указателя команд при переходеТолько при вызове подпрограмме на вершине стекаОтсутствуетОтсутствуетПри любом ветвлении в любой целочисленный РОН
Выравнивание
Необходимость выравнивания кодаНе требуетсяОбязательно?Обязательно
Необходимость выравнивания данныхНе требуетсяНе требуетсяНе требуетсяНе требуется
Средства автоматического контроля достоверности полученных результатов
Прерывание при переполненииНетНетНет?При вещественной и целочисленной арифметике
Прерывание при делении на нольТолько при целочисленной арифметике?Только при целочисленной арифметике?Только при вещественном делении
Комплексная микропрограммная поддержка
Стековые операции
Поддержка стекаОдин стекМногоМногоОтсутствует
Поддержка очередейОтсутствуетДаДаОтсутствует
Процедурные средства
Команды вызова процедурЧастично, адрес возврата всегда заносится на вершину стека, параметры передаются вручнуюДа?Адрес возврата может быть сохранен где угодно, аргументы могут передаваться как вручную, так и автоматическиОтсутствуют
Манипуляции с кадром стекаДаНетДаНет
Возврат с автоматическим закрытием кадра стекаЕстьЕсть?ЕстьНет
Команды пересылки
Пересылка групп регистровОграниченно (только в стек)НетДаНет?
Пересылка данных периферийным устройствамДаДаДаНет?
Пересылка непосредственных данныхДаДаДаНет
Команды обмена
Обмен регистровДаНетДаНет?
Обмен ячеек памятиНет?ДаНет
Циклы
Поддержка цикловВесьма ограниченная, поддерживается лишь цикл, стремящийся к нулю, причем счетчик цикла жестко привязан к регистру ECX/CX, при этом команда цикла исполняется крайне неэффективно и ее использование не рекомендуетсяПоддерживается цикл, стремящийся к нулю, счетчик которого может находиться в любом регистре или ячейке памятиОтсутствуютОтсутствуют
Байтовые операции
Байтовые операцииРасширение, извлечение 0 и 1 байта из некоторых регистров, (в MMX: ...)Перестановка байтовПопарное сравнение, извлечение, вставка(!), маскирование, заполнение
Разбить длинное слово, хранящееся в регистры, на байтыНетНетДаНет
Битовые операции
Битовые операции
Подсчет кол-ва битов и др. битовые командыНетНетНет?Есть
Часто используемые математические операции
Команда очисткиОтсутствует, используется команда пересылки непосредственно нуля или XORИмеетсяИмеетсяОтсутствует, но может читаться "черная" дыра
Команда обращения знакаНетЕстьЕстьНет?
Прочие архитектурные особенности
Встроенные средства отладкиЕсть, начиная с Pentium чрезвычайно богатыеЗачаточныеЗачаточныеЗачаточные?
Мониторинг производительностиЕсть, расширенныйОтсутствуетОтсутствуетЕсть: счетчик циклов
Команды предвыборки"Ручная", начиная с P-III и Athlon, и автоматическая, начиная с P-4ОтсутствуетОтсутствуетПрисутствуют
Возможность заливки собственных микропрограммОтсутствуетОтсутствуетОтсутствуетИмеется
Выводы
Субъективные впечатления от удобства программирования на ассемблереОчень развитая система команд, работать с ним легко, приятно и удобно, за исключением незначительных заморочек с отсутствием адресации память-память и жесткой привязки к регистрам в командах IN, OUT, MUL и DIVОчень элегантный и чрезвычайно удобный в работе ассемблер, "делающий" x86 уже за счет развитой системы адресации.Ликвидирует слабые места PDP и обладает практически всеми приятностями x86Крайне обедненный ассемблер, ручная работа на котором превращается из удовольствия в рутину, тем не менее в нем есть свое очарование, за которого его можно полюбить...
Богатство сопроцессораЧрезвычайно богатый набор команд, включая всю тригонометрию и еще много чего-Богатый набор командМинимальный набор команд
Полнота использования процессора компиляторамиНи один компилятор не реализует возможности x86-процессоров в полной мере (особенно это касается векторных операций), поэтому его программирование на ассемблере вполне оправдано"Язык" PDP-11 процессоров легко отображается на язык Си и потому хорошие компиляторы достаточно полно используют возможности процессора"Язык" 68k процессоров легко отображается на язык Си и потому хорошие компиляторы достаточно полно используют возможности процессораЯзык DEC Alpha столь примитивен, что и компилятор, и человек используют его практически с одной и той же эффективностью


Из глубины веков...


"The irony is that the original instruction set was theirs,
and the original motivation was theirs," Mazor said
"...по иронии судьбы этот основополагающий набор инструкций был
не наш, как и исходная постановка задачи.", Стенли Мазор


Ругая Intel за уродливый (с их точки зрения!) набор инструкций, ее противники зачастую даже и не подозревают, что роль компании Intel в становлении x86-набора инструкций более чем скромна. Собственно, "зачастую" - еще слабо сказано. Навряд ли хоть один из спорщиков об этом вообще знает! Но - все по порядку...

...Давным-давно, когда славные шестидесятые уже подходили к концу, а кремниевая революция семидесятых еще и не думала начинаться, молодая и еще совсем неокрепшая компания Intel, неожиданно для себя получила заказ от крупной (по тем временам) японской компании Busicom, поручившей парням из Intel разработку двенадцати микросхем для своих калькуляторов, которым Busicom тогда занималась. Не то, чтобы этот заказ воодушевил руководство Intel, которое прекрасно осознавало, что осуществить такой проект своими силами ей просто нереально, но... в бизнесе - главное "застолбить" за собой заказ, а там... авось что-нибудь да придумаем! Собственно, так и произошло. Ведущий сотрудник Intel примерно в это же самое время обнаружил, что новая метало-оксидно-кремниевая технология дает возможность разместить все компоненты центрального процессора на одной-единственной микросхеме. Сейчас это кажется очевидным, но тогда... Intel просто не поняла, что она изобрела и, проявив чудовищную недальновидность, "слила" эту технологию окончательно замучившей ее Busicom, которая к тому времени уже, вероятно, и не надеялась получить свои микросхемы. В общем, вместо двенадцати заказанных микросхем Intel предложила сделать всего одну супер-микросхему, реализующую функции их всех. Такой поворот событий не очень-то обрадовал японцев (точнее: совсем не обрадовал). По началу они даже едва не отказались, но хорошенько подумав, решили, что лучше синица в руке, чем совсем ничего и... согласились.

Приблизительно в это же самое время до руководства Intel доходит, что было у них в руках и что они упустили. Все, что остается - "лететь в Японию и вести с Busicom переговоры", выкупая у ошарашенных японцев только что проданный им чип назад... Впрочем, вернемся к непосредственному предмету нашего разговора - разработке системы команд для вновь созданного микропроцессора.

Система команд первого в мире микропроцессора, по-видимому, разрабатывалась двумя людьми - собственно самим Тедом Хофом и присоединившемуся к нему впоследствии Стенлом Мэйзором. Другие же источники утверждают, что она была естественным путем содрана с процессоров IBM и Digital. Что ж! Дотошным читателям еще во многом предстоит разобраться, мне же искать описание чипа Intel 4004 и скрупулезно сравнивать его с продукцией остальных компаний просто лень. Как бы там ни было, система команд Intel 4004 не имела будущего и в скором времени умерла, см. http://www.cs.cuw.edu/csc/csc425/4004card.html.

История x86 начала свой отсчет несколько позднее. Немногие подробности этой истории уцелели с той поры и вот практически все, что мне удалось раскопать....

В том же 1969 году Intel получила заказ от техасской компании Computer Terminal Corporation (впоследствии переименованной в Data-Point), на интегрирование разработанного ею процессора в кристалл кремния. Обратите внимание, - именно интегрирование, а отнюдь не самостоятельную разработку, как это было в случае с Busicom. Другими словами, от Intel требовалось создать микропроцессор в полном соответствии со всеми предоставленными спецификациями, в которые, естественно, входило и полное описание набора машинных команд, которые должен быть понимать терминал.

Используемая Data-Point система команд была... нет, не плохой, скорее ее можно назвать примитивной, но - для терминалов(!) вполне достаточной. Действительно, терминалы (даже интеллектуальные!) не особо-то притязательны и излишняя элегантность и архитектурные изыски им абсолютно ни к чему. Сегодня, когда миллиарды транзисторов стоят дешевле качественных компьютерных корпусов (а не этих дребезжащих китайских жестянок), трудно поверить, что еще совсем недавно за каждый транзистор приходилось платить и железо с избыточной функциональностью просто не окупалось. Счетные задачи решал центральный процессор, установленный на главной машине. Терминал занимался лишь вводом и отображением данных, т.е. обеспечивал то, что сегодня называется интерфейсом с пользователем. Ну да, разумеется, никакой интерактивности (в сегодняшнем понимании этого слова) там и не ночевало и основным средством обещания с компьютером была командная строка. Соответственно, и набор инструкций был ориентирован на управление, а не на вычисления и математическую обработку. К тому же, поскольку программное обеспечение терминала, зашитое в его ПЗУ, не меняется каждый день, на удобство программирования терминального процессора всем было глубоко начхать и никакой элегантности от его системы команд попросту не требовалось (кого из нас, сегодняшних, волнует система команд, ну, скажем, процессоров модема?).

Реализация микропроцессора заняла практически три года. Лучшие инженеры компании, увлеченные своими идеями, работали практически на пределе человеческих возможностей, отдавая процессору и дни, и ночи, и выходные. "Они являлись на работу к восьми утра и работали до шести вечера, забывая сделать перерыв на обед. Часто они просыпались задолго до восхода солнца , чтобы опробовать идею, внезапно пришедшую им в голову. Часто семьи разваливались". Когда же "младенец" наконец заработал, компания Data-Point переживала не лучшие времена и потому отказалась выплачивать положенную по контракту сумму, ссылаясь на то, что микропроцессор слишком медлителен и к тому же требует чрезмерно большого количества микросхем поддержки. В качестве отступного компании Intel были переданы все права на систему команд микропроцессора - не слишком-то хорошее утешение, но все-таки лучше, чем совсем ничего.

353_5.jpg
353_5.jpg [ 32.31 KiB | Просмотров: 9451 ]

Рисунок 5. Терминал Data-Point с процессором, построенном на базе мелкой логики.


Такой поворот событий, признаться, сильно озаботил Intel и она начала продвигать микропроцессор 8008 (а именно такое обозначение он получил!) собственными силами. И это - надобно сказать - ей удалось! Новый чип нашел широкое применение не только в микроконтроллерах, но и в первых персональных компьютерах только-только начавших появляться к тому времени. Кстати, одна из распространенных легенд гласит, что первым персональным компьютер был "Альтаир", но это не так! "Альтаир", основанный на 8080, появился несколько позднее. Его опередило достаточно больше количество микро-ЭВМ, и RGS-08 с "Марком", в частности. Конечно, это были очень и очень простые машины, основанные на 8008, который поддерживал набор из 45 команд и мог непосредственного адресовать аж 16 Килобайт (не улыбайтесь - по тем временам эта величина была весьма нехилой).

Вот так, собственно, все и завертелось. Следующий микропроцессор, представленный Intel - 8080 не был, да и не мог быть подлинно революционным. Да, разработчики добавили тридцать новых команд, увеличили непосредственно адресуемое пространство до 64 КБ, кое-что исправили по мелочи, но на принципиальное улучшение архитектуры они не отважились. Да и кому, собственно, принципиально новый процессор был нужен?

На базе 8080 процессора было собрано большое количество микрокомпьютеров, обросших за время своего существования большим количеством программного обеспечения. Операционная система CP/M, текстовой редактор WordStar, база данных dBase... Популярность этих программ была столь велика, что их веяния прослеживаются и до сих пор! А потому всякая мысль об отказе обратной совместимости в последующих моделях процессоров представлялась руководству Intel и экономически, и политически убийственной, но... они все-таки сделали это, благодаря чему все мы сидим под x86, а не решись инженеры Intel в свое время на достаточно рискованный шаг по усовершенствованию архитектуры своего процессора, его бы уже давно вытеснила Motorola 68K или DEC Alpha.

Новое детище - 8086, (кстати, на момент своего рождения заметно обогнавшее и время, и рынок) не обеспечивало с 8080 прямой бинарной совместимости (т.е. не могло выполнять уже откомпилированные программы), и было совместимо лишь на уровне ассемблера, т.е. при наличии исходных текстов проблема переноса решалось простой перекомпиляцией. Система команд претерпела значительные изменения (не все из которых, впрочем, пошли ей на пользу), но вместе с дополнительными возможностями приобрела некоторую плебейскую разношерстность и... печально известную сегментную модель памяти. И откуда эти чертовы сегменты только появились - вздыхали затраханные программисты начала восьмидесятых - конца девяностых. Неужто эти идиоты из Intel не могли придумать, как обойтись без них? Что ж, попробую ответить. Сегменты, собственно, и появились потому, что 8086 опередил свое время, ухитряясь адресовать аж 1 Мб памяти вместо "положенных" ему 64 Кб. Действительно, при побайтовой адресации памяти 16-битные указатели могут "бить" лишь в пределах одного 64 Кб блока, а ведь 8086 и был 16-разрядным! Можно, конечно, пойти на хитрость и адресовать память не байтами, а словами (и некоторые процессоры именно так и делают!) - тогда объем непосредственно адресуемой памяти возрастет до 128 Кб, но... во-первых, это все равно не выход, а во-вторых, такое решение идет вразрез с требованием об обратной совместимости. Наконец, сам объем непосредственно адресуемой памяти, каким бы большим он ни был, еще ничего не дает! И чтобы им эффективно воспользоваться необходимо иметь как минимум возможность создания перемещаемых программ, т.е. попросту говоря, уметь загружать программу в любое место памяти. Многие микрокомпьютеры начала восьмидесятых (в том числе и те, что были собраны на базе 8080) выделяли программам фиксированные участки памяти и потому загрузка нескольких программ становилась весьма проблематичной. (В частности, "Stealth"–отладчики тех лет грузили себя в буфер экранной памяти, отъедая несколько нижних строк – естественно, код отладчика отображался на терминале в виде бессмысленного мусора, зато такой отладчик не конфликтовал с программами!). К более подробному обсуждению преимуществ и недостатков сегментной модели памяти мы еще вернемся, а пока же заметим лишь то, что сегментная организация памяти намного удобнее страничной адресации, используемой в машинах типа PDP-11 и намного дешевле 32-разрядных указателей, используемых в процессорах типа 68K.


09 дек 2011, 11:31
Профиль
Показать сообщения за:  Сортировать по:  
Ответить на тему   [ 1 сообщение ] 

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000 - 2011 phpBB Group.
Design creat de Florea Cosmin Ionut | Translation by WebSok.Ru

закрыть

Советскому бытовому " БК-0011М" посвящается...


Вопреки всем скептикам и недоброжелателям, дело БК живет и развивается. Не за горами день, когда будет выпущен в свет "БК-0012 Pulsar" - расширенный FPGA-клон БК-0011М. Пока же на данном форуме Вы можете ознакомиться с репликами БК-0011М(-01), приставкой Booster-11, репликой контроллера SMK64 (а также его FPGA-клоном - SMK512), аппаратным эмулятором ПЗУ КР1801РЕ2Б, блоками расширения с процессорами ВМ2/ВМ3, и другими интересными материалами и работами.
Ведутся работы по отрисовке в 3D корпусов БК, МСТД, оригинальных клавиатуры, джойстика и мыши, но пока не удается найти их производство по приемлемой цене при малом тираже. Выполнено производство новодельных пленок для клавиатур БК-0011М.
Важным для возрождения БК и его сообщества является новый софт (игры и демо в особености), и они периодически появляются!
Удалось решить многие hard-задачи, но нет системных программистов, востребованных в проекте БК-0012, как минимум для тестирования. Требуется разработка полноценного Win32-компилятора Си в bin-файлы БК.
Релизован полноценный каталогизатор всего софта БК, с удобным интерфейсом. Осталось выполнить собственно большую задачу каталогизации.

Ждем ваших откликов, идей. Сообщайте о данном ресурсе всем, кто увлекался в прошлом БКшкой, присылайте их и свои e-mail для рассылки новостей из мира БК.

nimamov@mail.ru