Программное обеспеченье многоядерных ОС

Автор работы: Пользователь скрыл имя, 09 Сентября 2013 в 19:05, курсовая работа

Описание работы

В первой главе данной курсовой работы описана структура процессора и почему необходимо развивать вычислительную мощность. Структура многоядерной архитектуры ее достоинства и недостатки.
Во второй главе курсовой работы описаны особенности реализации многоядерной архитектуры: параллельные вычисления, программное обеспечение. В подразделе «Программное обеспечение» описан инструментарий для разработки многопоточных приложений (компиляторы, программные и аппаратные отладчики) поддержку многопоточности на уровне ОС (операционной системы).
И в последней главе работы описаны новейшие классификации и перспективы развития многоядерных процессоров, по мнению крупнейших производителей процессоров.

Содержание работы

Введение
1.Структура многоядерных вычислительных комплексов
1.1 Структура процессора
1.2 Структура многоядерных процессоров
1.3 Основные проблемы создания многоядерных процессоров
1.4 Преимущества многоядерных систем
1.5 Недостатки многоядерных систем
2. Программное обеспеченье многоядерных ОС
2.1 Особенности перехода к параллельным вычислениям
2.2 Инструментальные средства разработки ПО
3. Перспективы развития
Заключение
Список литературы

Файлы: 1 файл

Курсач оригинал.docx

— 171.53 Кб (Скачать файл)

Содержание:

 

Введение

1.Структура многоядерных  вычислительных комплексов

1.1 Структура процессора

1.2 Структура многоядерных процессоров

1.3 Основные проблемы создания многоядерных процессоров

1.4 Преимущества многоядерных систем

1.5 Недостатки многоядерных систем

2. Программное обеспеченье многоядерных ОС

2.1 Особенности перехода к параллельным вычислениям

2.2 Инструментальные средства разработки ПО

3. Перспективы развития

Заключение

Список литературы

 

 

Введение

 

На сегодняшний  день процессоры стали частью нашей  жизни. Они используются в электронных приборах практически во всех сферах человеческой жизни: в армии, медицине, образовании, коммерческой деятельности, быту и т.п. В быту процессоры применяются в телевизорах, телефонах, холодильниках и т.д. Развитие микропроцессоров увеличивает функциональные и вычислительные возможности электронных приборов. Уменьшающейся размер микропроцессоров позволяет встраивать их в более мелкие приборы (такие как телефоны и планшетные компьютеры и т.п), а увеличивающаяся вычислительна мощность процессора позволяет решать более сложные задачи. Для увеличения производительности процессоров используют многоядерные архитектуры.

В первой главе данной курсовой работы  описана структура процессора и почему необходимо развивать вычислительную мощность. Структура многоядерной архитектуры ее достоинства и недостатки.

Во второй главе  курсовой работы описаны особенности реализации многоядерной архитектуры: параллельные вычисления, программное обеспечение. В подразделе «Программное обеспечение» описан инструментарий для разработки многопоточных приложений (компиляторы, программные и аппаратные отладчики) поддержку многопоточности на уровне ОС (операционной системы).

И в последней  главе работы описаны новейшие классификации и перспективы развития многоядерных процессоров, по мнению крупнейших производителей процессоров.

 

 

 

1.Структура многоядерных  вычислительных комплексов

 

1.1 Структура процессора

 

Процессор, центральное  устройство вычислительной машины, выполняющее  заданные программой преобразования информации и осуществляющее управление всем вычислительным процессом и взаимодействием устройств вычислительной машины [1]. На рисунке 1 представлена структура процессора

 

 Структура процессора (Рисунок 1).

многоядерный процессор  архитектура приложение

 В центре современного  центрального микропроцессора находится  ядро – кристалл кремния площадью примерно один квадратный сантиметр, на котором посредством микроскопических логических элементов реализована принципиальная схема процессора, так называемая архитектура [2]. Ядро связано с остальной частью чипа (называемой «упаковка», CPU Package) по технологии «флип-чип» (flip-chip, flip-chip bonding – перевернутое ядро, крепление методом перевернутого кристалла). Эта технология получила такое название потому, что обращенная наружу – видимая – часть ядра на самом деле является его «дном», – чтобы обеспечить прямой контакт с радиатором кулера для лучшей теплоотдачи. С обратной (невидимой) стороны находится сам «интерфейс» – соединение кристалла и упаковки. Соединение ядра процессора с упаковкой выполнено с помощью столбиковых выводов (Solder Bumps). Ядро расположено на текстолитовой основе, по которой проходят контактные дорожки к «ножкам» (контактным площадкам), залито термическим интерфейсом и закрыто защитной металлической крышкой.

 

1.2 Структура многоядерных процессоров

 

Многоядерный процессор  – это центральный микропроцессор, содержащий 2 и более вычислительных ядра на одном процессорном кристалле  или в одном корпусе [1].

Первый микропроцессор Intel 4004 был представлен 15 ноября 1971 г. Корпорацией Intel. Он содержал 2300 транзисторов, работал на тактовой частоте 108 кГц  и стоил $300.

Требования к  вычислительной мощности центрального микропроцессора постоянно росли  и продолжают расти. Но если раньше производителям процессоров приходилось  постоянно подстраиваться под текущие  насущные запросы пользователей ПК, то теперь чипмейкеры идут с большим опережением!

Долгое время  повышение производительности традиционных одноядерных процессоров в основном происходило за счет последовательного  увеличения тактовой частоты (около 80% производительности процессора определяла именно тактовая частота) с одновременным  увеличением количества транзисторов на одном кристалле. Однако дальнейшее повышение тактовой частоты упирается в ряд фундаментальных физических барьеров (поскольку технологический процесс почти вплотную приблизился к размерам атома: сегодня процессоры выпускаются по 45-нм технологии, а размеры атома кремния – приблизительно 0,543 нм):

• во-первых, с уменьшением  размеров кристалла и с повышением тактовой частоты возрастает ток  утечки транзисторов. Это ведет к  повышению потребляемой мощности и  увеличению выброса тепла;

• во-вторых, преимущества более высокой тактовой частоты  частично сводятся на нет из-за задержек при обращении к памяти, так  как время доступа к памяти не соответствует возрастающим тактовым частотам;

• в-третьих, для  некоторых приложений традиционные последовательные архитектуры становятся неэффективными с возрастанием тактовой частоты из-за так называемого  «фон-неймановского узкого места» –  ограничения производительности в  результате последовательного потока вычислений. При этом возрастают резистивно-емкостные  задержки передачи сигналов, что является дополнительным узким местом, связанным  с повышением тактовой частоты.

Применение многопроцессорных  систем также не получило широкого распространения, так как требует  сложных и дорогостоящих многопроцессорных  материнских плат. Поэтому было решено добиваться дальнейшего повышения  производительности микропроцессоров другими средствами. Самым эффективным  направлением была признана концепция  многопоточности, зародившаяся в мире суперкомпьютеров, – это одновременная  параллельная обработка нескольких потоков команд.

 Так в компании Intel родилась Hyper-Threading Technology (HTT) – технология  сверхпоточной обработки данных, которая позволяет процессору  выполнять в одноядерном процессоре  параллельно до четырех программных  потоков одновременно[3]. Hyper-threading значительно  повышает эффективность выполнения  ресурсоемких приложений (например, связанных с аудио- и видеоредактированием, 3D-моделированием), а также работу ОС в многозадачном режиме.

Процессор Pentium 4 с  включенным Hyper-threading имеет одно физическое ядро, которое разделено на два  логических, поэтому операционная система  определяет его, как два разных процессора (вместо одного)[3].

Hyper-threading фактически  стала трамплином к созданию  процессоров с двумя физическими  ядрами на одном кристалле.  В 2-ядерном чипе параллельно  работают два ядра (два процессора), которые при меньшей тактовой частоте обеспечивают большую производительность, поскольку параллельно выполняются два независимых потока инструкций.

Способность процессора выполнять одновременно несколько  программных потоков называется параллелизмом на уровне потоков (TLP – thread-level parallelism). Необходимость в TLP зависит от конкретной ситуации.

 

1.3 Основные проблемы создания многоядерных процессоров

 

• каждое ядро процессора должно быть независимым, – с независимым  энергопотреблением и управляемой  мощностью;

• рынок программного обеспечения должен быть обеспечен  программами, способными эффективно разбивать  алгоритм ветвления команд на четное (для процессоров с четным количеством  ядер) или на нечетное (для процессоров  с нечетным количеством ядер) количество потоков;

 

1.4 Преимущества многоядерных процессоров

 

• возможность распределять работу программ, например, основных задач  приложений и фоновых задач операционной системы, по нескольким ядрам;

• увеличение скорости работы программ;

• процессы, требующие  интенсивных вычислений, протекают  намного быстрее;

• более эффективное  использование требовательных к  вычислительным ресурсам мультимедийных приложений (например, видеоредакторов);

• снижение энергопотребления;

• работа пользователя ПК становится более комфортной;

 

1.5 Недостатки многоядерных процессоров

 

Возросшая себестоимость  производства многоядерных процессоров (по сравнению с одноядерными) заставляет чипмейкеров увеличивать их стоимость, а это отчасти сдерживает спрос. Так как с оперативной памятью одновременно работают сразу два и более ядра, необходимо «научить» их работать без конфликтов. Возросшее энергопотребление требует применения мощных схем питания. Требуется более мощная система охлаждения. Количество оптимизированного под многоядерность программного обеспечения ничтожно мало (большинство программ рассчитаны на работу в классическом одноядерном режиме, поэтому они просто не могут задействовать вычислительную мощь дополнительных ядер). Операционные системы, поддерживающие многоядерные процессоры (например, Windows XP SP2 и выше) используют вычислительные ресурсы дополнительных ядер для собственных системных нужд.

Следует признать, что в настоящее время многоядерные процессоры используются крайне неэффективно. Кроме того, на практике n-ядерные процессоры не производят вычисления в n раз быстрее одноядерных: хотя прирост быстродействия и оказывается значительным, но при этом он во многом зависит от типа приложения. У программ, которые не рассчитаны на работу с многоядерными процессорами, быстродействие увеличивается всего на 5%. А вот оптимизированные под многоядерные процессоры программы работают быстрее уже на 50%.

Лидеры процессоростроения, компании Intel и AMD, считают, что будущее  за параллельными вычислениями и  продолжают последовательно наращивать количество ядер в процессорах.

Появление многоядерных процессоров стимулирует появление  операционных систем и прикладного  программного обеспечения, поддерживающего  многоядерность.

По сообщению  пресс-службы AMD, на сегодня рынок 6-ядерных процессоров составляет не более 2% от общего объема. Очевидно, что для современного покупателя приобретение 6-ядерного процессора для домашних нужд пока почти не имеет смысла по многим причинам. Во-первых, на сегодня практически нет программ, способных эффективно использовать преимущества 6-х одновременно работающих потоков; во-вторых, производители ПК позиционируют 6-ядерные процессоры, как Hi-End-решения, добавляя к оснастке ПК самые современные видеокарты и объемные жесткие диски, – а это в конечном счете еще больше увеличивает стоимость и без того недешевых ПК

 Разработчики Intel говорят: «…в процессе развития  количество ядер будет становиться  всё больше и больше…».

 

 

Раздел 2. Программное обеспеченье многоядерных вычислительных комплексов

 

Расчёт увеличения производительности за счет распараллеливания процессов.

Для расчета увеличения производительности используют закон  Амдала. Закон Амдала гласит, что прирост производительности (S) системы зависит от количества процессоров (N) и доли последовательных операций (c) в программе: S≤1/(с+(1-с)/N).Граничные значения c соответствуют полностью параллельным (c=0) и полностью последовательным (c=1) программам. Если лишь 1/10 часть программы выполняется последовательно, то в принципе невозможно ускорение в десять раз вне зависимости от числа используемых процессоров (ядер)[4]. Важное следствие закона Амдала состоит в том, что максимальный рост производительности (в N раз при N процессорах) недостижим. В противном случае последовательно исполняемая часть программы должна быть равна нулю, что невозможно. Еще одно следствие закона таково: чем меньше доля последовательно исполняемой части программы, тем больше прирост производительности (рис. 1).

 

Рис. 1. Следствия  закона Амдала

Сегодня только небольшая  часть программного обеспечения  может выполняться на многоядерных процессорах, что подтверждают результаты тестов синтетических и предназначенных  для конкретных классов приложений. Реальный рост производительности дают лишь программы, оптимизированные под  много поточность, такие как Adobe Premiere Pro 1.5 и 3DMax. Очень важны разработка и внедрение драйверов устройств, поддерживающих многопоточность. При переходе с одноядерных процессоров на многоядерные приходится принимать во внимание проблему последовательного выполнения.

 

2.1 Особенности перехода к параллельным вычислениям

 

В ней выполнение считается последовательным, если в  какой-то момент одно или более ядер не могут выполнять код одновременно с другими ядрами. Такая ситуация может возникнуть по разным причинам : блокировка при доступе к ресурсам, необходимость синхронизации процессов  или потоков на ядрах, поддержка  когерентности кэш-памяти, неравномерность  загрузки.

Блокировки возникают  из-за невозможности (например, в момент "сбора мусора") одновременного доступа приложений на разных ядрах  к жесткому диску, к устройствам  ввода/вывода или данным приложений. Очень часто параллельные процессы, выполняемые на разных ядрах, нужно  синхронизировать в определенные моменты. Например, приложение на одном из ядер должно использовать промежуточные  данные, которые получает приложение (поток, процесс) на другом ядре. Первое приложение не может продолжить работу до получения этих данных, то есть находится  в состоянии ожидания. В такой  ситуации неизбежны накладные расходы  на синхронизацию приложений (процессов, потоков), выполняемых на разных ядрах. В свою очередь, это обусловливает  снижение эффективности параллельной работы, что находит отражение  в сетевом законе Амдала. Возникает необходимость в поддержке когерентности (согласованности) кэш-памяти для всех ядер при использовании разделяемой памяти.

Информация о работе Программное обеспеченье многоядерных ОС