Автор работы: Пользователь скрыл имя, 30 Мая 2013 в 14:13, курсовая работа
Целью курсовой работы является рассмотрение принципов представления и кодирования различных данных компьютером.
Задачи курсовой работы:
- изучить возможные форматы данных компьютера.
- исследовать принципы кодирования чисел, текста, графики и звука;
- научится работать с программой Microsoft Excel, выполнив практическую часть работы;
ВВЕДЕНИЕ …………………………………………………………….. 3
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ И
КОДИРОВАНИЕ ИНФОРМАЦИИ В КОМПЬЮТЕРЕ
1.1. Компьютерное кодирование чисел ………………………………. 6
1.2. Компьютерное кодирование текста ……………………………… 8
1.3. Компьютерное кодирование графики ……………………………. 10
1.4. Компьютерное кодирование звука ……………………………….. 12
2. ПРАКТИЧЕСКАЯ ЧАСТЬ. ВАРИАНТ 20
2.1. Постановка задачи ………………………………………………… 15
2.2. Описание алгоритма решения задачи ……………………………. 16
ЗАКЛЮЧЕНИЕ ………………………………………………………… 20
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ …
СОДЕРЖАНИЕ
ВВЕДЕНИЕ ……………………………………………………… |
3 |
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ В КОМПЬЮТЕРЕ |
|
1.1. Компьютерное кодирование чисел ………………………………. |
6 |
1.2. Компьютерное кодирование текста ……………………………… |
8 |
1.3. Компьютерное кодирование графики ……………………………. |
10 |
1.4. Компьютерное кодирование звука ……………………………….. |
12 |
2. ПРАКТИЧЕСКАЯ ЧАСТЬ. ВАРИАНТ 20 |
|
2.1. Постановка задачи ………………………………………………… |
15 |
2.2. Описание алгоритма решения задачи ……………………………. |
16 |
ЗАКЛЮЧЕНИЕ ………………………………………………………… |
20 |
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ……………………. |
21 |
ВВЕДЕНИЕ
Кодирование информации - это процесс формирования определенного представления информации. При кодировании информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. С помощью программ для компьютера можно выполнить обратные преобразования полученной информации.
При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Знаки или символы любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования. Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.[2, стр. 8]
Актуальность темы обусловлена все большим внедрением компьютерных технологий в жизнь современного человека, необходимо рассмотреть принцип представления различных данных компьютером.
Целью курсовой работы является рассмотрение принципов представления и кодирования различных данных компьютером.
Задачи курсовой работы:
- изучить возможные форматы данных компьютера.
- исследовать
принципы кодирования чисел,
- научится работать с программой Microsoft Excel, выполнив практическую часть работы;
Объектом исследования являются форматы данных, с которыми работает компьютер, предмет исследования – способы их представления и кодирования.
Работа выполнялась с помощью компьютерных программ Microsoft Word, Microsoft Excel, а также с помощью интернет-обозревателя Mozilla Firefox.
К важнейшим техническим характеристикам персонального компьютера относятся:
1. Разрядность - важнейшая характеристика компьютера, измеряется в битах; она показывает - сколько двоичных разрядов (битов) информации обрабатывается (или передается) за один такт работы микропроцессора, а также - сколько двоичных разрядов может быть использовано для адресации оперативной памяти; компьютеры могут быть соответственно 8-ю, 16-, 32- и 64-разрядными;
2. Тактовая частота – сколько элементарных операций (тактов) выполняет микропроцессор в одну секунду;
3. Емкость оперативной памяти, измеряется в Мбайтах и поставляется в виде модулей, имеющих 2, 4, 8, 16, 32, 64, 128, 256 и более Мбайт
4. Емкость внешней дисковой памяти, измеряется в Мбайтах, Гбайтах и Тбайтах;
5. Тип дисплея и видео карты, обеспечивающих вывод графической информации в режимах:
VGA – 650 X 480 пикселей,
SVGA – 800 X 600, 1024 X 768, 1240 X 1024 и более пикселей;
6. количество цветов – монохромные (черно-белые) и цветные, обеспечивающие 16, 256, 16 млн. и более цветов.
При выполнении данной курсовой работы применялся 64 разрядный ПК, имеющий тактовую частоту микропроцессора 2,5 ГГц, емкость оперативной памяти 8 ГБ, емкость жесткого диска 500 ГБ, дисплей с разрешением 1920*1080.
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ
ИНФОРМАЦИИ В КОМПЬЮТЕРЕ
1.1. Компьютерное кодирование чисел
Существуют два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел.
Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k-разрядной ячейке может храниться 2k различных значений целых чисел.
Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, необходимо:
1) перевести число N в двоичную систему счисления;
2) полученный результат дополнить слева незначащими нулями до k разрядов.
Например, получим внутреннее представление целого числа 1607 в 2-х байтовой ячейке. Переведем число в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в ячейке будет следующим: 0000 0110 0100 0111.
Для записи внутреннего представления целого отрицательного числа (-N) необходимо:
1) получить внутреннее
представление положительного
2) обратный код этого числа заменой 0 на 1 и 1 на 0;
3) полученному числу прибавить 1.
Например, получим внутреннее представление целого отрицательного числа -1607. Воспользуемся результатом предыдущего примера и запишем внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Инвертированием получим обратный код: 1111 1001 1011 1000. Добавим единицу: 1111 1001 1011 1001 - это и есть внутреннее двоичное представление числа -1607.
Формат с плавающей точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p, которую называют порядком: R = m × np.
Представление числа в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:
12.345 = 0.0012345 × 104 = 1234.5 × 10-2 = 0.12345 × 102.
Чаще всего в ЭВМ используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию: 0.1p <= m < 1p. Иначе говоря, мантисса меньше 1 и первая значащая цифра не ноль (p - основание системы счисления).
В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12.345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере - это 2.
Двоичная система счисления (двоичный код) - код, в котором для представления информации используются цепочки бит. Для представления целых чисел используются:
Данный код позволяет унифицировать сложение и вычитание с оговоркой, что если при суммировании чисел в обратном коде длина результата превысит стандартную длину цепочки, то происходит циклический перенос старшего разряда в младший.
Для умножения и деления
обратный код менее удобен, чем
прямой. В основном обратный код
нужен для получения
Дополнительный код (или дополнение до двух) для положительных чисел совпадает с прямым, а для отрицательных чисел получается из обратного кода сложением с 1. Преимущества дополнительного кода перед обратным кодом является упрощение суммирования, т.к. не возникает необходимости в циклическом переносе из старшего разряда в младший.[3]
1.2. Компьютерное кодирование текста
Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.
Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.
Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является таблица кодировки ASCII.
Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.
Сейчас существует несколько различных кодовых таблиц для русских букв (КОИ-8, СР-1251, СР-866, Mac, ISO), причем тексты, созданные в одной кодировке, могут неправильно отображаться в другой. Решается такая проблема с помощью специальных программ перевода текста из одной кодировки в другую. В операционной системе Windows пришлось передвинуть русские буквы в таблице на место псевдографики, и получили кодировку Windows 1251 (Win-1251).
В течение долгого времени понятия «байт» и «символ» были почти синонимами. Однако, в конце концов, стало ясно, что 256 различных символов - это не так много. Математикам требуется использовать в формулах специальные математические знаки, переводчикам необходимо создавать тексты, где могут встретиться символы из различных алфавитов, экономистам необходимы символы валют ($, £, ¥). Для решения этой проблемы была разработана универсальная система кодирования текстовой информации - Unicode. В этой кодировке для каждого символа отводится не один, а два байта, т.е. шестнадцать бит. Таким образом, доступно 65536 (216) различных кодов. Этого хватит на латинский алфавит, кириллицу, иврит, африканские и азиатские языки, различные специализированные символы: математические, экономические, технические и многое другое. Главный недостаток Unicode состоит в том, что все тексты в этой кодировке становятся в два раза длиннее. В настоящее время стандарты ASCII и Unicode мирно сосуществуют.[4, стр. 263]
1.3. Компьютерное кодирование графики
Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части - растровую и векторную графику.
Для представления графической информации растровым способом используется так называемый точечный подход. На первом этапе вертикальными и горизонтальными линиями делят изображение. Чем больше при этом получилось элементов (пикселей), тем точнее будет передана информация об изображении.
Как известно из физики, любой цвет
может быть представлен в виде
суммы различной яркости
Таким образом, растровые изображения представляют собой однослойную сетку точек, называемых пикселями (pixel, от англ. picture element), а код пикселя содержит информацию о его цвете.
Для черно-белого изображения (без полутонов) пиксель может принимать только два значения: белый и черный (светится - не светится), а для его кодирования достаточно одного бита памяти: 1 - белый, 0 - черный.
Пиксель на цветном дисплее может иметь различную окраску, поэтому одного бита на пиксель недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксель, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 - черный, 10 - зеленый, 01 - красный, 11 - коричневый.
На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов: красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций (Таблица 1):
Информация о работе Форматы данных: представление и кодирование информации в компьютере