Автор работы: Пользователь скрыл имя, 19 Мая 2013 в 09:52, реферат
Ақпараттарды не үшін сығамыз және ақпараттарды қандай жолмен сығуға болады?
Шынымен де неге? Мысал ретінде теледидар суретіне жақын бір суреттің қанша жады алып тұрғанын есептеп көрейік.Оның өлшемі – 800х6009 пиксел болсын, ал түсінің реңі 16 мың болсын(Hight Color) яғни әр пикселдің түсі екі байтты кодпен анықталған. 800х600=480000 элемент. 480000х2 байт=960000 байт – бұл 1 мегабайтқа жетпейтін өлшем. Былай қарағанда аз- ақ көрінеді, лазерлі дискіде осындай суреттердің 650 сыйып кетеді.
Кіріспе
Ақпарттарды сығу теориясы
Сығу алгоритмдері
KWE алгоритмі
Хаффман алгоритмі
Қорытынды
Қолданылған әдебиеттер
Сулейман Демирель атындағы университет
СӨЖ
“Ақпараттарды сығу принциптері”
Алматы облысы Қаскелең қаласы 2013ж
Ақпараттарды не үшін сығамыз және ақпараттарды қандай жолмен сығуға болады?
Шынымен де неге? Мысал ретінде теледидар суретіне жақын бір суреттің қанша жады алып тұрғанын есептеп көрейік.Оның өлшемі – 800х6009 пиксел болсын, ал түсінің реңі 16 мың болсын(Hight Color) яғни әр пикселдің түсі екі байтты кодпен анықталған. 800х600=480000 элемент. 480000х2 байт=960000 байт – бұл 1 мегабайтқа жетпейтін өлшем. Былай қарағанда аз- ақ көрінеді, лазерлі дискіде осындай суреттердің 650 сыйып кетеді. Ал егер де фильмдерге келетін болсақ ше? Кинопроекциның стандартты жылдамдығы –секундына 24 кадр. Яғни компакт- дискіде киноның үзіндісін жазуға болады, жылдамдығы 650:24=27 секунд. Бұның қандай пайдасы бар? Ақпараттарды сығудың пайдасы сондай бір көлемге көптеген мөлшерде ақпараттарды сыйғызу болып табылады. Тағы да бір артықшылығы бар, яғни ақпаараттарды алмасу жылдам уақыт мезетінде жүзеге асады.
Ақпараттарды сығудың бірнеше жолдары бар. Оларды екі топқа бөлуге болады: шығынсыз сығу және шығынды сығу. Бірінші жағдайда сығылған ақпарат бастапқа кезінен ауытқымайды. Бұлай әрбір ақпаратты сығуға болады. Ал шығынды сығуда ақпарат өзінің бастапқысынан ауытқиды.
Алғашқы шығынсыз ақпараттарды сығу идеясы 1952 жылы Хафманның текстті құжаттарды сығу әдісінің пайда болуымен түсіндіріледі. Білесіздер ма, тексттің әрбір символы стандартты түрде бір байтпен кодталады. Бірақ мәселе әріптердің біреуі бірнеше рет ал кейбіреулері тек қана бір рет кездесуі мүмкін. Мысалы орыс тілінде жазылған текстте әрбір мың символдың 90 әрпі орташа есеппен «о» әрпі, 72-«е» әрпі және 2—«ф» әрпі. Бәрінен де көп кездесетін пробелдер саны: 174. Егер де көп кездесетін символдарға қысқа кодтарды пайдалансақ(8 биттен төмен), ал аз кездесетіндерге – ұзын кодтарды(8 биттен жоғары) пайдалансақ, онда текстіміз стандартты кодтауға қарағанда аз жады алады.
Көптеген сығу әдістері қайталамалы байттарға және кезекті байттарға негізделеді. Ең қарапайым түрі-RLE11-- суреттерді сығу үшін кеңінен пайдаланылады. Осылай сығылған файлда байттардың неше рет қайталанғаны жазылады. Мысалы. "RRRRRGGGBBBBBBRRRBBRRRRRRR орнына "5R3G6B3R2B7R"12 жазылады. Бұл әдіс егер де сурет бір түсті болса жақсы жұмыс істейді.
Ал басқа әдістер егер де байттар қайталанатын болса, тек қана бір рет бір таблицаға жазып қояды, сосын сол байттың орнын көрсетіп таблицадан шақыруға болады.
Шығынсыз сығу әдісі файлдың өлшемін көп кішірейтпейді. Көп жағдайда сығу коэффициенті 1/3-1/4 тен аспайды. Шығынсыз сығудан әлдеқайда тиімдірек ол шығынды сығу әдісі болып табылады. Бұл жағдайда арнайы зерттеулермен қандай ақпаратты өшіруге болатынын анықтайды.
Мысалы, зерттеулер адамның көзі түстерге онша көңіл аударылмайтынын байқаған, сондықтан көбінесе суреттерде түстерді пикселдерді алып тастауға болатынын көрсеткен. Практикада көбінесе қиын жұмыс істейтін әдіс- JPEG14-ті пайдаланады. Ол суретті ондаған есеге сығады. Сонымен қатар видеосуреттерді де шығынды түрде сығуға болады. Қазіргі кезде ондай әдіс MPEG15 деп аталады. онымен сонымен қатар дыбыстарды да сығуға болады.
Шығынды сығу арнайы программалар арқылы жүзеге асады мысалы графикалық редактор. Ал шығынды сығу әдісі барлық файлдар үшін жұмыс істейді және көптеген компрессор-программалар ARJ, ZIP, RAR, StuffIt және т.б қолданылады.
Сонымен қатар айта кететін нәрсе, сығылған файлдарды тағы мәрте сығудың қажеті жоқ, себебі ол файлды сығатын болсақ оның өлшемі кішкене ғана өзгереді немесе мүлде өлшемі одан сайын өсіп кетеді.
Қандай обьектіде ақпараттың орналасуына байланысты сығудың мынадай түрлерін ажыратады:
KWE тобындағы алгоритм
Ең көп тараған
алгоритм ол- Лемпель-Зив алгоритмі.
Бұл алгоритмнің сөздігі
Бұл алгоритм көбінесе үлкен көлемдегі текстті документтерді сыққанда пайдаланылады.
Хаффман алгоритмі
Хаффман алгоритмінің идеясы- битті группамен кодтау болып табылады. Біріншіден кіретін жиіліктері есептеледі, яғни символдардың неше рет кездесетіндері кестеге жазылады. Сосын барып кестеде олар жиіліктері бойынша кему ретімен орналасады.
Алгоритмнің маңыздысы: егер символ көп кездескен сайын аз битті кодталады. Мысалы: бір текст берілсін, мұнда «А» 10 рет, «В» 8 рет, «С» 6 рет, «D» - 5 рет, «Е» және «F» - 4 рет кірсін.
Символ |
Частота вхождения |
Битовый код |
A |
10 |
00 |
B |
8 |
01 |
C |
6 |
100 |
D |
5 |
101 |
E |
4 |
110 |
F |
4 |
111 |
Сығуға дейін тексттің өлшемі 37 байтқа тең болды, ал сығудан кейін 93 бит болды. Сығу Коэффициенті 32 % тең.хаффман алгоритмі барлық типті файлдар ақпарттар үшін пайдалана береді.
Қорытынды
Бұл өздік жұмысымда мен ақпарттарды сығу дегеніміз және оларды қандай әдістермен сығуға болатыны туралы айтып кеттім. Қазіргі кезеңде ақпарттарды әр түрлі ортаға тасымалдау үшін және оның жылдамдығы тез болу үшін міндетті түрде біз ақпарттарды сығу программаларын пайдаланамыз.
Пайдаланылған әдебиеттер: