Обработка текстовой информации

Автор работы: Пользователь скрыл имя, 09 Января 2013 в 13:08, курсовая работа

Описание работы

Революция в автоматизации делопроизводства в офисе в 80-е годы прошлого века стала реально возможна в связи с созданием и широким распространением персональных компьютеров. Персональные компьютеры в первую очередь вытеснили из обращения печатающие машинки, составляющие основу технических средств подготовки печатных документов. Преимущества компьютера, оснащенного специальным текстовым процессором (редактором), перед печатающей машинкой были явными и заключались в том, что обеспечивали значительное повышение удобства, производительности выполнения работ и, самое главное, повышение качества получаемых при

Содержание работы

Введение …………………………………………………………………….………2
1. Текстовые редакторы и текстовые процессоры……………………………3
2.Краткая характеристика текстовых редакторов……………………………5
2.1. Блокнот (программа)…………………………………………………....5
2.2. TextPad …………………………………………………………………….6
2.3. NOTEPAD++…………………………………………………………...…7
3. Краткая характеристики текстовых процессоров…………………………9
3.1. Что выбрать: офисный пакет или отдельный текстовый процессор?..................................................................................................................9
3.2. С какими файлами работают текстовые процессоры……………..9
3.3. OpenOffice.org Pro Writer 3.1………………………………………….11
3.4. «Документы IBM Lotus Symphony»…………………………………11
3.5.AbiWord 2.6.8…………………………………………………………….12
3.6. PolyEdit 5.2……………………………………………………….…..…..13
3.7.. AngelWriter 3.2………………………………………………………….14
3.8. Atlantis Nova 1.0………………………………………………………...15
3.9. WordPad 5.1……………………………………………………….……..16
3.10. Microsoft Office 2007………………………………………………..…17
4. Создание документов в текстовых процессорах………………………….19
4.1. Способы создания документов………………………………………19
5. Ввод и редактирование документа……………………………………...….22
6. Сохранение и печать документов………………………………………….27
7. Форматирование документа………………………………………..……….29
7.1. Форматирование символов……………………………….………….29
7.2. Форматирование абзацев…………………………………………….30
7.3. Нумерованные и маркированные списки……….………………..32
7.4. Стили форматирования……………………………………………...33
7.5.Оглавление документа………………………………………………...34
8. Таблицы………………………………………………………………………...36
9. Гипертекст……………………………………………………………………....38
10. Компьютерные словари и системы машинного перевода текстов……………………………………………………………………………...40
11. Системы оптического распознавания документов.…….………………42
12. Системы распознавания текстов…………………………………………...44
12.1. Обзор и сравнительное тестирование……………………………..44
Заключение………………………………………………………………………..48
Список использованной литературы…………………

Файлы: 1 файл

курсовая.docx

— 2.42 Мб (Скачать файл)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Краткая характеристики текстовых процессоров

3.1. Что выбрать: офисный пакет или отдельный текстовый процессор?

 

Наиболее популярные текстовые  процессоры входят в состав пакетов  офисных приложений, в то время  как самостоятельные программы  используются реже. Это вполне логично: «пакетный» текстовый процессор  все равно оказывается более  функциональным – за счет интеграции с входящими в пакет приложениями. Кроме того, вместе с офисным пакетом  обычно поставляются галерея изображений  и набор шрифтов.

Если нужен только текстовый  процессор, нет смысла устанавливать  офисный пакет целиком. Сделав выбор  в пользу маленькой программы, вы сэкономите место на диске. Да и работать она будет быстрее, а ее интерфейс  наверняка окажется не перегруженным  и простым для освоения.

3.2. С какими файлами работают текстовые процессоры

Хотя  каждый текстовый процессор обычно имеет свой, «родной», формат, большинство, как правило, способно открывать  и сохранять файлы других форматов. Вот некоторые из них.

RTF – формат, разработанный Microsoft специально для форматированных текстов. Его поддержку обеспечивают практически все текстовые процессоры, а для самых простых (например, WordPad) он является основным.

DOC – формат, который использовался как основной в Microsoft Word до версии 2003 включительно. Он читается практически всеми текстовыми процессорами, и сохранение документов в этом формате в большинстве случаев доступно.

DOCX пришел на смену DOC в Microsoft Office Word 2007 и, по замыслу разработчиков, должен был получить широкое распространение: спецификации его открыты, так что обеспечить его поддержку теоретически ничто не мешает. На практике же он оказался весьма сложным, поэтому «понимающих» его программ пока совсем немного, а сохранение в нем документов – и вовсе редкость.

ODT – открытый формат, разработанный раньше DOCX. Он поддерживается заметно большим числом приложений; в частности, OpenOffice.org Writer (начиная с версии 2.0) использует его в качестве основного.

HTML – формат, в котором хранятся веб-страницы в Интернете. Он хорош прежде всего своей универсальностью. Использует язык гипертекстовой разметки и не является основным ни для одного текстового процессора, но большая их часть с HTML совместима.

 

3.3. OpenOffice.org Pro Writer 3.1

 

В меню OpenOffice.org Pro Writer 3.1 ориентироваться не так-то просто

Проект OpenOffice.org Pro развивается давно и активно, в его текстовом процессоре присутствуют все необходимые средства оформления документа. Он поддерживает стили (предустановлено 20 готовых). Позволяет использовать макросы и внедрять в документы самое разнообразное содержимое. В частности, для вставки можно использовать изображения 26 различных форматов. В программе можно рисовать несложные векторные изображения, используя автофигуры, а также создавать диаграммы и формулы. Writer позволяет открывать документы самых разных форматов: RTF, DOC, DOCX и другие. Расстраивает лишь отсутствие поддержки записи в DOCX. Особая «фишка» Writer – средство ведения библиографической базы данных. К сожалению, высокая функциональность не делает программу удобной в использовании.

 

3.4. «Документы IBM Lotus Symphony»

 

Интерфейс программы  довольно необычен, но удобнее чем  у Writer или Word старых версий

Пакет IBM Lotus Symphony базируется на OpenOffice.org и поэтому по функционалу похож на него. Главное его отличие – существенно переработанный интерфейс. Все приложения пакета доступны в одном окне, а каждый документ открывается в отдельной вкладке, подобно веб-страницам в современных браузерах.

«Документы IBM…» позволяют вне внедрять в документ почти все те же объекты, что и Writer; не хватает только редактора формул. Зато клипарт-галерея здесь больше, и изображения в ней более высокого качества. Число загрузки форматов изображений в «Документы IBM…» - 24. Несколько осложняет работу то, что в состав пакета не включены готовые шаблоны документов. При необходимости их придется создавать самостоятельно.


 3.5.AbiWord 2.6.8

 

AbiWord работает быстрее, чем процессор из полноценных офисных пакетов

Для оформления страниц и  самого текста в AbiWord имеется почти все. Не предусмотрена только возможность настраивать разрядку текста. Для облегчения работы есть набор готовых шаблонов и стилей. А вот набор стилей у AbiWord – целых 37. AbiWord использует свой собственный формат сохранения документов (ABW), однако с помощью плагинов возможно как чтение, так и сохранение документов во всех сколько-нибудь распространенных форматах. Не составляет исключения даже DOCX.

Хотя в текст могут  быть внедрены самые разнообразные  объекты, AbiWord, увы, не предоставляет практически никаких инструментов для их создания (ему доступно лишь создание таблиц). Нет в нем ни инструментов рисования, ни клипарт-галереи, ни редакторов диаграмм и формул.

 

3.6. PolyEdit 5.2

 

PolyEdit распространяется платно, однако к российским прользователям это не относится: для активации используется ключевое слово, например «подарок»

Эта программа довольно сильно отличается от всех остальных наличием ряла специфических функций. При этом, к сожалению, многие востребованные и привычные инструменты в ней отсутствуют.

PolyEdir позволяет вставлять в текст изображения и таблицы. Набор поддерживаемых графических форматов скромен, не так много форматов доступно и для чтения/записи: RTF, DOC и TXT плюс собственный компактный формат PolyEdit – ETF.

Невозможность использовать полей отчасти компенсируется наличием возможности вставки в любое  место документа текстовых фрагментов, от текущей даты до сложных формул. Основной недостаток такого подхода – невозможность автоматического изменения тех или иных значений в ходе редактирования.

Неприятно удивило отсутствие возможности  предпросмотра документа. Как он буде т выглядеть на бумаге, вы узнаете  по завершению печати.

 

 

3.7. AngelWriter 3.2

 

Все для  форматирования, и ничего лишнего

Angel Writer может стать неплохой заменой WordPad – но не более того. Для форматирования текста в ней есть почти все необходимое. Но при этом отсутствуют возможности использования колонтитулов полей.

Работать с большими документами  в Angel Writer неудобно, так как нет стилей. Отсутствуют шаблоны документов, возможность выполнения макросов и работа в режиме рецензирования. Angel Writer позволяет вставлять в текст таблицы, гиперссылки, файлы и изображения семи популярных форматов. Для чтения и сохранения доступны только RTF, HTML и TXT.

Низкая функциональность компенсируется удобство в работе. Практически все нужные элементы вынесены на панель и всегда под  рукой. Меню небольшое и построено  весьма логично. Это отчасти оправдывает  и отсутствие в Angel Writer справочной системы.

 

3.8. Atlantis Nova 1.0

 

Atlantis Nova – единственная из участниц нашего теста, не имеющая русскоязычного интерфейса

В Atlantis Nova не удастся использовать поля и добавить колонтитулы. Она поддерживает стили и шаблоны, но над их созданием придется потрудиться: имеющихся четырех стилей и двух пустых бланков явно недостаточно.

Для оформления текста есть все необходимые инструменты. Правда, оценить, как выглядит документ, можно только в основном окне программы: предпросмотра в Atlantis Nova не предусмотрено.

В текст можно вставить изображение одного из 11 поддерживаемых форматов. Возможность добавления диаграмм, формул и таблиц в программе отсутствует.

Atlantis Nova способна открывать документы в форматах DOC, RTF, TXT и WRI, а вот для сохранения можно выбрать только RTF или TXT. Не понравилось: отсутствует автоматическое сохранение документа.

 

3.9. WordPad 5.1

 

WordPad знаком любому пользователю Windows

Обозначение версии соответствует  Windows, в состав которой входит программа, например версия Windows XP – 5.1, поэтому и встроенный в нее WordPad обозначен аналогично. Функциональность WordPad достаточно низка, чтобы обеспечить приемлемый уровень оформления документа. В нем нельзя даже задать выравнивание текста по ширине страницы, величину межстрочного интервала и другие привычные настройки оформления. Как это ни странно, а программе можно создавать маркированный список, вставлять текущую дату или время и внедрить в текст какой – либо объект, например изображение или формулу. На этом возможности процессора исчерпываются.

WordPad позволяет открывать файлы RTF, DOC, WRI и TXT, однако для сохранения доступны только форматы RTF и TXT (в последнем случае можно выбрать использование одной из трех кодировок).

 

3.10. Microsoft Office 2007

 

Интерфейсом Word 2007 отличается от всех конкурирующих программ и даже от более ранних версий Word

По набору функций Word 2007  оставил позади всех своих бесплатных конкурентов. В нем есть большой набор готовых шаблонов. В работе со стилями в этой версии программы появилось новшество: она не просто включает 16 стилей выбранных по умолчанию, но и позволяет использовать один из 11 наборов (по 16 стилей в каждом).

Word справляется с проверкой не только русской орфографии, но отчасти и пунктуации. И хотя длинные предложения неизбежно ставят программу в тупик, тут она также обходит все бесплатные приложения.

Word позволяет вставлять в документы изображения 20 разных форматов и выполнять базовые операции по их редактированию. Большая клипарт-галерея и возможность рисования с использованием автофигур также помогут в оформлении документов.

Вывод: Все необходимые средства оформления страниц и текста предоставляют только OpenOffice.org Writer и «Документы IBM Lotus Symphony». Остальные участники не имеют тех или иных функций; хуже всего обстоит дело в WordPad: он вообще не имеет средств оформления страниц. Со стилями работают 5 из 8 участников теста, за исключением Angel Writer, PolyEdit и WordPad.

Функция проверки орфографии есть во всех процессорах, кроме WordPad. Вот  только в Angel Writer, Atlantis Nova и «Документы IBM...» воспользоваться ею вам не удастся: русскоязычных словарей для  них нет. С проверкой русской  пунктуации и синтаксиса не справляется  ни одна программа.

Лучшая поддержка распространенных форматов на уровне чтения у «Документы IBM...», Writer и AbiWord (последний – при  установке плагинов). Writer не поддерживает запись в DOCX, а «Документы IBM...» –  в DOCX и HTML. Зато обе они позволяют  экспортировать текст в файлы PDF. По количеству входящих в комплект дополнительных файлов и модулей  лидируют также Writer и «Документы IBM...». Writer единственный имеет приличный  набор шаблонов на русском языке  и редактор формул, но он уступает «Документам IBM...» по количеству и качеству изображений  в клипарт-галерее.

 

4. Создание документов в текстовых процессорах

4.1. Способы создания  документов

 

 

 В текстовых процессорах  для создания документов многих типов  со сложной структурой (письма, резюме, факсы и т. д.) используются мастера. Разработка документа с помощью  мастера производится путем внесения необходимых данных в последовательно  появляющиеся диалоговые панели. Например, можно использовать мастер создания календаря, который должен разместить на странице в определенном порядке  обязательный набор надписей (год, месяц, дата и др.).

 

Создание документов можно  производить с помощью шаблонов, т. е. пустых заготовок документов определенного назначения- Шаблоны задают структуры документов, которые пользователь заполняет определенным содержанием. Текстовые процессоры имеют обширные библиотеки шаблонов для создания документов различного назначения (визитная карточка, реферат и др.).

Однако в большинстве  случаев для создания документов используется пустой шаблон Новый документ, который пользователь заполняет содержанием по своему усмотрению.

Выбор параметров страницы. Любой документ состоит из страниц поэтому в начале работы над документом необходимо задать параметры страницы: формат, ориентацию и размеры полей.

Формат страниц документа определяет их размеры. При создании реферата или  заявления целесообразно выбрать  формат страницы А4 (21 х 29,7 см), который  соответствует размеру стандартного листа бумаги для принтера. Для  объявлений и плакатов подходит формат A3, размер которого в два раза больше стандартного листа. Для писем можно  выбрать формат А5, который в два  раза меньше стандартного листа.

 

Ориентация задает расположение страницы на экране монитора. Существуют две возможные ориентации страницы - книжная и альбомная. Для обычных текстов чаще всего используется книжная ориентация, а для таблиц с большим количеством столбцов - альбомная.

На странице можно установить требуемые размеры полей (верхнего и нижнего, правого и левого), которые  определяют расстояния от краев страницы до границ текста.

Колонтитулы и  номера страниц. Для вывода на каждой странице документа одинакового текста (например, имени автора, названия документа и др.) удобно использовать верхний и нижний колонтитулы. Расстояния от краев страницы до колонтитулов можно изменять.

Страницы документа рекомендуется  нумеровать, причем номера можно размещать  вверху или внизу страницы по центру, справа или слева.

 

Параметры страницы: формат, ориентация, поля, колонтитулы, номер  страницы

 

5. Ввод и редактирование документа

Ввод текста. Основой большинства документов является текст, т. е. последовательность различных символов: прописных и строчных букв русского и латинского алфавитов, цифр, знаков препинания, математических символов и др. Для быстрого ввода текста целесообразно научиться (например, с использованием клавиатурного тренажера) десятипальцевому "слепому" методу ввода символов.

Для представления текстов  могут использоваться 256 или 65 536 символов, однако не все эти символы возможно ввести с клавиатуры компьютера. Для  ввода некоторых знаков математических операций букв греческого алфавита, денежных знаков и многих других символов используются таблицы символов. Для ввода символа его необходимо найти в таблицах и нажать клавишу {Enter}.

Информация о работе Обработка текстовой информации