Обработка текстовой информации

Автор работы: Пользователь скрыл имя, 09 Января 2013 в 13:08, курсовая работа

Описание работы

Революция в автоматизации делопроизводства в офисе в 80-е годы прошлого века стала реально возможна в связи с созданием и широким распространением персональных компьютеров. Персональные компьютеры в первую очередь вытеснили из обращения печатающие машинки, составляющие основу технических средств подготовки печатных документов. Преимущества компьютера, оснащенного специальным текстовым процессором (редактором), перед печатающей машинкой были явными и заключались в том, что обеспечивали значительное повышение удобства, производительности выполнения работ и, самое главное, повышение качества получаемых при

Содержание работы

Введение …………………………………………………………………….………2
1. Текстовые редакторы и текстовые процессоры……………………………3
2.Краткая характеристика текстовых редакторов……………………………5
2.1. Блокнот (программа)…………………………………………………....5
2.2. TextPad …………………………………………………………………….6
2.3. NOTEPAD++…………………………………………………………...…7
3. Краткая характеристики текстовых процессоров…………………………9
3.1. Что выбрать: офисный пакет или отдельный текстовый процессор?..................................................................................................................9
3.2. С какими файлами работают текстовые процессоры……………..9
3.3. OpenOffice.org Pro Writer 3.1………………………………………….11
3.4. «Документы IBM Lotus Symphony»…………………………………11
3.5.AbiWord 2.6.8…………………………………………………………….12
3.6. PolyEdit 5.2……………………………………………………….…..…..13
3.7.. AngelWriter 3.2………………………………………………………….14
3.8. Atlantis Nova 1.0………………………………………………………...15
3.9. WordPad 5.1……………………………………………………….……..16
3.10. Microsoft Office 2007………………………………………………..…17
4. Создание документов в текстовых процессорах………………………….19
4.1. Способы создания документов………………………………………19
5. Ввод и редактирование документа……………………………………...….22
6. Сохранение и печать документов………………………………………….27
7. Форматирование документа………………………………………..……….29
7.1. Форматирование символов……………………………….………….29
7.2. Форматирование абзацев…………………………………………….30
7.3. Нумерованные и маркированные списки……….………………..32
7.4. Стили форматирования……………………………………………...33
7.5.Оглавление документа………………………………………………...34
8. Таблицы………………………………………………………………………...36
9. Гипертекст……………………………………………………………………....38
10. Компьютерные словари и системы машинного перевода текстов……………………………………………………………………………...40
11. Системы оптического распознавания документов.…….………………42
12. Системы распознавания текстов…………………………………………...44
12.1. Обзор и сравнительное тестирование……………………………..44
Заключение………………………………………………………………………..48
Список использованной литературы…………………

Файлы: 1 файл

курсовая.docx

— 2.42 Мб (Скачать файл)

Таблица символов текстового редактора Microsoft Word

Вставка изображений, формул и других объектов в документ. Большинство современных документов содержат не только текст, но и другие объекты (изображения, формулы, таблицы, диаграммы и т. д.). Текстовые редакторы позволяют вставлять в документ изображения, созданные в графических редакторах, таблицы и диаграммы, созданные в электронных таблицах, и даже звуковые и видеофайлы, созданные в соответствующих приложениях.

При решении задач по физике или математике часто необходимо вставлять формулы, которые требуют  двухстрочного представления и  использования специальных математических знаков. Для ввода формул в текстовые  редакторы встроены специальные редакторы формул.

 Формулы закона Ома и корней квадратного уравнения, введенные с помощью редактора формул

Копирование, перемещение  и удаление фрагментов документа. Редактирование документа производится путем копирования, перемещения или удаления выделенных символов или фрагментов документа. Выделение производится с помощью мыши или клавиш управления курсором на клавиатуре при нажатой клавише {Shift}.

Копирование позволяет размножить выделенный фрагмент документа, т. е. вставить его копии в указанные места  документа:

- после выделения фрагмента  документа и ввода команды Копировать выделенная часть документа помещается в буфер обмена (специальную область памяти); 
- с помощью мыши или клавиш управления курсором на клавиатуре курсор устанавливается в определенное место документа и вводится команда Вставить. Копируемый фрагмент документа, хранящийся в буфере обмена, помещается в указанное место; 
- для многократного копирования фрагмента достаточно несколько раз повторить команду Вставить.

Перемещение позволяет вставить копии выделенного фрагмента  в указанные места документа, но удаляет сам выделенный фрагмент.

Удаление позволяет удалить  выделенный фрагмент.

Например, если исходный документ содержит слово "информатика", то после операций копирования, перемещения  и удаления фрагмента текста "форма" документ примет вид, отображенный в таблице ниже.

Операции редактирования документа

Состояние документа

Операция редактирования

Копирование

Перемещение

Удаление

Документ до:

информатика

информатика

информатика

Документ после:

информатика

форма

интика

 форма

интика


 

Поиск и замена. В процессе работы над документом иногда бывает необходимо заменить одно многократно встречающееся слово на другое. Если делать это вручную, то процесс замены отнимет много времени и сил.

К счастью, в большинстве  текстовых редакторов существует операция Найти и заменить, которая обеспечивает автоматический поиск и замену слов во всем документе (например, замену слова "ЭВМ" на слово "компьютер").

 

Поиск и замена слов в  документе


 

Проверка правописания. В процессе создания документа могут быть допущены орфографические ошибки в написании слов и грамматические ошибки в построении предложений.

Ошибки можно исправить, если запустить встроенную во многие текстовые редакторы систему проверки правописания, которая содержит орфографические словари и грамматические правила нескольких языков (это позволяет исправлять ошибки в многоязычных документах). Система проверки правописания не только выделяет орфографические ошибки (красной волнистой линией) и синтаксические ошибки (зеленой волнистой линией), но и предлагает варианты их исправления.

 

Проверка правописания в  документе


 

Проверку правописания текстовые  редакторы могут проводить как  непосредственно в процессе ввода  текста, так и в готовом документе  по команде пользователя.

Автозамена частых опечаток. В процессе ввода текста иногда допускаются опечатки (например, в начале слова случайно вводятся ДВе прописные буквы). В этом случае срабатывает функция Автозамена, которая автоматически исправляет такие опечатки.

Кроме того, каждый пользователь может добавить в словарь автозамены те слова, в которых он часто делает ошибки (например, неправильное "програма" должно заменяться на правильное "программа").

Сохранение исправлений. В процессе работы над документом могут участвовать несколько пользователей.

Настройка параметров автозамены

Исправления, вносимые каждым из них, запоминаются и могут быть просмотрены и распечатаны (вставленные  фрагменты обычно отображаются подчеркнутым шрифтом синего цвета, а удаленные  фрагменты - зачеркнутым шрифтом красного цвета).

Настройка выделения исправлений


 

В процессе работы над окончательной  редакцией документа может быть проведено сравнение исправлений  различных авторов и принят лучший вариант.

 

6. Сохранение и печать документов

Сохранение документов. В процессе сохранения документа необходимо, прежде всего, в иерархической файловой системе компьютера выбрать диск и папку, в которой файл документа необходимо сохранить.

Кроме того, необходимо выбрать  формат файла, который определяет способ хранения текста в файле. Существуют универсальные форматы текстовых  файлов, которые могут быть прочитаны  большинством текстовых редакторов, и оригинальные форматы, которые  используются только определенными  текстовыми редакторами.

Формат ТХТ (только текст, расширение в имени файла txt) является наиболее универсальным текстовым форматом. Файлы, сохраненные в этом формате, могут быть прочитаны приложениями, работающими в различных операционных системах. Достоинством этого формата является небольшой информационный объем файлов, а недостатком то, что не сохраняются результаты форматирования текста.

Формат RTF (расширенный текстовый формат, расширение в имени файла rtf) является также универсальным форматом текстовых файлов, в котором сохраняются результаты форматирования. Недостатком этого формата является большой информационный объем файлов.

Формат РОС (документ Word, расширение в имени файла doc) является оригинальным форматом текстового редактора Microsoft Word. В этом формате полностью сохраняются результаты форматирования. Этот формат фактически является универсальным, так как понимается практически всеми текстовыми редакторами.

Формат Web-страница (расширение в имени файла htm или html) используется для хранения Web-страниц в компьютерных сетях, так как файлы в этом формате имеют небольшой информационный объем, и при этом сохраняются  результаты форматирования. Документы  в этом формате создаются в Web-редакторах, а также могут сохраняться  с использованием многих текстовых  редакторов. Достоинством этого формата  является его универсальность, так  как Web-страницы могут просматриваться  с использованием специализированных программ (браузеров) в любых операционных системах.

Современные текстовые редакторы  обеспечивают автоматическое преобразование текстового файла из одного формата  в другой при его открытии и  сохранении.

Печать документа. Перед выводом документа на печать полезно выполнить предварительный просмотр документа, это позволяет увидеть, как будет выглядеть документ, напечатанный на бумаге с использованием подключенного к компьютеру принтера.

Вид напечатанного документа (например, распределение текста по страницам) может зависеть от используемого  принтера, так как могут несколько  различаться шрифты, используемые в  разных принтерах.

При выводе документа на печать необходимо установить параметры  печати: задать номера выводимых на печать страниц, количество копий документа  и др.

Кроме того, целесообразно  проверить установки самого принтера: ориентацию бумаги, качество бумаги, качество печати и др.

 

7. Форматирование документа

7.1. Форматирование символов

 

Для представления содержания документа в более понятной и  выразительной форме применяется  форматирование. Символы являются основными  объектами, из которых состоит текстовый  документ, поэтому, прежде всего, необходимо правильно установить основные параметры, определяющие их внешний вид: шрифт, размер, начертание и цвет.

Шрифт. Шрифт - это полный набор символов (букв, цифр, знаков пунктуации, математических знаков, а также специальных символов) определенного рисунка. Каждый шрифт имеет свое название, например Times New Roman, Arial, Courier New и др.

По способу представления  в компьютере различаются растровые и векторные шрифты. Для представления растровых шрифтов используются методы растровой графики, когда символы нерифта представляют собой группы пикселей. Растровые шрифты допускают масштабирование только с определенными коэффициентами (например, MS Sans Serif 8, 10, 12 и т. д.). В векторных шрифтах символы описываются математическими формулами и допускают произвольное масштабирование.

Обычно различные символы  шрифта имеют и различную ширину, например буква "Ш" шире, чем буква "А". Однако имеются и моноширинные шрифты, в которых ширина всех символов одинакова. Примером такого шрифта является шрифт Courier New.

Существует и еще одно деление всех шрифтов: шрифты с засечками (например, Times New Roman) и рубленые (например, Arial). Считается, что шрифты с засечками легче воспринимаются глазом, и поэтому в большинстве печатных текстов используются именно они. Рубленые шрифты используют обычно для заголовков, выделений в тексте и подписей к рисункам" Примеры различных шрифтов представлены в таблице:

. Примеры шрифтов  различных типов

Шрифт

Виды шрифта

Times New Roman

информатика

Arial

информатика

Courier New

информатика



 

Размер шрифта. Единицей измерения размера шрифта является пункт (1 пт = 0,376 мм). Размеры шрифтов можно изменять в больших пределах (обычно от 1 до 1638 пунктов), причем в большинстве редакторов по умолчанию используется шрифт размером 10 пт. Ниже приведены примеры представления текста с помощью шрифта различных размеров:

Шрифт размером 16 пт.

Шрифт размером 12 пт.

Шрифт размером 8 пт.

 

 

Начертание и  вид символов. Кроме обычного начертания символов могут применяться полужирное, курсивное и полужирное курсивное начертания.

Можно установить дополнительные параметры форматирования символов: подчеркивание символов различными типами линий, видоизменение вида символов (верхний индекс, нижний индекс, зачеркнутый символ), изменение расстояния между символами (разреженный, уплотненный шрифт) и др.

 Дополнительные  параметры форматирования символов

Параметр форматирования

Внешний вид символов

Тип линии подчеркивания

сплошная, пунктирная, волнистая

Вид символов

верхний индекс, нижний индекс, зачеркнутый


 

Цвет символов. Если планируется многоцветная печать документа, то для различных групп символов можно задать различные цвета, выбранные из предлагаемой текстовым редактором палитры.

7.2. Форматирование абзацев

 

Абзац выделяет в тексте его часть, представляющую законченный  по смыслу фрагмент документа, окончание  которого служит естественной паузой для перехода к новой мысли. В  компьютерных текстовых документах абзац заканчивается управляющим  символом конца абзаца. Ввод конца  абзаца обеспечивается нажатием клавиши {Enter} и отображается символом ¶, если включен режим отображения непечатаемых символов.

Абзац может состоять из любого набора символов, рисунков и  объектов других приложений. Форматирование абзацев позволяет подготовить  правильно и красиво оформленный  документ.

Выравнивание  абзацев. Выравнивание отражает расположение текста относительно границ полей страницы. Чаще всего используют четыре способа выравнивания абзацев: по левому краю, по центру, по правому краю и по ширине.

 

По левому краю – левый край абзаца ровный, а правый край абзаца рваный.

 

По центру – оба края имеют неровные очертания, каждая строка абзаца симметрична по горизонтали относительно середины.

 

По краю правому– правый край ровный, а левый – рваный.

 

По ширине – оба края ровные, т. е. располагаются точно по границам полей страницы. В этом случае последняя строка абзаца ведет себя, как при выравнивании влево.

 

Информация о работе Обработка текстовой информации