Гіпермаркет знань>>Інформатика 9 клас >>Інформатика >> Інформатика: Текстовий редактор Word
Тема: Тексты в компьютерной памяти
Цель урока: познакомиться со способами представления и организации текстов в компьютерной памяти. Компьютер может работать с четырьмя видами информации: текстовой, графической, числовой и звуковой. Одним из самых массовых приложений ЭВМ является работа с текстами: создание текстовых документов и хранение их на магнитных носителях в виде файлов. Почему же работа с тестовой информацией на компьютерах нашла такое большое распространение? Почему за очень короткий срок (10-15 лет) практически на всех предприятиях и во всех организациях, в том числе и в нашей школе, пишущие машинки заменили на компьютеры? Чтобы ответить на эти вопросы рассмотрим отличия обработки и хранения текстов при ручной записи и при создании текстов на компьютере. Включить слайд Обработка и хранение текстов презентации Кодирование текстов
Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать - на экране монитора видна какая-то "абракадабра". Ребята, как вы думаете, почему это происходит? Пока у вас еще нет точного ответа. В конце урока попробуем еще раз ответить на этот вопрос. Включить слайд Компьютерный алфавит презентации Кодирование текстов Для представления информации в компьютере используется алфавит мощностью 256 символов. Чему равен информационный вес одного символа такого алфавита? Вспомним формулу, связывающую информационный вес символа алфавита и мощность алфавита: 2i = N Если мощность алфавита равна 256, то i = 8, и, следовательно, один символ несет 8 бит информации. Всякая информация представляется в памяти ЭВМ в двоичном виде, а это значит, что каждый символ представляется 8-разрядным двоичным кодом. 8 бит = 1 байту, поэтому двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти. Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации. Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки. Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена). На практике можно встретиться и с другой таблицей – КОИ-8 (Код обмена информацией), которая используется в глобальных компьютерных сетях. Рассмотрим таблицу кодов ASCII (учебник, стр.75). Включить слайд Кодирование символов презентации Кодирование текстов Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы. Символы с номерами от 0 до 31 принято называть управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п. Символ 32 - пробел, т.е. пустая позиция в тексте. Все остальные отражаются определенными знаками. Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита. Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер. Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Для букв русского алфавита также соблюдается принцип последовательного кодирования. Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX. От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница"). Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5. Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251. С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов. Ребята, какие будут вопросы по теме урока? Почему иногда текст, состоящий из букв русского алфавита, полученный с другого компьютера, мы видим на своем компьютере в виде "абракадабры"? Ожидаемый ответ. На компьютерах применяется разная кодировка символов русского языка.
Прежде, чем приступить к решению примера, вспомним, Ожидаемый ответ. 1 байт Решение. Слово состоит из 14 букв. Каждая буква является символом компьютерного алфавита и поэтому занимает 1 байт памяти. Слово займет 14 байт = 112 бит памяти, т.к. 1 байт = 8 бит. В чем заключается принципа последовательного кодирования алфавита? Ожидаемый ответ. В таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений
Что обозначает понятие "кодовая страница"? Ожидаемый ответ. Так называется вторая половина кодовой таблицы ASCII, предназначенная для размещения национальных алфавитов, отличных от латинского. Соблюдается ли принцип последовательного кодирования в кодовых страницах? Ожидаемый ответ. Соблюдается Выясним это, решив следующий пример.
Пример 3. С помощью последовательности десятичных кодов: 225 232 242 зашифровано слово бит. Найти последовательность десятичных кодов этого же слова, записанного заглавными буквами.
Самостоятельная практическая работа: (параллельно вызываются ученики для решения примеров у доски)
Домашнее задание: читать: § 13; выполнить ДЗ №10
Надіслала викладач інформатики Чебанюк Олена Вікторовна, к.т.н., «НАУ». Планування з інформатики, підручники та книги онлайн, курси та завдання з інформатики для 7 класу скачати Предмети > Інформатика > Інформатика 7 клас > Текстовий редактор Word (7 клас) > Текстовий редактор Word (7 клас). Конспект уроку і опорний каркас |
Авторські права | Privacy Policy |FAQ | Партнери | Контакти | Кейс-уроки
© Автор системы образования 7W и Гипермаркета Знаний - Владимир Спиваковский
При использовании материалов ресурса
ссылка на edufuture.biz обязательна (для интернет ресурсов -
гиперссылка).
edufuture.biz 2008-© Все права защищены.
Сайт edufuture.biz является порталом, в котором не предусмотрены темы политики, наркомании, алкоголизма, курения и других "взрослых" тем.
Ждем Ваши замечания и предложения на email:
По вопросам рекламы и спонсорства пишите на email: