Кибернетическая теория информации. Новый этап теоретического расширения понятия информации связан с кибернетикой – наукой об управлении и связи в живых организмах, обществе и машинах. Кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа процессов в самоуправляющихся, самоорганизующихся биологических и социальных системах.
Развитая в работах Н. Винера концепция предполагает, что управление в упомянутых системах является процессом переработки информации некоторым центральным устройством, получаемой от источников первичной информации и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения действия. По совершении действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством.
Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (<семантический аспект) и другую – по отношению к получателю, накопленному им знанию, его целям и задачам {прагматический аспект).
Семантические концепции информационного обмена. Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно объекта, привели к созданию логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В этих теориях информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет.
В рассмотренных теоретических конструкциях – статистической и семантической информации – речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.
Понятие «тезаурус»: значение для информационного обмена. Понятие «тезаурус» является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника.
Согласно этой модели, тезаурус – это знания приемника информации о внешнем мире, система категорий и понятий, которыми оперирует в своей мыслительной и практической деятельности человек, в итоге – его способность воспринимать те или иные сообщения. Уровень образования, образ жизни участника информационного обмена в значительной степени определяет глубину содержания и эффективность обмена.
Тезаурус, в широком смысле слова, – это словарный запас человека. Если тезаурус уже содержит информацию, заключенную в сообщении, т. е. он не изменяется с ее получением, то семантическая ценность этого сообщения является нулевой. Очевидно, что к подобной оценке прагматического содержания информации примешивается семантический аспект, скрытый в «установке» тезауруса на осмысление сообщения.
В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, эффективность, экономичность информации, т. е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся кибернетических систем (биологических, социальных, человеко-машинных).
Прагматические концепции информационного обмена. Одной из наиболее ярких прагматических теорий информации является поведенческая модель коммуникации – бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы и наличие альтернативных путей неодинаковой эффективности для достижения цели. Сообщение информативно, если оно изменяет «целеустремленное состояние» получателя.
Так как это состояние характеризуется последовательностью возможных действий, эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация разделяется на «информирующую», «инструктирующую» и «мотивирующую». Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели. Для каждого типа информации бихевиористская модель предлагает свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в «целеустремленном состоянии» до и после его изменения на новое подобное состояние.
Следующим этапом развития прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке для выделения подходящих сообщений, к совокупности которых должны быть применены критерии прагматической ценности.
Формализация знаний: характеристика методов и приемов. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний – процесса, конечная цель которого поместить некоторый объем знаний в своеобразную «упаковку», в которой он может осуществлять движение по информационным каналам. Такой упаковкой может быть фраза устной речи, письмо, книга, географическая карта, картина и т. п.
Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия.
Основные проблемы языкового информационного обмена. Самым естественным, наиболее подходящим для человека вариантом формализации знаний является язык (устная речь и письменность).
Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существует множество определений таких понятий, как здоровье, счастье, любовь, дружба, интеллект, информация и т. п.
Мысль, которую нельзя выразить в языковой форме, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному знанию можно придать различную словесную форму, что проявляется в художественной прозе, поэзии и т. д. Богатство языка – это одновременно и богатство культуры того или иного народа.
Вместе с тем в различных сферах профессиональной деятельности это богатство и разнообразие выразительных средств естественного языка становится недостатком, а иногда – недопустимо, например, в армии, медицине, судопроизводстве и т. д.
В специальных отраслях науки формируются специфические языковые системы, являющиеся «сужением» естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют также химия, физика, философия, социология, педагогика, экономика, юриспруденция, психология и другие направления.
Целесообразность применения таких суженных языковых систем высока, они позволяют повысить надежность информационного обмена, так как возможность неправильного истолкования передаваемой информации существенно снижается. Главные достоинства такого языка – возможность создавать и использовать типовые упаковки знаний, а также в значительной мере снять полисемию (смысловую многозначность) естественного языка.
При этом, конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим языком – это, условно говоря, можно считать недостатком суженого языка.
Полисемия – основная проблема языковой формы информационного обмена, фактор внесения искажения и ошибок (семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто «канцеляритом», является естественным шагом на этом пути. «Канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, не избыточно информативен и логичен.
Все перечисленные выше свойства не присущи литературному языку, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность высказываний и т. д.
Продвижение в сторону формализации знаний приводит к понятиям «класс» и «классификация».
Классификация – распределение предметов, объектов и понятий по группам (классам) в соответствии с обнаруженными свойствами.
В контексте информатизации общества ставится, например, вопрос о необходимости анализа и построения логических моделей сети Интернет с целью более полного извлечения содержащейся в нем информации: не фактической, как это делается в настоящее время, а аналитической, не представленной в сети явным образом[50 - Шалак В.И. Логический анализ сети Интернет. – М., 2005.].
Рассмотрим основные системы классификации знаний: иерархическую, морфологическую, древовидную, реляционную.
Классификация как метод научной систематики играет важную роль в формировании ядра знаний того или иного научного направления. Классификационные системы такого типа имеют выраженную иерархическую структуру, в которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший – младший».
Классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка, способствующий активизации социальных отношений. Так, существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель классификации знаний получила в науке и практике название иерархической.
Достоинства данной системы классификации заключаются в том, что она проста в освоении, легко обновляется и эффективно решает задачу разнесения новых понятий по иерархическим уровням.
Недостатки иерархической модели знаний: прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; иерархическая классификация наиболее эффективна, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родовидовой.
Систематика, лежащая в основе классификации, может применяться как сильное средство исследования. Так, иногда оказывается полезным при рассмотрении группы объектов выделить несколько характерных для них признаков в качестве определяющих и ввести меру степени их проявления. Подобный подход называется морфологическим, так как использует идею разложения объекта на его части (признаки). Часто подобная группировка приводит к выявлению неизвестных закономерностей, связывающих объекты каждой группы.
Упомянутые выше недостатки иерархической модели классификации свойственны и морфологическим моделям. Их удается устранить, используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний, которые, в частности, лежат в основе актуальных в контексте развития Интернет гипертекстовых технологий. В последнее время исследователи активно разрабатывают способы автоматического построения гипертекстов. Идея динамического гипертекста состоит в том, что вместо разбивки текста на фиксированные узлы, текст связывается большим количеством связей между входящими в текст одноименными поисковыми единицами: словами, терминами, текстовыми константами и т. д. Разработанная в ИПИ РАН по концепции динамического гипертекста система ТЕРМИН-3[51 - Соловьева Н.С., Сомин Н.В. Термин-3 – система динамического гипертекста // Системы и средства информатики. 1995. № 5. С. 95.] обеспечивает построение гипертекстовых сред в автоматическом режиме. Система предназначена для разработки конкретных гипертекстов, информационно-поисковых систем фактографического типа, электронных книг и тезаурусов, частотных словарей и т. п.
Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как и в иерархической модели, это могут быть родовидовые отношения, но также и другие типы отношений: «быть представителем», «иметь», «наследовать» и т. п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленной иерархической или морфологической моделями, статична (декларативна).
В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей, делая как индуктивные (от частного к общему) и дедуктивные (от общего к частному), так и индуктивно-дедуктивного выводы.
Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т. е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на ее простоту и распространенность в информационном обмене, все-таки специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В то же время некоторая система знаний может не соответствовать этой парадигме.
Например, совокупность знаний, описывающих конкретный трудовой коллектив, многоаспектна, и часто не удается установить отношения иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены в алфавитный список с указанием табельного номера, года рождения, специальности и т. п. – «Список 1». Другой аспект: все члены коллектива работают на условиях сдельной оплаты, и величина их заработка определяется единой тарифной сеткой. Поэтому список специальностей и разрядов с указанием стоимости часа рабочего времени дает представление о системе оплаты труда. Назовем этот список – «Список 2». Третий аспект: при начислении зарплаты необходимо учитывать фактическую выработку работника на протяжении некоторого периода. Поэтому список, состоящий из табельных номеров и фактически проработанного каждым времени, – это «Список 3».
Все три списка содержат необходимый объем знаний о трудовом коллективе в контексте начисления заработной платы. Подобные модели представления знаний, состоящие из связанных списочных структур, получили название реляционных[52 - Англ, relation – связь.].
В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как автономный блок, внутри которого допускаются изменения. Удобным средством является комбинация устойчивых и изменяемых знаний. Так, знания Списка 2 длительно устойчивы. В Списке 1 представлены знания, которые могут меняться с течением времени – текучесть кадров, изменение квалификации и т. п. Список 3 обновляется каждый раз по мере необходимости. Не вызывает трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.
Существуют и другие способы формализации знаний. Например, промежуточным между древовидной и реляционной моделями классификации являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи – отношения. Они как бы являются обобщением древовидных моделей, так как отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, так как именно из них могут быть построены связанные списочные структуры, когда понятие, являющееся узлом семантической сети, расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.
Все описанные приемы формализации знаний направлены на создание некоторого устойчивого каркаса, на который может быть надета оболочка системы конкретных знаний. В случае если между отправителем и получателем знаний достигнута взаимная договоренность относительно этого каркаса, то информационный обмен приобретает необходимую регламентирующую основу, что повышает его эффективность.
Традиционные и новые информационные технологии. Под традиционной информационной технологией, как правило, понимается информационная технология на базе «жестких алгоритмов». На таких технологиях построена практически вся так называемая офисная информатизация (текстовые и табличные редакторы, программы бухгалтерских расчетов, статистические программы и т. д.). Реализация данных технологий стандартна и практически не зависит от пользователя.
Под новой информационной технологией, как правило, понимается информационная технология на базе «мягких алгоритмов» с использованием достижений искусственного интеллекта. Именно за данным видом информационных технологий – будущее социокультурного варианта информатизации, ибо новые информационные технологии учитывают специфику, максимально «подстраиваются» при своей реализации под конкретного пользователя.
Реализации такого подхода к удовлетворению информационных потребностей людей способствуют, например, нейросетевые технологии – алгоритмы, имитирующие деятельность мозга. Подобно тому, как человек решает задачи на основе накопленных ранее знаний, нейросеть может, обучившись, строить структуры нейронов, способных давать оценки и прогнозы явлений, составляющих образ жизни конкретного пользователя.
Причины невозможности массовой информатизации общества без использования достижений искусственного интеллекта. Массовая информатизация общества возможна лишь после распространения компьютеров интеллектуального типа с так называемым «дружественным интерфейсом». Только тогда можно достичь необходимого уровня согласования растущего объема знаний с потребностями и возможностями людей.
Дружественный интерфейс компьютера не требует от пользователя ничего, кроме четкого понимания своей информационной потребности: ни знания программно-технической компьютерной специфики, ни владения иностранным языком. Предельным проявлением «дружественности» интерфейса компьютера можно считать голосовой ввод информации, а в перспективе – считывание компьютером мыслей человека. В этих вариантах дружественного интерфейса будет одновременно практически решена и проблема защиты персональной информации.
Развитие дружественного интерфейса должно обязательно сопровождаться процессом воспитания так называемого непрограммирующего пользователя, его интеллектуализации в своей профессиональной и досуговой (не машинной) предметной среде.
Принципиально важно подчеркнуть, что параллельно должно происходить два процесса: с одной стороны, развитие машинного (искусственного) интеллекта, позволяющего «подстраиваться» под информационные потребности пользователя, и, с другой стороны, развитие человеческого интеллекта. На практике же распространены два, одинаково опасных по социальным последствиям, подхода, сводящиеся либо к требованию всем специализироваться на компьютерной технике и программировании, либо к воспитанию неинтеллектуального, пассивного пользователя.
Материя, энергия, информация, знания – связь понятий*. Исходной посылкой является утверждение, что информация является семантической сущностью материи, т. е. информация считается объективной категорией. Понятие «материя» отождествляется с понятием «система», в которую входят составными элементами вещество, энергия, знание и информация. Эти элементы в соответствии с законом сохранения материи поддерживают систему в равновесном состоянии путем взаимных переходов из одной в другую субстанцию системы. При взаимодействии этих элементов системы вещество выступает носителем знания, а энергия – носителем информации, что может быть графически представлено следующим образом (схема 3).
Схема 3 [53 - Шемакин Ю.И. Теоретическая информатика. – М., 1995. С. 10–11.]