2) на втором уровне лежат более строгие шаблоны логического вывода, а ученые изучают схемы дедукции, абдукции, индукции, поддержки истинности и другие бесчисленные модели и принципы рассуждений;
3) на третьем уровне абстракции разработчики экспертных систем, интеллектуальных агентов, систем понимания естественного языка пытаются определить роль социальных процессов в создании, передаче и подкреплении знаний.
Отметим, что в наших работах предложено примерно такое же выделение уровней исследований в области ИИ, но с добавлением на третьем уровне проблем исследования искусственной личности, сознания и т.п.
Миварный подход предназначен, прежде всего, для работы на втором уровне, который мы расширяем с логической обработки до обработки информации с учетом автоматического конструирования алгоритмов (это относилось ранее к области создания ИППП). Кроме того, наш опыт создания интеллектуальных систем показал, что на этом уровне необходимо учитывать и традиционные вычислительные процедуры или подпрограммы. Из наиболее известных формализмов, кроме миваров этому соответствует подход на основе сервисов или агентов. Есть некая задача; ее формулируют в виде сервиса или агента и затем формализуют в виде "черного ящика" – процедуры с описанием входных и выходных данных. Миварный подход основывается на представлении всей информации в виде "тройки": "вещь-свойство-отношение". Тогда все процедуры, подпрограммы, агенты, сервисы и т.п. могут быть представлены в виде неких отношений, которые хранятся в базе данных, а при необходимости запускаются на основе миварной сети. Миварный подход позволяет для одной предметной области хранить несколько разных процедур, решающих одинаковые задачи. Более того, если вычислительные ресурсы позволяют, то все эти процедуры могут запускаться одновременно, а потом на основе конкуренции из представленных ими результатов выбирается наиболее подходящий для каждого конкретного случая. Сразу отметим, что методы первого, рефлексного, уровня (в нашей трактовке) могут быть реализованы в виде точно таких же миварных процедур, включающих и нейронные сети, и генетические алгоритмы, и т.д.
В книге Люгера приведено довольно точное и краткое определение: "ИИ можно определить как область компьютерной науки, занимающуюся автоматизацией разумного поведения" [264, стр. 27]. ИИ опирается на теоретические и прикладные принципы компьютерной науки (информатики): структуры данных, алгоритмы, языки и методики программирования. Отметим: само понятие интеллекта определено не очень четко, что дает некую иллюзию использовать термин ИИ в качестве недостижимого горизонта, к которому надо стремиться, но невозможно достичь. К настоящему моменту времени все примерно так и происходит: если некая творческая проблема решается, т.е. ее удается формализовать и разработать соответствующие алгоритмы решения на компьютерах, то большинство ученых сразу объявляет эту проблему нетворческой, решение неинтеллектуальным и, таким образом, отодвигает горизонт (ИИ) дальше и дальше. Нечто подобное уже произошло с самой интеллектуальной игрой – шахматами, после того, как компьютеры стали уверенно обыгрывать самых лучших шахматистов-людей. Да, мы тоже согласны с тем, что, машина решает эти задачи не как человек… Тем не менее, уже достаточно большое количество промышленных автоматизированных систем решает сложные, "человеческие", задачи, а их пользователи-люди уже не могут обойтись без компьютеров.
Подчеркнем лишь то, что в этой области слишком много антропоморфности – человекоподобия, а следовательно, и субъективизма. Мы являемся сторонниками установления единых правил измерения интеллектуальности, т.е. некой шкалы способности к активному отражению, где человеческий мозг – лишь очередное звено и двигаться к нему надо постепенно. Не надо забывать, что до создания человека природа прошла большой путь дарвиновского развития. Вместо того чтобы так же постепенно улучшать способности компьютера, т.е. повышать его интеллектуальность, люди ставят завышенные цели и не могут достичь их, а это приводит к разочарованию "публики" в науке. Что отражается и на финансовом состоянии современной науки. Более того, всякое компьютерное достижение сравнивают не с обычным "средним" человеком, а сразу с самым умным и гениальным… Если писать стихи, то как Пушкин. А много ли таких Пушкиных среди людей? Объективно говоря, наши требования к компьютерам очень сильно завышены. Это с одной стороны. С другой стороны, для многих практических задач достаточно моделирования и реализации деятельности хотя бы простейших животных. Обычно на дискуссиях мы предлагаем сделать не разумного человека, а начать с таракана, собаки и т.п. Необходимо сначала разобраться с интеллектуальностью на уровне животных, что само по себе весьма полезно для промышленности, а уж потом "замахиваться" на создание искусственного человека. Нам не нужны искусственные люди: людей пока в достаточном количестве рожают наши любимые женщины. Кстати, в плане биологического клонирования человека – это тоже, в определенном смысле, проблема создания искусственных людей, т.е. ИИ. Нас интересует не биологический аспект, а создание технических систем. Тогда и приходим к выводу: смысл ИИ – создание усилителя человеческих возможностей. Если этот усилитель-ИИ будет работать полностью автономно, то возникнут проблемы выживания человека в борьбе со "злыми" роботами. Да, эти проблемы тоже лучше решать заранее, но все же, это несколько другие проблемы, хотя, безусловно, важные и актуальные.
Необходимо отдать историческое должное языку Фреге, изложенному им в 1884 году и именуемому сейчас исчислением предикатов первого порядка. Да, это исчисление предикатов служит инструментом для записи теорем и задания значений истинности, а также сыграло принципиальную роль в создании теории представления для ИИ. Исчисление предикатов первого порядка обеспечивает средства автоматизации рассуждений: язык для построения выражений, теорию, позволяющую судить об их смысле, и логически безупречное исчисление для вывода новых истинных выражений. [264, стр. 34]. Далее Люгер указывает, что работа Рассела и Уайтхеда особенно важна для фундаментальных принципов ИИ, т.к. они относились к математике как к чисто формальной системе. Это означает, что аксиомы и теоремы должны рассматриваться исключительно как наборы символов, а доказательства должны выводиться лишь посредством применения формальных правил. При этом исключается использование интуиции или смысла теорем в качестве основы доказательств. Смысл, содержащийся в теоремах и аксиомах системы, имеет отношение только к внешнему миру и совершенно не зависит от логического вывода. Этот формальный подход Рассела и Уайтхеда к математическим умозаключениям сделал возможной его автоматизацию в реальных вычислительных машинах. Логический синтаксис и формальные правила вывода, разработанные Расселом и Уайтхедом, лежат в основе систем автоматического доказательства теорем и составляют теоретические основы искусственного интеллекта [264, стр. 34-35]. Однако, с другой стороны, это наложило и важные ограничения на возможности описания реальных предметных областей: формализм, как выясняется, тоже имеет свои недостатки вместе с преимуществами. Нельзя не отметить и роль А.Тарского, чья теория ссылок сыграла принципиальную роль в процессе формирования ИИ. Согласно этой теории, правильно построенные формулы Фреге или Рассела-Уайтхеда определенным образом ссылаются на объекты реального мира, а эта концепция лежит в основе большинства теорий формальной семантики. Люгер справедливо отмечает, что ИИ не стал жизнеспособной научной дисциплиной до появления цифровых вычислительных машин. Однако архитектура цифровых компьютеров наталкивает на специфичное представление теории ИИ. Получается, что интеллект – это способ обработки информации. Далее Люгер формулирует совершенно замечательную мысль, к которой мы с удовольствием присоединяемся: "Мы часто забываем, что инструменты, которые мы создаем для своих целей, влияют своим устройством и ограничениями на формирование наших представлений о мире". Такое, казалось бы, стесняющее наш кругозор взаимодействие является важным аспектом развития человеческого знания: инструмент (а научные теории, в конечном счете, тоже инструменты) создается для решения конкретной проблемы. По мере применения и совершенствования инструмент подсказывает другие способы его использования, которые приводят к новым вопросам и, в конце концов, разработке новых инструментов [264, стр. 35]. Это очень важно для развития науки!
Здесь весьма уместно привести пример зарождения миварного подхода к логической обработке и созданию прототипа "УДАВ" в далеком 1985 году. Перед Варламовым О.О. поставили задачу изучения сетей Петри и их реализации на конкретном примере: автоматическом решении геометрических задач в треугольниках, где по разным параметрам: углам, сторонам треугольника, высотам и т.д. – с использованием существующих формул всегда можно найти другие параметры, например, площадь, периметр и т.д. Этот пример должен был быть применен для создания прототипов интеллектуальных пакетов прикладных программ. Не будем вдаваться в подробности, т.к. сейчас эта задача успешно решена в миварных сетях и подробно описана в наших работах. Смысл примера в том, что в процессе изучения сетей Петри были выявлены ограничения и неполная пригодность этого формализма даже для решения таких простых задач, как расчет параметров треугольников. Но мы пошли дальше и разработали идею применения нового формализма, позже получившего название "УДАВ" – "универсальный делатель алгоритмов Варламова". Самое "забавное" началось дальше, и этот пример показывает отношение двух разных ученых к разработке нового инструмента. Первый ученый – формалист выслушал все возражения и критику в адрес сетей Петри и также идею нового подхода к решению задач в треугольниках, но вместо одобрения нового подхода принял решение сменить ученика, сменить пример из предметной области и продолжить "мучиться" с сетями Петри. Ему было важно не решение практической задачи, а освоение формализма сетей Петри. Мы считаем это тупиковым путем, когда ученые "уходят в свой формальный мир" и забывают о необходимости решения практических задач и возможности разработки новых инструментов. Мы не будем идентифицировать этого конкретного ученого, т.к. в дальнейшей жизни встречалось огромное количество таких формалистов, которые, к огромному сожалению, помимо полезного вклада в науку, чему мы всегда отдаем должное уважение, на определенном этапе начинают отвергать новые идеи и тормозить развитие науки. Вернемся к нашему примеру и вспомним, что был и второй ученый – Ростовцев Ю.Г., который в своем курсе касался в том числе и вопросов создания ИППП. Варламов О.О. к началу экзаменационной сессии 1986 года уже достаточно четко сформулировал основные подходы "УДАВ", а также выявил ограничения традиционных ИППП. Теперь ситуация: на экзамене ученик говорит своему преподавателю, весьма заслуженному и уважаемому уже на тот момент, заведующему кафедрой: "Извините, но изложенные Вами методы создания ИППП не интеллектуальные, а вот разрешите мне рассказать Вам о моем научном подходе к этому вопросу". И вот второй ученый (Ростовцев Ю.Г.) вполне спокойно согласился, выслушал и в конце даже признал, что метод "УДАВ", действительно, лучше тех методов, о которых он рассказывал на своих лекциях. Это пример реального и положительного подхода, когда ученые выслушивают своих оппонентов и не впадают в формализм. Еще раз, огромное спасибо за поддержку Ростовцеву Ю.Г. К нашему счастью, второй тип настоящих ученых встречался на нашем научном пути достаточно часто и позволял компенсировать негативное влияние и отношение формалистов.
Всегда надо помнить, что любой математический формализм – это всегда ограничения на предметную область, это упрощение реальной жизни, а следовательно, надо вовремя переходить к новым инструментам и не ограничивать себя "детскими ползунками" и простейшими формализмами.
Если говорить о миварах и перечисленных выше формализмах Фреге, Рассела и Уайтхеда, Тарского и многих других, то надо помнить, что наука развивается по спирали и старые формализмы требуют своего продолжения на новом витке. Упомянутые выше исчисление предикатов и другие ранние фундаментальные формализмы при необходимости могут быть реализованы и в правилах (отношениях) миварных сетей. Только надо помнить, что есть и другие формализмы представления информации для ИИ, а у исчисления предикатов первого порядка есть достаточно жесткие ограничения и не очень большие возможности, если вспоминать не об "игрушечных" задачах, а говорить о создании глобальных познающе-диагностических системах и СПАКОД, решающих сложные логико-вычислительные задачи в реальном времени. К сожалению, для достаточно большого количества ученых в нашей области исчисление предикатов так и остается верхом развития, что тормозит применение других более мощных и современных научных теорий. У того же Люгера подробно изложены биологические и социальные модели интеллекта, многоагентные системы, которые опираются не на исчисление предикатов, а на совсем другие и гораздо более современные научные теории [264, стр. 38-42]. Там же приведено интересное и новое определение термина "интеллект", которое отличается от традиционного подхода логиков и сторонников исчисления предикатов первого порядка. "Хассерл, отец феноменологии, рассматривал абстракции как объекты, укоренившиеся в конкретном "жизненном мире"… интеллект заключался не в знании истины, а в знании, как вести себя в постоянно меняющемся и развивающемся мире. Таким образом… интеллект рассматривается с точки зрения выживания в мире, чем как набор логических утверждений о мире (в сочетании со схемой вывода)" [264, стр. 39].
Выделим из описания различных моделей интеллекта Люгера [264] еще несколько, наиболее важных и актуальных для миварного подхода и его различных практических приложений. В нейронных моделях интеллекта упор делается на способность мозга адаптироваться к миру, в котором он существует, с помощью изменений связей между отдельными нейронами. Знание в таких системах не выражается логическими конструкциями, а представляется в неявной форме как свойство конфигураций таких взаимосвязей. Иная модель интеллекта, заимствованная из биологии, навеяна процессами адаптации видов к окружающей среде. В разработках искусственной жизни и генетических алгоритмов программы не решают задачи посредством логических рассуждений, а порождают популяции соревнующихся между собой решений-кандидатов и заставляют их совершенствоваться на основе биологической эволюции. Социальные системы дают еще одно модельное представление интеллекта с помощью глобального поведения, которое бы не удалось решить отдельным их членам. Есть два аспекта:
1) корни интеллекта связаны с культурой и обществом, а следовательно, разум является эмерджентным;
2) разумное поведение формируется совместными действиями большого числа очень простых взаимодействующих полуавтономных индивидуумов, или агентов.
Взаимодействие агентов создает интеллект [264, стр. 40]. Люгер Дж. определяет агента как элемент сообщества, который может воспринимать аспекты своего окружения и взаимодействовать с этой окружающей средой либо непосредственно, либо путем сотрудничества с другими агентами. Большинство интеллектуальных методов решений практических задач требуют наличия разнообразных агентов. Это могут быть простые агенты-механизмы, задача которых – собирать и передавать информацию; агенты-координаторы, которые обеспечивают взаимодействие между другими агентами; агенты поиска, которые перебирают пакеты информации и возвращают какие-то избранные частицы; обучающие агенты, которые на основе полученной информации формируют обобщающие концепции; и принимающие решения агенты, которые раздают задания и делают выводы на основе ограниченной информации и обработки. Получается, что с точки зрения определения интеллекта агентов можно рассматривать как механизмы, обеспечивающие выработку решения в условиях ограниченных ресурсов и процессорных мощностей. Для разработки и построения таких сообществ агентов необходимы: структуры для представления информации, стратегии поиска в пространстве альтернативных решений и архитектура, обеспечивающая взаимодействие агентов [264, стр. 41]. Технология многоагентных систем уже фактически использована для создания познающе-диагностических систем, хотя в явном виде подобные названия и термин "агенты" используются не всегда.
Как видно, в современной теории ИИ кроме предикатного подхода уже разработано большое количество других подходов, кардинально отличающихся от исчисления предикатов и т.п. Подчеркнем, что продукционный подход и его развитие в миварных сетях являются еще одной альтернативой исчислению предикатов при создании ИИ.
2. Основные преимущества миварного подхода
2.1. Обзор достижений в области искусственного интеллекта
В области ИИ существует две фундаментальные проблемы – это представление знаний и поиск [264, стр. 42]. Первая проблема относится к получению новых знаний с помощью формального языка. Поиск – это метод решения проблемы, в котором систематически просматривается пространство состояний задачи, т.е. альтернативных стадий ее решения.
В области ведения игр широкое применение нашли разнообразные человеческие игры: пятнашки, шашки, шахматы и т.п. Эти игры ведутся с использованием четко определенного набора правил, что уже само по себе является важным ограничением по сравнению с реальными задачами, где правил может не быть совсем, или они могут изменяться по желанию противников. Позиции фигур легко представимы в компьютерной программе и не требуют создания сложных формализмов, необходимых для передачи семантических тонкостей более сложных предметных областей. Тестирование игровых программ не порождает никаких финансовых или этических проблем. Поиск в пространстве состояний – принцип, лежащий в основе большинства исследований в области ведения игр. Игры могут порождать большие пространства состояний, а для поиска в них требуются мощные методики, которые называют "эвристики". Эвристики имеют положительные и отрицательные стороны. С положительной стороны, они ускоряют поиск и определяют, какие альтернативы следует рассматривать в первую очередь, что значительно сокращает пространство состояний задачи. А с отрицательной стороны, эвристики потенциально способны упустить правильное решение. Большая часть того, что Дж. Люгер называет разумностью, опирается на эвристики, которые люди используют в решении задач. Отмечено, что наличие противника усложняет структуру программы, добавляя в нее элементы непредсказуемости [264, стр. 43]. Как видно из вышесказанного, в 20 веке в теории игр решались простые задачи по сравнению с требованиями к познающе-диагностическим системам, для которых создан миварный подход. Именно такой упрощенный подход к решению задач традиционных ученых напоминает старый анекдот, в котором человек потерял часы в темном месте, а ищет их под фонарем, объясняя это тем, что здесь светлее. Это и есть уход от решения реальных задач к "игрушечным", т.к., что делать с реальными задачами не известно (там нет фонаря и темно), а вот под фонарем светло, и "игрушечные" задачи можно попробовать решить. Конечно, наука развивается от простого к сложному, но решая упрощенные задачи не надо говорить и обещать решение реальных задач, тем более запрещать альтернативные подходы к решению, с чем нам, к сожалению, регулярно приходится сталкиваться… Миварный подход изначально предназначен для решения сложных реальных задач, поэтому он другой, и надо это признать.
Автоматическое доказательство теорем – одна из старейших областей возможного применения ИИ, где было много достижений, исследований и программ, включая Универсальный решатель задач Ньюэлла и Саймона. Люгер подчеркивает, что именно "…эта ветвь принесла наиболее богатые плоды…" [264, стр. 44]. Благодаря исследованиям в этой области были формализованы алгоритмы поиска и разработаны языки формальных представлений, такие как исчисление предикатов и логический язык программирования Пролог. Приведем обоснование Дж. Люгера: "… привлекательность автоматического доказательства теорем основана на строгости и общности логики. В формальной системе логика располагает к автоматизации. Разнообразные проблемы можно попытаться решить, представив описание задачи и существенно относящуюся к ней информацию в виде логических аксиом и рассматривая различные случаи задачи как теоремы, которые нужно доказать. Этот принцип лежит в основе автоматического доказательства теорем и систем математических обоснований" [264, стр. 44]. Далее следует замечательный вывод и итог 20 века в этой наиболее богатой ветви: "К сожалению, в ранних пробах написать программу для автоматического доказательства, не удалось разработать систему, которая бы единообразно решала сложные задачи" [264, стр. 44]. Таким образом, Дж. Люгер подтверждает наш тезис о том, что в прошлом веке даже в самых передовых областях ИИ ученые не смогли решить сложные задачи, а значит, нужны принципиально новые подходы и исследования, к числу которых относится и миварный подход.
Приведем обоснование ограниченности возможностей автоматического доказательства теорем, которое имеет важное значение для дальнейших исследований, как минимум, показывая, куда НЕ надо идти. Как говорится, отрицательный результат – это тоже результат!!! Итак, обоснование Дж. Люгера: "Это было обусловлено способностью любой относительно сложной логической системы сгенерировать бесконечное количество доказуемых теорем: без мощных методик (эвристик), которые бы направляли поиск, программы доказывали большие количества не относящихся к делу теорем, пока не натыкались на нужную. Из-за этой неэффективности многие утверждают, что чисто формальные синтаксические методы управления поиском в принципе не способны справиться с такими большими пространствами, и единственная альтернатива этому – положиться на неформальные, специально подобранные к случаю (лат "ad hoc") стратегии, как это, похоже, делают люди. Это один из подходов, лежащих в основе экспертных систем… и он оказался достаточно плодотворным" [264, стр. 44]. Таким образом, возникают новые проблемы: работа с бесконечными множествами теорем и разработка эвристик, про которые ранее было показано, что они не гарантируют решение задачи. Конечно, за прошедшее время ученым удалось разработать мощные эвристики, основанные на оценке синтаксической формы логического выражения, которые в результате понижают сложность пространства поиска. Кроме того, пришло понимание, что системе не обязательно решать особо сложные проблемы без человеческого вмешательства. "Многие современные программы доказательств работают как умные помощники, предоставляю людям разбивать задачи на подзадачи и продумывать эвристики для перебора в пространстве возможных обоснований" [264, стр. 44]. Этот вывод может служить обоснованием нашего утверждения, что ИИ – это усилитель человеческих способностей и автоматизация мыслительных процессов. Кроме того, это косвенно подтверждает необходимость введения шкалы измерений интеллектуальности автоматических систем и наличие относительно слабых форм интеллекта у уже существующих компьютерных программ и устройств. Значит, в таком смысле ИИ уже существует и продолжает развиваться, помогая человеку решать сложные задачи.
Вместе с тем, рассмотренные проблемы доказательств поднимают вопросы необходимости формализации представлений и описаний различных предметных областей. Однако такая возможность есть далеко не всегда. Значит, надо исследовать возможности обработки менее формализованной информации или альтернативных моделей представления данных и знаний, что также развивается в миварном подходе. Миварный подход позволяет работать с различными формами представления данных и правил (знаний), включая и работу с бесконечными описаниями сущностей – вещей, отношений и свойств в миварном многомерном динамическом информационном пространстве унифицированного представления данных и правил (знаний).
Перейдем к анализу экспертных систем (ЭС). Одним из главных достижений ранних исследований по ИИ стало осознание важности специфичного для предметной области знания. Экспертное знание – это сочетание теоретического понимания проблемы и набора эвристических правил для ее решения. "Экспертные системы создаются с помощью заимствования знаний у человеческого эксперта и кодирования их в форму, которую компьютер может применить к аналогичным проблемам" [264, стр. 45]. Следовательно, стратегии ЭС основаны на знаниях человека-эксперта. К настоящему моменту разработаны сотни ЭС, которые прекрасно зарекомендовали себя в различных предметных областях для решения относительно сложных задач. Современные ЭС могут работать на основе ненадежной или недостаточной информации, выводят ясные и логичные пояснения своих решений. Дж. Люгер отмечает, что большинство ЭС были написаны для специализированных предметных областей, которые довольно хорошо изучены и располагают четко определенными стратегиями принятия решений. А вот проблемы, определенные на нечеткой основе здравого смысла реализовать в ЭС гораздо сложнее. Дж. Люгер выделяет 5 основных проблем для ЭС [264, стр. 46]:
1. Трудности в передаче глубоких знаний предметной области и потенциальная ограниченность знаний ЭС.
2. Недостаток здравомыслия и гибкости. ЭС не могут, подобно людям, исследовать сначала основные принципы, а потом выработать стратегию для подхода к проблеме.
3. Неспособность предоставлять осмысленные объяснения. Поскольку ЭС не владеют глубоким знанием своей предметной области, их пояснения обычно ограничиваются описанием шагов, которые система предприняла в поиске решения, но они не могут объяснить, почему был выбран конкретный подход.
4. Трудности в тестировании. Обоснование корректности работы любой большой компьютерной системы достаточно трудоемко. Проверять ЭС особенно тяжело, и это серьезная проблема, т.к. технологии ЭС применяются для разных критичных задач.
5. Ограниченные возможности обучения на опыте. ЭС делаются "вручную" и их производительность возрастает только после вмешательства программистов. Это заставляет серьезно усомниться в разумности таких систем [264, стр. 46].
Отметим, что в настоящее время ЭС нашли самое широкое применение в специализированных областях, но перестали быть передовым краем исследований в области ИИ, т.к. о них сообщается на большом количестве научных конференций. Многие ученые идут в своих исследованиях дальше, и теория ЭС продолжает развиваться в том числе и на основе миварного подхода, который позволяет устранить указанные ограничения и выйти на новый уровень интеллектуальности ЭС. Вместе с тем, именно широкое использование ЭС дает надежные основания для утверждения, что ИИ уже создан и широко используется людьми в своей повседневной деятельности. Конечно, это не означает, что ЭС и системы ИИ на их основе смогли превзойти уровень интеллектуальности человека, т.е. в другом понимании термина ИИ, как системы равной или превосходящей возможности человека, конечно же, еще достаточно далеко до создания такого ИИ.
2.2. Миварный подход и понимание естественных языков
Следующей проблемой ИИ является понимание естественных языков и семантическое моделирование. Здесь мы поддерживаем описание и выводы Дж. Люгера, которые заслуживают подробного цитирования: "Способность применять и понимать естественный язык является фундаментальным аспектом человеческого интеллекта, а его успешная автоматизация привела бы к неизмеримой эффективности самих компьютеров. Многие усилия затрачены на написание программ, понимающих естественный язык. Хотя такие программы и достигли успеха в ограниченных контекстах, системы, использующие натуральные языки с гибкостью и общностью, характерной для человеческой речи, лежат за пределами сегодняшних методологий" [264, стр. 46]. Усилим это высказывание: известные научные подходы к проблеме понимания естественного языка даже не рассматривают эту проблему в полном объеме, сразу ограничивая область и свои возможности. Т.е. выражение "за пределами сегодняшних методологий" означает, что на текущий момент даже и подходов к общему решению этой проблемы пока нет. И этому есть несколько объяснений, включая и приведенное выше пояснение о том, что многие современные ученые решают "игрушечные" задачи, даже не предполагая решение реальных, к числу которых и относится проблема понимания естественного языка.
Мы поддерживаем следующие рассуждения Дж. Люгера: "…понимание естественного языка включает куда больше, чем разбор предложений на индивидуальные части речи и поиск значений слов в словаре. Оно базируется на обширном фоновом знании о предмете беседы и идиомах, используемых в этой области, так же, как и на способности применять общее контекстуальное знание для понимания недомолвок и неясностей, присущих человеческой речи. Задача сбора и организации этого фонового знания, чтобы его можно было применить к осмысливанию языка, составляет значительную проблему в автоматизации понимания естественного языка. Разработано множество методов структурирования семантических значений. Но, из-за огромных объемов знаний, требуемых для понимания естественного языка, большая часть работы ведется в хорошо понимаемых специализированных проблемных областях. Методики представления известных специализированных программ слишком просты, чтобы передать семантическую организацию более богатых и сложных предметных областей. Основная часть текущих работ в этой области направлена на поиск формализмов представления, которые должны быть достаточно общими, чтобы применяться в широком круге приложений и уметь адаптироваться к специфичной структуре заданной области. Множество разнообразных методик, большинство из которых являются развитием или модификацией семантических сетей, исследуются с этой целью и используются при разработке программ, способных понимать естественный язык в ограниченных, но достаточно интересных предметных областях. Есть стохастические модели, описывающие совместное использование слов в языке, которые применяются для характеристики как синтаксиса, так и семантики. Далее следует принципиально важный вывод: полное понимание языка на вычислительной основе все же остается далеко за пределами современных возможностей" [264, стр. 47].
С нашей точки зрения, существует вполне логичное обоснование таких провалов и ограничений в области ИИ. Главная причина в том, что не решаются реальные задачи, а делаются попытки приспособить уже известные "игрушечные" методы к разным предметным областям. Проблема естественного языка объективно является сложной, более того, вполне возможно, что его вообще нельзя формализовать, и надо использовать принципиально другие подходы. Вместо этого постоянно делаются попытки формализовать естественный язык, которые порождают в ограниченных контекстах узкоспециализированные описания некоторых предметных областей. Здесь будет уместно привести аналогию с животными: многие люди ошибочно считают, что собаки понимают человеческий язык… Есть даже шутка про студентов на экзаменах, которые все понимают, но сказать, как и собаки, не могут. Конечно же, дрессированные собаки выполняют множество команд своего хозяина, но… Дальше и начинается самое интересное. Ведь эти команды многие хозяева подают не только голосом, но всякими жестами, свистками и т.п. Получаем вполне конкретный набор команд, который собака может распознать и выполнить. Нечто подобное может выполнять в ограниченных контекстах узкоспециализированная программа для некоторых предметных областей. Скажем прямо: такой подход "снизу вверх" вообще не направлен на ПОНИМАНИЕ языка, а ведет только к пониманию команд, т.е. обычного формализованного языка. При таком ошибочном подходе, можно говорить, что интеллектуальный телевизор понимает команды с пульта управления…
Для понимания человеческого языка надо исследовать совсем другие научные подходы, которые принципиально отличаются от современных семантических сетей, онтологий и т.п. формализмов.
В качестве оправдания неудач и пояснения сложности проблемы понимания естественного языка можно сказать следующее. Если взять для примера животный мир, то достаточно многие его представители явно обладают интеллектом и умеют решать различные задачи: поиск пищи, распознавание образов, взаимодействие, нахождение пути домой и т.п. В классическом определении интеллекта вообще указано, что это высшая стадия для животных, включая собак, кошек, дельфинов и т.п. Многие хозяева считают своих питомцев интеллектуальными. Однако человеческий язык во всей своей сложности используется только людьми, и это одно из наиболее важных отличий нас от животных. Мы являемся сторонниками такой точки зрения: понимание естественного языка – это задача одинаковая по сложности с самим созданием ИИ в его самом сложном смысле, как создание автоматической системы равной или превышающей человеческий индивидуальный интеллект. Поэтому упрощенные "игрушечные" методы никогда не приведут к его решению. У Дж. Люгера выше именно это явно и звучит: понимание человеческой речи лежит за пределами сегодняшних методологий научных исследований. Надо разрабатывать новые подходы и методы.
Одним из таких подходов является миварный подход с его технологиями накопления данных и обработки информации в едином миварном информационном пространстве. Для понимания языка надо собрать и поддерживать в актуальном состоянии огромную базу данных фактов и такое же большое количество правил, которые позволяют выявлять нюансы смысла разных понятий в различных ситуациях. У нас пока не было подробных работ на эту тему, но во время дискуссий и обсуждений мы излагали следующий описанный ниже подход, получивший понимание и поддержку.
Итак, подход можно показать на следующей аналогии: весь язык представляет собой огромный горный массив, вершинами которого являются отдельные слова (рисунки 2, 3, 4).
Рисунок 2 – Вид с Эльбруса на Главный Кавказский хребет.
Высота 4800 м
Рисунок 3 – Вид на вершины Эльбруса (5642 м.)
с высоты 4800 м
Рисунок 4 – Долина реки Баксан на уровне 2100 метров
Тогда, слово – это вершина горы, а вся гора сама по себе и является контекстом. Если кто-то больше любит море или океан, то вместо гор можно использовать айсберги, хотя система гор все же, на наш взгляд, более адекватна предлагаемой модели. Итак, в процессе обучения человек "выращивает" эти горы у себя в голове, а общается потом внешне только словами, как бы перепрыгивая с вершины на вершину или связывая эти вершины огромными длинными виртуальными мостами. В процессе своего взросления и обучения человек "выращивает новые горы", создавая целые системы таких гор, но на основе общих здравых подходов и признаков. Высота каждой такой горы превышает, допустим, стоэтажный дом. Эти этажи образно соответствуют уровням абстракции в описаниях слов и языковых моделей. Для того чтобы восстановить в компьютере такую горную систему надо сделать ее полноразмерный математический макет. Такой макет можно делать, спускаясь этаж за этажом с вершины горы до ее основания и переходя на другую гору через долины… Современные методы семантической обработки позволяют сделать, условно говоря, только двух- трехэтажную по высоте модель такой горной смысловой языковой системы. Вот и получаем принципиальное ограничение: надо наращивать в высоту по уровням абстракции наши языковые модели, а мы остановились на втором этаже семантики и даже не собираемся двигаться далее. Спасибо онтологиям?
Вывод: для адекватной работы с естественным языком нужны более сложные модели, принципиально новые и на несколько порядков более сложные модели на основе многомерных баз данных с поддержкой самых разнообразных отношений. Возможно, что понадобится даже работа с бесконечными плоскостями описания сущностей и т.п. В настоящее время таким требованиям отвечает только миварный подход с многомерным информационным пространством и динамически изменяющейся структурой. Реализация языковых моделей на больших вычислительных кластерах (или ГРИД-системах) на основе миварного подхода должна приблизить нас к созданию автоматической системы, понимающей и разговаривающей с людьми на естественном языке. Напомним, что эта задача сравнима по сложности с созданием самого ИИ.
Возможно, что создание таких языковых моделей, вернее символьных моделей в миварном пространстве, позволит создать электронных двойников людей для вечной жизни, которые предсказаны многими фантастами. Впрочем, эти проблемы возникнут потом, а сейчас надо приступать к реализации построения символьных языковых моделей в миварном информационном пространстве, некоторым прототипом которых являются разработки Активных миварных интернет-энциклопедий, которые к описанию фактов в ВИКИ-педии будут добавлять новые отношения, связи, взаимодействия и т.д. Более подробно эти вопросы рассмотрены при описании миварной энциклопедии и миварной модели человеческого мышления.
Опять получаем, что именно миварный подход является принципиально новым и ключевым фундаментальным направлением для решения многих, практически всех описанных в этой работе, проблем в научной области ИИ.
2.3. Представление знаний в ИИ. Семантические сети как альтернатива исчислению предикатов
Существует Гипотеза о физической символьной системе Ньюэлла и Саймона, из которой следует, что интеллектуальная деятельность как человека, так и машины осуществляется на основе следующих средств [264, стр. 58]:
1. Символьные шаблоны, предназначенные для описания важнейших аспектов области определения задачи.
2. Операции с этими шаблонами, позволяющие генерировать потенциальные решения проблем.