нос, рот, уши, лапы, и т. д. и т. п.
Каждому такому фрагменту присваивается кодовое число, которое относится к группе кошек, и группе собак.
При определении кошка или собака изображены на исследуемой картинке, изображение делится на такие же фрагменты. Полученные фрагменты сравниваются с теми, что в базе, и подбираются наиболее похожие.
Из ста анализируемых фрагментов оказалось, что 89 похожи на собаку, а 11 – на кошку. Искусственный интеллект выдает решение, что это – собака.
Если искусственный интеллект определил вид животного правильно, то всем фрагментам присваивается кодовое число, данные заносятся в базу данных, и вся система этого интеллекта – обучилась.
Но не всегда проходит так гладко, поэтому перед запуском систему проходят проверку.
Если искусственный интеллект ошибся, то системе «говорят», что она ошиблась. Новые данные заносятся с правильными кодовыми числами.
В Google тестированием работы интеллекта занимаются специально обученные люди, которые проверяют работу алгоритма. Поэтому иногда можно видеть, что вдруг какой-то непонятный сайт оказался выше хороших сайтов. Но как правило это временно. Ручная проверка сайтов происходит постоянно, и в результате всегда слабые сайты занимают в конечном итоге соответствующее место.
О методики ручного тестирования сайтов, и как этот метод применить к оценке сайтов конкурентов читайте в книге «5000+ сигналов ранжирования в поисковиках». Эта книга – прекрасное руководство оценки сайтов с целью понять, что нужно сделать своему сайту, чтобы обойти конкурентов в поисковой выдаче.
Но продолжим о работе искусственного интеллекта.
Разберем еще одну несложную задачу. Предположим, что в базе данных есть сто авторов, и каждого автора имеется в базе данных по десятку книг. Требуется по тексту, или фрагменту из книги неизвестного автора определить, кто же написал этот текст. Разумеется, исследуемого фрагмента текста нет в базе данных.
Здесь в программе подготовлено, какими словами, как часто, и в каких сочетаниях пользовался каждый автор. Анализируя тестируемый текст, программа определяет, к какому автору ближе всего это сочетание. К кому ближе, того и называет эта программа.
По этому же принципу Google определяет качество текста.
Поисковик имеет базу данных слов (из самых авторитетных сайтов в этой отрасли), которые должны быть в тексте по этой теме, и ищет их в исследуемом тексте.
Чем больше совпадений, по словам, употреблённых в текстах, с самыми лучшими веб-страницами, тем выше качество исследуемой.
И ещё.
Представьте, что компьютерная программа поможет вам выбрать фильм, который понравится вам. Первоначально программа на вашем экране показывает названия всех имеющихся у неё фильмов.
Программа еще не знает ваших предпочтений, и вы отмечаете, из уже виденных фильмов какие вам не нравятся, перетягивая их в левую сторону. Те же фильмы, которые вы видели, и они вам понравились – в правую. Так фильмы условно распределяются по виртуальной шкале от не понравившихся фильмов к тем, которые понравились.
Чем больше фильмов вы расставите на виртуальной шкале, тем более точным будет предложение о новом просмотре. С каждой новой отметкой программа, самообучаясь, дает более точное предсказание.
Так и искусственный интеллект Google и других поисковиков помнит, что прежде искал пользователь, оценивает, и предлагает наиболее подходящее.
Это особенно полезно, когда пользователь вводит не конкретный запрос.
Например, пользователь в строке поиска ввел одно слово: «кухня». Что он имел ввиду?
Сериал Кухня, мебель для кухни, или кухни народов мира?
Если пользователь прежде искал сериалы, то первыми в поиске будут сериалы. Если искал рецепты, то будут – рецепты…
Сейчас уже искусственный интеллект способен, по сотни отметок нравится узнать, о вас больше, чем ваш сосед. По 200 лайкам узнает о вас больше, чем ваш (а) спутник (ца) жизни. Проанализировав 500 лайков, программа узнает о ваших предпочтениях лучше, чем вы сами. А сколько вы уже поставили лайков?
RankBrain – это часть общего поискового «алгоритма» Google, компьютерной программы, которая используется для сортировки миллиардов страниц, о которых она знает, и поиска наиболее подходящих для конкретных запросов.
RankBrain является частью алгоритма поиска Hummingbird от Google.
Hummingbird – это общий алгоритм поиска. Так же, как у автомобиля есть двигатель. Сам двигатель может состоять из различных частей, таких как масляный фильтр, топливный насос, радиатор и так далее. Так, Hummingbird включает в себя различные части, причем RankBrain является одним из новейших.
Потому что RankBrain не обрабатывает весь поиски, как это делает общий алгоритм. Он берет уже подготовленные для него сигналы, и только с ними работает.
Дэнни Салливан журналист и аналитик, который занимается исследованием в области цифрового и поискового маркетинга утверждает, что RankBrain является третьим по важности сигналом при ранжировании сайтов в ответах на запросы пользователей.
Первым пока остаются ссылки, которые Google подсчитывает в виде голосов. Яндекс же стал намного меньше выделять веса под ссылки.
Вторым сигналом он предполагает – «слова», где слова охватывают все – от слов на странице до того, как Google интерпретирует слова, которые люди вводят в окно поиска вне анализа RankBrain.
Третьим по значимости сигналам считается RankBrain, который в основном используется для интерпретации запросов. Люди вводят фразы в строку поиска, чтобы найти страницы, которые могут не содержать точных слов, которые искали.
Использование LSI-терминологии.
Например, если прежде человек в строке поиска вводил «Обувь», то Google отбирал на веб-страницах не только «Обувь», но и обуви, обувью, и подобные.
Теперь если пользователь ввел, «Обувь», то поисковик предложит и другие варианты: «туфли», «ботинки», «сапоги», «босоножки» и многое другое.
Люди часто сетевой адаптер для ноутбука называют зарядным устройством, зарядкой, и т. п. Google знает все варианты, и в результатах поиска выводит все варианты. Смотрите скриншот.
Как видите, Google понял, что пользователь хочет найти, и предложил лучшие ответы, не взирая, на введенные слова.
Или более интеллектуальный поиск. Я ввел фразу «жена президента сша» с ошибкой
Но Google понял, что я имел ввиду. Google знает, что жена и супруга – слова синонимы. Google предположил наиболее вероятно, что меня интересуют супруги действующего президента, и вывел их первыми. Следующим результатом показал Меланью Трамп. И только после этого вывел список первых леди США.
Прошло время после первого издания этой книги, президент поменялся, и поисковик на это правильно отреагировал.
Не правда ли, замечательная работа Google RankBrain? Так работает искусственный интеллект Google.
Как RankBrain помогает честным авторам?
Некоторое время назад одному заводу мы создавали 2 сайта: для главного завода и его филиала, территориально расположенные неподалёку друг от друга. Для главного завода главный инженер, доктор наук изъявил желание написать несколько ключевых текстов. Филиалу мы писали статьи сами. Получилось некоторое соревнование: чьи статьи Google будет позиционировать выше.
Как вы думаете, кто победил: первоклассный копирайтер, использующий во всей мощи LSI-терминологию, или доктор наук?
Победил доктор наук.
При всех равных условиях его статьи в подавляющем большинстве позиционировались первыми, а статьи копирайтера – вторыми. Почему?
Потому что доктор наук знал лучше терминологию и описываемый процесс, чем копирайтер. Доктор наук использовал большее количество синонимом, и связанных с ними слов. Правда, я лично проконсультировал главного инженера по основным положениям написания высоко ранжируемых статей, и потом мы расставили все теги и атрибуты, в соответствии с требованием поисковиков.
Поясню на примере. Предположим, нужно написать статью, в которой рассказывается о демонстрации нового фильма в кинотеатре. Google мало иметь в статье слова кинотеатр и фильм. Ему нужны и сопутствующие слова, например, билеты, аншлаг, цена, и другие слова, которые обычно употребляются в обычной речи.
Чем больше таких слов, тем Google считает, что тема раскрыта более полно.