«Верховный алгоритм»: как научить машину учиться
Компьютеры, которые программируют сами себя — больше не фантастика. Машинное обучение преображает науку, технологию, бизнес, политику, военное искусство. На выборах побеждают политики, умеющие моделировать поведение избирателей посредством самообучающихся баз данных, на дорогах появляются беспилотные автомобили, а крупные интернет-компании предлагают нам товары и услуги, основываясь на наших предпочтениях, собранных воедино. О том, как работает механизм машинного обучения, ученый-практик Педро Домингос рассказывает в своей книге «Верховный алгоритм», вышедшей в России в июле.
«Семь утра. Будильник включает радио. Играет незнакомая, но очень приятная музыка: благодаря сервису Pandora1 радио познакомилось с вашими вкусами и превратилось в «персонального диджея». Не исключено, что сама песня тоже появилась на свет с помощью машинного обучения. За завтраком вы листаете утреннюю газету. Несколькими часами ранее она сошла с печатного станка, а тот был тщательно настроен с помощью обучающегося алгоритма, позволяющего устранить типографские дефекты. В комнате исключительно комфортная температура, а счета за электричество не кусаются, потому что вы поставили умный термостат Nest. <...> По дороге на работу автомобиль постоянно корректирует впрыск топлива и рециркуляцию выхлопных газов, чтобы свести к минимуму расходы на бензин. В часы пик Inrix, система прогнозирования трафика, экономит время, не говоря уже о нервах. <...> Надо заглянуть на сайт потенциального поставщика, а он на иностранном языке? Никаких проблем: Google автоматически его для вас переведет. Электронные письма удобно рассортированы по папкам, а во «Входящих» осталось только самое важное. Текстовый процессор проверяет за вас грамматику и орфографию. Вы нашли авиарейс для предстоящей командировки, но билет пока не покупаете, потому что, по прогнозу Bing Travel, цены вскоре станут ниже. Сами того не осознавая, вы ежечасно делаете намного больше работы, чем могли бы без помощи машинного обучения.»
Каждый год появляются все новые и новые алгоритмы машинного обучения. Они совершенствуются и проникают во все сферы нашей жизни, облегчая нашу рутину, решая повседневные проблемы и предлагая развлечения на наш вкус — нам остается только нажать кнопку выбора. Все эти многотысячные, сложнейшие, нишевые алгоритмы основаны на нескольких фундаментальных идеях, чьи последователи сейчас активно соперничают между собой.
Существует пять школ мысли, которые черпают идеи из различных областей научного знания. Эволюционисты воспроизводят в своих алгоритмах механизмы биологической эволюции и генетики, аналогисты, подверженные влиянию психологии и математической оптимизации, строят технологию машинного самообучения на основании схожести суждений, коннекционисты пытаются воссоздать электронный мозг по законам нейробиологии и физики, символисты апеллируют к законам логики, а сторонники байесовского подхода — к статистике и теории вероятности. Не пугайтесь сложных терминов! Педро Домингос, профессор Вашингтонского университета и ведущий эксперт по машинному обучению и искусственному интеллекту готов вам все объяснить.
Книга Педро Домингоса «Верховный алгоритм», выпущенная в России издательством «Манн, Иванов и Фарбер», посвящает читателя в секреты машинного обучения. Автор рассказывает об истории разработки первых алгоритмов, раскрывает основы каждой из пяти существующих школ, но, как признается сам Педро Домингос, ликбез далеко не единственная его цель. Каждый из пяти методов хорош для решения определенных задач, но среди них не существует универсального — того самого, который переведет изобретения человечества на новый уровень. Современные технологии нуждаются в общем алгоритме, который должен вобрать в себя самые лучшие идеи, высказанные эволюционистами, аналогистами, коннекционистами, байесовцами и символистами. Поэтому автор предлагает читателям собрать по крупицам накопленные человечеством знания и создать свой собственный Верховный алгоритм. А чтобы цель не казалась такой абстрактной, профессор ставит перед читателем задачу: пользуясь идеями пяти школ, разработать стратегию излечения раковой опухоли. Да, именно, убить метастазирующий рак, непредсказуемо атакующий различные участки человеческого тела.
В первой главе книги рассказывается о предпосылках создания алгоритмов машинного обучения и о перспективах этой технологии в науке, бизнесе, политике и национальной обороне. Машинное обучение, все более и более захватывающее все эти сферы, проникло даже в предвыборный штаб Барака Обамы: политтехнологи с помощью баз данных собирали информацию о настроениях и предпочтениях избирателей в каждом штате, что помогло Обаме выиграть президентские выборы в 2012 году. Как водится, Педро Домингос представляет аргументы за и против существования Верховного алгоритма и провальные попытки его создания. А вот дальше начинается самое интересное:
«В наших поисках мы пройдем по землям каждого из пяти «племен». Пограничные переходы, где они встречаются, ведут переговоры и вступают в схватки, будут самыми непростыми отрезками пути. У каждого «племени» есть свой кусочек мозаики, которую мы обязаны собрать. Специалисты по машинному обучению, как и все ученые, напоминают слепцов рядом со слоном: один щупает хобот и думает, что это змея. Другой прислонился к ноге и считает, что это дерево. Еще один потрогал бивень и решил, что это бык. Наша цель — дотронуться до всех элементов, не спеша с выводами. Прикоснувшись ко всему, мы попытаемся нарисовать в воображении слона целиком. Соединить все фрагменты в одно решение — далеко не банальная задача. Некоторые полагают, что это вообще невозможно. Но именно это мы сделаем,»— с этими словами Педро Домингос отправляется в путешествие вместе с читателем.
Педро Домингос, профессор Вашингтонского университета и ведущий эксперт по машинному обучению и искусственному интеллекту, автор книги «Верховный алгоритм»
Путь лежит сквозь тернии: теорию Юма, принцип Ньютона, индукцию и дедукцию, нейронные сети, алгоритм Дарвина, теорему Байеса, цепи Маркова, проблему размерности...Но Домингос умело лавирует между этими колючими терминами, аккуратно вытаскивая шипы из читателя и раздвигая перед ним ветки. Теорию Юма Домингос блестяще объясняет на примере свидания: даже если вы приглашали в кино сотни девушек, вы никогда не знаете, скажет ли заветное «да» та самая. А теорему Байеса автор сводит к простому расчету вероятности восхода солнца на чужой планете, ловко подставив необходимые буквы-переменные в конце объяснения. И вот в глаза читателя, продравшегося сквозь кусты, бьет свет: он смотрит на мир глазами новорожденного роботамРобби. А Домингос тем временем аккуратно закладывает пластами информации девственно чистое сознание робота, чтобы мы лучше поняли, как алгоритм машинного обучения должен функционировать на практике.
И вот, в конце концов, когда Робби становится почти человеком, у читателя открываются чакры и он понимает, как должно выглядеть то самое лекарство от рака, о котором Домингос говорил в начале книги. Но вот что делать с живым Робби — точнее, с нейронными сетями, отобравшими у людей работу, боевыми роботами, ведущими бессмысленные войны, и всемогущим искусственным интеллектом, поработившим мир? Педро Домингос принимает и этот вызов.
Присоединяйтесь к путешествию, хотя бы из чистого любопытства. Скучно точно не будет!
Комментарии