ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
 

                  Кузнецов:

                  Уважаемые коллеги, всем доброе утро. Спасибо всем, что пришли поучаствовать в нашей стратегической сессии - искусственный интеллект. Я предлагаю начать. Меня зовут Максим Кузнецов. Я администратор центра по научным инженерным вычислительным технологическим задачам с большими массивами данных "Скалтех". Собственно в ходе нашей дискуссии об искусственном интеллекте мне бы хотелось, чтобы мы осветили проблему и само понятие искусственного интеллекта с разных сторон, поняли бы, в чем заключается ключевое отличие и искусственного интеллекта  и его методов. В частности таких, как машинное обучение. Частность, которая популярна сейчас очень и произвела просто настоящую революцию в современном мире - это диприонинг, глубинное обучение, алгоритмы прогнозирования и интеллектуального анализа данных. С другой стороны, несмотря на то, что глубинное обучение на самом деле каждый день рапортует о каких-то успехах, в том числе о победе машины над человеком, то, например, в игре Го недавно машины научились играть а Пакмена. Все это фантастическая совершенно работа техническая программистов и математиков, большой колабарации людей. Но, как мне кажется, все-таки это является каким-то частным случаем методов и от искусственного интеллекта все еще пока далеко. В том философском смысле, в котором искусственный интеллект обычно понимается в фантастической литературе или фантастических фильмах. И я бы хотел нашу дискуссию разделить на две части. Первая часть будет научная. Мы от науки, от тех алгоритмов и задач, которые возникают в ней, мы постараемся перейти к практическим приложениям разработанных методов, которые используются уже в промышленности, в производстве, в частном предпринимательстве в России. И коль уж мы начинаем с науки, я бы попросил Ивана Смирнова, заведующего лабораторией федерального исследовательского центра информатики и управления Российской академии наук открыть нашу сессию, дать какие-то вводные слова о том, что вообще такое искусственный интеллект, какие методы интеллектуального анализа данных разрабатываются и применяются в России. И может быть рассказать о каких-то частных примерах.

 

                  Смирнов:

                  Максим, спасибо. Всем добрый день. Я представлю такой научный взгляд на проблему искусственного интеллекта. И вообще, искусственный интеллект - это научное направление, которое занимается слабо формализуемыми задачами или задачами, для которых нет традиционных алгоритмов решения. Эти задача включают не только анализ данных, а также сюда входят направления такие как анализ текстов, обработка языка, планирование поведения искусственных устройств, базы знаний, моделирование интеллектуальных агентов и многие другие задачи. И сегодня в России все эти направления развиваются довольно продуктивно. Некоторые на мировом уровне, некоторые в рамках каких-то российских обособленных научных школ. Сегодня часто искусственный интеллект ассоциируют и даже отождествляют  с интеллектуальным анализом данных. Это не совсем корректно. Конечно искусственный интеллект - это намного шире дисциплина. Тем не менее, анализ данных и машинное  обучение это значимое направление в искусственном интеллекте, и в нашей стране тоже есть некоторые достижения в этой области. А сегодня трендами, как сказал уже Максим, здесь является конечно же глубокое обучение и обучение без учителя. Но здесь возникают некоторые особенности, которые, как  я считаю, необходимо отметить. Вообще изначально машинное обучение направлено на получение знаний из примеров или данных. Под знаниями понимаются некоторые закономерности, законы предметной области, которые позволяют на основе одних фактов или данных получать новые данные. Так вот, традиционно под знаниями понимается нечто, интерпретируемое человеком, понятное человеку. Современные методы типа нейронных сетей представляют собой черный ящик. Это какие-то обычные модели с весами, с параметрами. В общем-то не интерпретируемые человеком. И тут возникает некоторое противоречие. С одной стороны такие методы не могут считаться интеллектуальными, потому что новых знаний не возникает. А с другой стороны, ну и ладно, пускай. У нас нет интерпретируемости. Главное, что эти методы решают задачу, которую нам надо решить. В общем это надо иметь в виду и понимать. Далее. Вот мы с вами говорим, что вот большие данные, большие данные. А в некоторых предметных областях данных то не так много. Их бывает мало. И тут современные методы не работают. И здесь как раз помогают традиционные, такие старые, скажем так, методы машинного обучения, которые основаны на рассуждениях по прецедентам, которые используют логические рассуждения типа индукции, абдукции, аналогии. Эти методы имитируют рассуждения человека. Результаты этих методов интерпретируемы и объяснимы. И они как раз работают на малых данных. Современные методы не способны имитировать рассуждения человека. И вообще надо понимать, что машинное обучение - это некоторый инструмент решения задач. И конечно же он не приравнивается вообще к искусственному интеллекту. Далее. Кроме данных у нас есть тексты и естественные язык, который остается для нас основным средством передачи информации. И в этой области в нашей стране конечно же тоже есть некоторые достижения, довольно хорошие достижения в области обработки языка. И в нашей стране существует много результатов в области решения таких задач, как извлечение информации из текстов, понимание текстов, интеллектуальный анализ текстов, диалоговые системы, вопросно-ответные системы и так далее. И вот, например, диалоговые системы. Довольно популярно стало в последнее время в связи в последнее время чатботов и виртуальных ассистентов. Сейчас создано очень много искусственных устройств, которые поддерживают диалог с человеком, общение на естественном языке. И здесь, кстати говоря, тоже прослеживаются тренды использования глубокого обучения и обучения без учителя для обработки естественного языка. Но появляется и некоторая критика использования таких тенденций, потому что многие задачи обработки естественного языка невозможно решить опять же без знаний о предметной области. И поэтому подходы комбинируются. Вообще, на мой взгляд, в комбинации каких-то традиционных подходов и современных и стоит ожидать какого-то прорыва или, скажем так, дальнейшего развития обработки естественного языка и искусственного интеллекта в целом.  И в заключении хочу сказать, что конечно же искусственный интеллект будет все больше и больше использоваться в различных деятельностях человека и со временем видимо станет таким незаменимым помощником человеку в какой-то бытовой жизни. И как научное направление искусственный интеллект тоже будет конечно развиваться. Но здесь нужна некоторая поддержка бизнеса и заказ рынка. Как мне кажется. Все. Спасибо.

                 

                  Кузнецов:

                  Иван, спасибо большое. У меня сразу вопрос. Вот вы сказали про чатботов. Это очень популярная в принципе тема сейчас. Банки переходят с онлайн приложения на чатботы. Рокетбанк вообще банк, который работает только в чатботе. Вот есть такой знаменитый классический тест тьюринга, где человек беседует с машиной. И как только он не в состоянии отличить машину от человека, значит это практически искусственный интеллект. Вот насколько сегодняшние методы машинного обучения позволяют создать такой чатбот, который бы был близок или мог бы обмануть этот тест тьюринга. Как вы считаете?

 

                  Смирнов:

                  Я считаю, что сейчас современные чатботы основаны на обучении. И я считаю, что это не очень хорошо, потому что часто эти диалоги не похожи на человеческие. Они не естественные диалоги. Я считаю, что нужно применять какие-то традиционные методы компьютерной лингвистики для создания чатботов. Этого, к сожалению, пока не происходит. Насколько мне известно. Или происходит не так широко. Поэтому опять же нужно комбинировать все эти подходы. А на самом деле есть соревнования, которые оценивают все эти чатботы. И действительно некоторые чатботы проходят тест тьюринга. И сейчас есть и другие тесты, которые более сложнее, чем тест тьюринга. Там, конечно, уже сложнее. Но вообще перспективы есть.

 

                  Кузнецов:

                  Понятно. Спасибо большое Иван. Мы продолжаем нашу дискуссию в научном направлении. И следующего человека, которого я бы попросил выступить, это Евгений Бурнаев, доцент Сколковского института науки и технологий, также центра Сколтеха по научным инженерным вычислительным задачам с большими массивами данных. Вот я думаю, Евгений нам сможет опять же в несколько обзорном стиле рассказать, как на сегодняшний день можно оценить вообще уровень развития области, машинного обучения, искусственного интеллекта в России, в мире. И какие перспективы есть у этой области. И как, собственно, индустрия, о которой мы уже заговорили, реагирует на последние достижения науки. Евгений, вам слово.

                  Бурнаев:

                  А можно презентацию не просто открыть, а нажать контр л, на полный экран вобщем. Спасибо. Хорошо, работает отлично. Вот сейчас были сказаны такие слова - машинное обучение в индустрии. Поэтому я сейчас, прежде чем прокомментировать этот вопрос, я сейчас очень кратенько расскажу про структуру, как в основном задача выглядит и как это применяется. Приведу пару примеров и потом уже прокомментирую ответ на этот  вопрос. Обычно большое количество задач, которые решаются в индустрии, они условно выглядят так. У нас есть некоторые на вход подаются параметры, которые описывают реальный объект. И есть, либо проводится эксперимент, либо проводится измерение сенсоров этого технического объекта и снимаются какие-то характеристики выходные, которые характеризуют там качество производимого продукта, какие-то экономические потери или, наоборот, прибыль. Соответственно цель состоит в том, чтобы по вот таким собранным данным входа, выхода построить продиктивную модель и с помощью этой продиктивной модели можно уже решать большое количество задач, прогнозировать будущее поведение, обнаруживать аномалии и разладки, прогнозировать поломки в  этой технической системе, прогнозировать ее дизайн. И соответственно рекомендовать какие-то будущие действия. Но вот пример такой задачи очень такой естественной. На этом слайде речь идет о производстве сахара. Соответственно есть ряд параметров, характеризующих это производство. Таких, как качество сырья, температура, давление, какие-то другие параметры. И на выходе у нас получается то, что можно измерить, это какого качество производима продукция, какие потери. И если мы по этим данным можем построить модель, то дальше можно в режиме практически реального времени подстраивать производство, чтобы оптимизировать экономическую выгоду. Другой, тоже естественный пример подобного типа задач, это вот, например, рассматривается сухогруз и получая на вход данные о погоде, о течениях, о том, какого типа сухогруз, какой маршрут, какая скорость, можно прогнозировать затраты топлива и соответственно оптимизировать расход топлива, пытаться обнаруживать какие-то мошенничества с топливом и так  далее. Но это понятно. Потому что такого типа задачи не только здесь возникают, но и они возникают, когда мы проектируем какие-то лекарства. И математически это можно¸ структурно можно подобным образом формализовать. В любом случае машинное обучение, здесь, если мы говорим о реальных приложениях, оно не висит в воздухе, а собственно весь процесс можно разбить на три части. Внизу понятное дело - это сбор данных. Потом идет непосредственно построение модели. И дальше эта модель и ее прогнозы позволяет как-то оптимизировать какие-то бизнес метрики, чтобы получать прибыль. Но вот на самом деле уже на первом уровне возникают обычно какие-то сложности здесь. Какие сложности есть. Во-первых, со сбором данных есть сложность в том, что многие иные производственные индустрии, если там оборудование устаревшее, не везде сенсоры стоят. То есть очень много, могут быть пропуски в данных, могут быть и подлоги в данных, если данные вручную как-то записываются в журнал. То есть еще и требуется оцифровка. Соответственно данные просто не всегда присутствуют. Дело в том, что многие модели обучить, особенно модели глубинного обучения требуются большие выборки. Соответственно просто эти большие выборки не всегда существуют или не всегда их просто получить от индустриального заказчика. Ну и соответственно не всегда это оборудование обеспечено сенсорами, чтобы эти данные собирать. Но, тем не менее, в России в некоторых индустриях, там в банковской, некоторые новые производства, эта проблема в той или иной степени решена. Но на самом деле после того, как данные собраны, опять-таки методы из коробки, что называется, из каких-то стандартных библиотек машинного обучения для решения реальных задач. Они часто не всегда годятся, потому что есть опять-таки, данные могут быть из разных источников, значит содержать шумы могут. Поэтому требовать онлайн обработки. Вот в том примере с сухогрузом, там данные получаются с сенсоров, имеющих совершенно разную природу. Таким образом часто требуется разработка каких-то дополнительных методов. И как следствие существует в мире, как всем известные компании, а также университеты, которые готовят специалистов и позволяет такого типа методы разрабатывать. В России тоже существует центр. Во-первых, крупные айти компании, которые поддерживают такого типа деятельность. Вот они перечислены. Яндекс, Мэйлру и другие. Есть ряд учебных программ, которые готовят специалистов. Исследовательские институты, где есть сильные научные группы. И соответственно компании, которые эффективно используют машинное обучение в своей деятельности. Но, к сожалению, не все так просто, потому что существуют достаточно большие риски, связанные с тем, что есть значительное отставание по железу. Есть соответственно, как я уже говорил, недостаток в том, что нет открытых каких-то тестовых выборок для того, чтобы проводить сравнения и соревнования. Потому что после того, как разработан любой из алгоритмов, необходимо эти алгоритмы сравнивать. Насколько мы находимся относительно мирового уровня и так далее. И конечно есть определенные сложности. Не всегда, так сказать. Необходимо повышать количество и качество публикаций фактически. Но, тем не менее, несмотря на то, что все эти проблемы присутствуют, работа ведется и вот на счет ответа на вопрос, какие перспективы в этой области. Значит, перспективы представляется, что здесь действительно большие, потому что во многих индустриальных проектах можно существенно оптимизировать потери и экономический выход. На счет реакции индустрии. Индустрия очень заинтересована. Она сталкивается с теми проблемами недостатка данных и так далее. Вот которые я перечислил. Но индустрии, прежде всего, нужно конкретное решение, которое приносит экономическую выгоду. Значит, если для получения такого решения требуется разработка новых методов проведения научных исследований, тогда это уже на самом деле проблема того ученого или той компании, которая такие услуги предоставляет. Она должны уметь обосновать это. Но здесь индустрия обычно не слишком вовлечена, скажем так, в такие академического типа программы, к сожалению. Это одна из вещей, которые нужно, кажется, что менять. Должно быть больше контактов с индустрией, потому что именно она мотивирует постановки задач новые, что важно на самом деле для академических исследований. А также дает материал, данные, на которых можно регистрировать полезность и качество алгоритмов. В общем, если подытожить, я могу сказать, что задач много, задачи интересные и определенные успехи есть. Но надо трудиться дальше. Спасибо.

 

                  Кузнецов:

                  Спасибо Евгений. Вопрос как раз про индустрию. Вот индустрия дает задачи. Мы их решаем. Общими силами мы решили задачу. Можно сказать, что мы произвели что-то научно ценное всегда? И каков процент именно таких задач, которые составляют серьезный научный челендж, а не являются просто решением проблем недостатка компетенции в компании?

 

                  Бурнаев:

                  Ну, про процент мне сложно сказать. Действительно очень много задач, при решении которых фактически я некоторым образом образовываю заказчика. Я ему рассказываю как правильно поставить задачу, зачем ему это нужно. А дальше для решения, в итоге все оканчивается тем, что там большая трудность просто собрать данные и применить относительно стандартные методы. Наверное, большинство задач именно такие. А процентов 10 требует разработки серьезных методов. Но часто оказывается потом, что когда такой метод разработал некоторым чудесным образом находятся по аналогии похожие задачи где-то еще можно применить и это не пропадает в туне в том смысле, что это не одноразовая вещь. Поэтому тут сложно оценивать.

 

                  Кузнецов:

                  Понятно. Спасибо большое, Евгений. Вот начали говорить про индустрию и в принципе про взаимодействие индустрии с наукой. Как наука приходит, как заказчик в институты, в том числе в Сколковский институт науки и технологий, поэтому возникает логичный вопрос. Какие реальные примеры можно привести индустриальных заказчиков, проекты, которые были выполнены успешно вообще в России даже может быть общий какой-то обзор. И опыт решения таких научных задач. Как этот опыт можно масштабировать вообще на российскую промышленность. Я попрошу ответить на эти вопросы Алексея Зайцева. Младший научный сотрудник Сколковский институт науки и технологий. Алексей.

 

                  Зайцев:

                  Спасибо Максим. У меня тоже можно развернуть. Я хочу поговорить про технологий, которая как раз и была внедрена в промышленность, которая имеет отношение к искусственному интеллекту, как я его понимаю. То есть как мы уже обсуждали, у нас нет непосредственно искусственного интеллекта сейчас в России и вообще в мире нет. Есть машинное обучение. То есть мы берем некоторые данные, обучаемся на этих данных и получаем результаты, которые могут быть полезны в индустрии. И как раз один из таких примеров, которым я занимался еще до того, как работал в Сколково в том числе, в компании "Эдванс". Это про то, как можно пытаться все это применять в аэрокосмической индустрии. А именно я в том числе делал проект для компании "Аэрбас", которая занимается тем, что делает самолеты. И можно сказать сделал маленькую революцию в области применения данных как раз аэрокосмической индустрии. И соответственно мне хотелось про эту технологию рассказать. Технология называется суррогатное моделирование и идея у нее следующая. Сначала проговорим про обычное моделирование. Пусть у нас есть некоторый процесс. На входе мы получаем геометрию крыла, режим полета, например, если у нас есть самолет. А на выходе мы получаем то, насколько этот самолет качественно летает, то есть насколько у него большая подъемная сила, насколько у него большое сопротивление воздуху. И соответственно, чтобы посчитать эту целевую функцию, нам нужно применить какой-нибудь метод. Взять супер компьютер, запустить этот метод на супер компьютере и в итоге получить результат. Оказывается, что такие учителя очень дорогие. То есть два с половиной часа на кластере стоят посчитать для одного крыла. А в индустрии нужно, чтобы таких вычислений было сделано несколько сот тысяч. То есть для того, чтобы сертифицировать крыло или, например, чтобы это крыло оптимизировать, то есть получить такое крыло, у которого подъемная сила максимальная из возможных и тогда получается, что нам нужны какие-то модели, которые позволят заменить исходное моделирование и которые позволят получить все это гораздо быстрее. И один из подходов, который позволяет это делать - это суррогатное моделирование. То есть мы генерируем много данных, то есть генерируем много кратных крыльев, для каждого крыла считаем целевую функцию, а потом строим такую зависимость, которая будет приближенно соответствовать реальности на основе тех данных, которые у нас есть. То есть, если нам дают новое крыло, то мы сможем быстро посчитать целевую функцию для такого крыла. И соответственно мы уже сможем быстро оптимизировать, потому что мы каждое новое крыло считаем за несколько миллисекунд. И получается, что такой подход, то есть когда мы заменяем исходные тяжелые модели вычислительные на суррогатные модели, которые считаются очень быстро и которые построены на данных, он работает не только в авиа индустрии, то есть он работает и когда мы берем молекулу и для этой молекулы пытаемся понять, будет ли она взаимодействовать с другой молекулой. То есть пытаемся понять хорошее это лекарство или плохое. И точно также там есть вычислительные модели и мы умеем для таких вычислительных моделей строить суррогатные модели. Точно также можем расценивать, например, прочность композита в обшивке самолета. Если говорить про конкретные результаты, то применение технологии построения суррогатного моделирования в компании "Аэробас" позволило для последнего самолета, который они разрабатывали, уменьшить время разработки на 5 %, то есть искусственный интеллект оказывается очень полезным в индустрии. С точки зрения индустрии во всяком случае. А с чьей точки зрения это можно оценивать? И у меня осталось немного времени. Я хочу еще один сюжет рассказать. А именно про то, что нам часто нужно использовать более продвинутые технологии. Не просто брать готовое решение из коробки, а часто разрабатывать для индустрии, для конкретной задачи что-то свое. В данном случае я говорю про то, что часто мы можем посчитать вот  с помощью такого тяжелого вычислительного метода несколькими способами на самом деле. Мы можем взять совсем тяжелый метод, который будет считаться 2,5 часа на кластере, на супер компьютере. А можем взять что-то более дешевое, но менее точное, которое будет считаться за минуту, например. И таким образом нужно будет интегрировать несколько результатов измерений, несколько источников данных так, чтобы на выходе получить модель, которая точно аппроксимирует истинную зависимость, которая нам собственно и интересна. И оказывается, что если мы умеем такую штуку комбинировать хорошо, то можем еще на 30 % снизить время разработки, например, элементов двигателя самолета. И собственно, на самом деле такие технологии, я говорил про примеры в индустрии, в "Аэрбасе", в аэрокосмической промышленности. Потому что мне они ближе, потому что эти проекты делал сам. А если мы говорим в целом, более широко, то такие проекты можно делать в компаниях типа Яндекс. Там возникают аналогичные задачи и постановки задач. И я хотел бы просуммировать, что в целом оказывается, что искусственный интеллект в принципе может использоваться почти в любой области промышленности. Главное - нужно понять, куда бить, какие задачи решать. И на этой, наверное, оптимистичной ноте хотел бы закончить.

 

                  Кузнецов:

                  Алексей, спасибо большое. Я услышал в вашем докладе, что вы говорили, что все эти замечательные методы машинного обучения можно использовать в том числе и в здравоохранении. Здравоохранение является важнейшей государственной отраслью, основной практически безопасности народа, людей, всех, потому что здоровье людей - это одна из самых важных, то, о чем и должно заботиться государство. Вот  насколько рискованно вообще в такой области применять методы, которые не столько много знают про физические или химические законы, а основаны только на каком-то опыте. Можно ли попробовать такие методы применять именно для создания лекарств?

 

                  Зайцев:

                  Исходя их моего опыта взаимодействия с фарминдустрией, получается, что в разработке лекарств есть порядка семи этапов. И соответственно первый, нулевой этап это как выбрать ту молекулу, которая окажется хорошим кандидатом для лекарства. И тогда на этом этапе можем безопасно выбрать с помощью суррогатного моделирования нужное лекарство. А потом уже постепенно будем наращивать риски, сложность эксперимента, который мы делаем. То есть сначала мы ставим эксперименты на животных, например, и только потом уже делаем на людях. То есть с точки зрения безопасности это не будет отличаться от того процесса, который был раньше. То есть, если мы аккуратно и с умом применяем искусственный интеллект в индустрии, то никто не пострадает.

 

                  Кузнецов:

                  Хорошо. Спасибо большое. Это было мнение Алексея Зайцева, младшего научного сотрудника Сколковского института науки и технологий. Мы продолжаем нашу научную беседу. Я бы попросил Александра Гурьевича Марчука выступить. Рассказать о том состоянии дел, которое есть в России. Я думаю, как директор института систем информатики Сибирского отделения РАН. Вы знаете, наверное, больше, чем многие другие. И на что я хотел бы обратить ваше внимание. Вы как директор академического института, я думаю, как никто другой можете нам рассказать о том, как государство поддерживает или есть какие-то проблемы в поддержке исследований в направлении искусственного интеллекта или анализа больших данных. Что мы все тут вообще говорили о данных. Как вы можете, пожалуйста, прокомментировать?

 

                  Марчук:

                  Спасибо. Добрый день всем. Во-первых, поскольку я тут единственный представляю академическое сообщество, я хотел бы немного отсутствующих представить. Академик Колчанов, который не смог подъехать. Он возглавляет институт социологии и генетики и очень активен именно в применениях методов искусственного интеллекта и больших данных в первую очередь в задачах биоинформатики, генома и так далее. Но Евгений Павловский - это руководитель конкретной производственной фирмы, которая очень активна именно в прикладных исследованиях и разработках в этой области. Ну а наш институт, институт системы информатики, собственно, занимается технологиями. Так скажем. Инфраструктурами, методами, математикой и вот подобными делами. Я сосредоточусь на предмете нашего института. Во-первых, мы занимаемся искусственным интеллектом очень давно, почти 50 лет. Так получилось. У нас лаборатория искусственного интеллекта была создана, я не помню, по моему в 1969 году. Искусственный интеллект базируется на, так скажем, условно трех составляющих. Первое - это теоретическая, алгоритмическая база, которая постоянно совершенствуется. Есть плот фундаментальных исследований. Вторая - это собственно аппаратные возможности. И третья - работа с данными, структуризация данных, обработка данных. А сегодня мы говорим о больших данных. Коротко прокомментирую эти вещи. По алгоритмике я не буду, здесь собственно задача. Иван Смирнов неплохо охарактеризовал. По аппаратным возможностям. Здесь, к сожалению, пока никаких перепрыгиваний на какие-то другие решения в обозримом будущем не видно. Квантовые вычисления пока не в такой стадии, чтобы их можно было закладывать. Супер компьютеры тоже оказываются некоторые проблемы для их использования в этих задачах, несмотря на то, что сами алгоритмы искусственного интеллекта, машинного обучения очень трудоемкие. Иногда чрезмерно трудоемкие, но их распараллеливание не так просто. И в общем здесь хороших методик фундаментальная наука еще пока не везде предложила. Так что обычные средства или кластеры или какая-то распределенная система, состоящая из компьютеров. Сейчас действительно во многом проблематика упирается в работу с данными. То есть, если раньше как-то оно все было в рамках все-таки более локальных экспериментов и каких-то определенных слоев, то сейчас интернетизация, такая массовая, очередной виток индустриализации цифрового мира и соответственно проникновение во все сферы жизни, действительно поставили задачи работать с большими данными. Проблема оказалась в том, что как бы количество переходит в качество. И те алгоритмы, и подходы, и технологии, которые раньше работали на небольших данных. Они перестают работать на больших и соответственно здесь большой фронт опять фундаментальных и прикладных исследований. Здесь я хотел бы отметить, что по всему спектру, связанному с технологиями искусственного интеллекта, машинного обучения и работы с большими данными вот на сегодняшний момент инженерия опережает фундаментальные исследования по некоторым причинам, я не буду так сильно вдаваться. Но вот так получилось. Они как-то более смело к этому относятся. А ученые пытаются что-то обосновать уже задним числом. Хотя это тоже все не так просто. Например, такого четкого, ясного, научного, математического базиса в даже старой технологии нейронных сетей не существует. Так вот. Есть проблема. Тем не менее, мы живем, делаем какие-то вещи. Вот что конкретно хочет наш институт на сегодняшний момент и вот в сегодняшних условиях. Мы хотели сейчас достаточно энергично развернуть исследования не только фундаментальные, но и прикладные исследования и разработки в области больших данных и искусственного интеллекта. В этом плане мы объединяем усилия. Понятно, локально какую-то часть усилий кроме нашего института еще институт математики Сибирского отделения, институт вычислительной математики и математической физики. Вот здесь директор присутствует. И соответственно пытаемся сформировать некоторую программу с такой более технологической нацеленностью. Обычно академические ученые, они все-таки их результат это какие-то исследования, теоремы доказанные какие-то, статьи написанные. Но нам кажется, что мы в состоянии в этой области доводить дело до прототипных решений, до технологических решений и соответственно в дальнейшем уже выходить на производство и все такое. Что мешает всему этому процессу, начиная от фундаментальных исследований до вот собственно прикладных разработок? Наверное, мешает то, что здесь произошел разрыв, как я уже сказал. Что инженерия опережает вот эти процессы. Фундаментальной науке как-то трудно угнаться еще и потому, что слабовато финансируется. Соответственно, чтобы преодолеть этот самый разрыв, мы пытаемся как бы присоседиться к этой самой инженерии и уже попробовать найти средства для развития из бизнеса или из каких-то больших серьезных программ, государственных и негосударственных. Реально мы вот эти усилия сейчас превращаем в конкретный проект. Вот усилия, про которые я говорю, с объединением трех институтов. И пытаемся его, так сказать, официализовать, легализовать через нашу систему. У нас есть ФАНО, федеральное агентство научных образований. Мы туда представим. У нас есть академический мир. Так академия наук апробируется и так далее. И соответственно вот эта же программа является еще и связующей с бизнесом. А у нас в Академгородке в первую очередь Новосибирска, но в первую очередь в Академгородке очень развиты айти технологии именно как бизнес. Так что здесь есть с кем общаться. Какие у нас основания считать, что мы достигнем какого-то позитивного результата, конкурентоспособного результата? Понятно, что в мире много чего делается. Мы пытаемся как-то быть в курсе, пользоваться лучшими достижениями. Но у нас есть свои некоторые, уникальные достижения по всему спектру вопросов, которые называются инфраструктура больших данных и искусственного интеллекта. Собственно технологии больших данных и искусственного интеллекта. В области собственно у нас структурирование данных. Соответственно там есть и теоретические, и практические результаты в области структуризации, антологических описаний и так далее. В области хранения, обеспечения отказа устойчивости тоже мы освоили кодирование Рида-Соломона для этих задач в распределенных системах. Тоже есть хорошие результаты. Есть результаты в области быстрого, эффективного доступа к данным, так на замену традиционных СУБД, есть хорошие результаты в области базовых алгоритмов аналитики анализа данных и выявления закономерностей. В частности есть вероятностно-логический метод. Он в институте математики был придуман. Сейчас и мы тоже им занимаемся. Есть фриз метод Николая Григорьевича Загоруйко. То есть кроме той базы общемировой, на которую мы можем опереться, есть свои уникальные достижения, которые, мы считаем, порождают конкурентоспособность. Но вот пожалуй все, что я хотел сказать.

 

                  Кузнецов:

                  Спасибо большое Александр Гурьевич. У меня такой очень короткий вопрос к вам. Мы догоним или перегоним в итоге?

 

                  Марчук:

                  Так сказать, всегда мы ориентировались, что мы единым фронтом в науке движемся и наша наука это часть общемировой. В этом смысле у нас нет вопроса - догоним и перегоним. Но сейчас появились специфические задачи или там восстановилась специфическая задача сохранения технологического суверенитета. И здесь очень серьезно надо эти вопросы ставить. Например, есть такие инфраструктурные решения, которые большинство знает, как облачные структуры. Облако, Амозон или Майкрософта. А у нас-то их нет. А у нас есть закон - хранить данные у себя. А это очень удобно, это технологично, это перспективно. Соответственно мы хотим и в этом направлении тоже работать. И обогнать.

 

                  Кузнецов:

                  Спасибо большое, Александр Гурьевич. Мы практически уже завершили нашу научную часть. И наш последний доклад из научной сессии, из научной части нашей сессии будет озвучен Евгением Фроловым, аспирантом Сколковского института науки и технологий. Рассказывать Евгений будет как молодой ученый о достаточно молодой области о рекомендательных системах. Потому что искусственный интеллект это система автоматического принятия решений, а вот рекомендательные системы эти решения помогают принять. Евгений, вам слово.

 

                  Фролов:

                  Максим, спасибо большое. Добрый день коллеги. Вот Максим сказал, что это из научной части. И, наверное, довольно знаково, что это будет завершать научную часть, потому что рекомендательный системы, это все-таки область на стыке науки и технологии и индустрии, самое главное. И основным заказчиком конечно же является именно индустрия, а не компании. Я кратко скажу, что такое рекомендательные системы, чтобы немного задать тон тому, о чем я дальше буду рассказывать. Собственно рекомендательные системы позволяют принимать решения в огромном пространстве выбора. То есть мы живем в эру развития интернета, развития потоков информации, которые превосходят любые человеческие возможности по их анализу и обработке. И вот собственно интеллектуальные системы обработки данных, такие как рекомендательные системы, позволяют, проанализировав вот этот скоп данных или потоков информации, помочь человеку принять какое-то решение. Естественно самый простой пример. В интернет магазине вы хотите найти что-то подходящее для себя, так какие-то товары или может быть услуги. И обычно каталог в магазинах огромный и можно потеряться. И вот рекомендательные системы позволяют подтолкнуть какие-нибудь более релевантные конкретно для вас услуги или товары, чтобы вы как можно быстрее их нашли, приобрели или приняли какое-то решение. И ключевой момент, что вот эти рекомендации являются персональными, то есть на основе индивидуальных предпочтений пользователя, покупателя. И возникает вопрос, как же так алгоритм находит вот эти решения. Здесь анализируется, это очень важный момент, к которому я вернусь дальше. Здесь анализируются некие поведенческие потерны, шаблоны людей, толпы. То, как люди себя ведут содержит много информации, которая в том числе позволяет делать предсказания и для индивидуума, для отдельно взятого человека. И вот примеры. Может быть кажется, что интернет магазин это что-то вроде бы модное и популярное, но вот я просто приведу некоторые цифры. Это по состоянию еще на 2012 год. Но вот Амазон, о котором уже сегодня говорили, известный не только своими технологическими решениями, но и собственно интернет магазином, в 2012 году рапортовал об увеличении их прибыли на почти 3 млрд. долларов за год. Все это довольно крупная сумма, которая была достигнута лишь за счет внедрения рекомендательных систем. Нетфликс - другая известная компания, стриминговая, которая обеспечивает доступ к медиа контенту, видео сериалы и так далее, сообщает о том, что порядка 75 % всего потребляемого контента приходит за счет рекомендаций. То есть то, что их пользователи смотрят, они находят не сами, а за счет того, что алгоритм подсказал. И вот эта цифра - 75 % как бы приобретает смысл, если учесть, что Нетфликс генерирует в Северной Америке порядка 35 % всего медиа трафика. То есть одна компания занимает 35 % интернета в части медиа трафика своим сервисом. Собственно теперь к повестке нашей беседы, к применению технологий машинного обучения и в частности диплионинг в рекомендательных системах. Тут Иван Смирнов уже говорил, что они крайне полезны в обработке текстов, в обработке изображения. Они позволяют нам превращать массивы какой-то структурированной информации в некое компактное представление, которое в дальнейшем может быть использовано в неком стеке алгоритма машинного обучения. И в этом смысле диплионинг является лишь вспомогательным инструментом, то есть вот то, что мы называем искусственным интеллектом здесь в этом плане играет не решающую роль, а лишь вспомогательную. И всегда за этим стоит какой-то дополнительный алгоритм или набор алгоритмов, который использует эту информацию, уже предобработанную на вход и вот через них генерируется решение. Как самостоятельная технология для построения рекомендательных систем алгоритмы диплионинга лишь сейчас только начинают использоваться. Но там возникает ряд проблем. В частности рекомендательные системы обычно сопровождаются большим набором бизнес логики, которую не всегда возможно напрямую реализовать. Вот об этом тоже уже говорилось, что невозможно логику человека смоделировать. Кроме того, поскольку мы говорим о бизнесе, конечно же здесь возникает вопрос о соотношении затрат на технологическое обеспечение, на поддержку, на развитие вот этих систем по отношению к выручке, к доходу компании. И в сравнении с другими алгоритмами машинного обучения пока что те алгоритмы глубинного обучения, которые присутствуют, сейчас представлены в академической среде и в индустрии конечно же являются довольно сложными и затратными. И еще один момент, о котором опять же Иван Смирнов говорил, проблема интерпретируемости. Бизнес всегда хочет понимать, вот если рекомендация была плохая на сайте, пользователь остался недоволен, то что же произошло. Почему модель именно такую рекомендацию выдала и как можно это исправить. И в этом плане у простых моделей есть огромное преимущество. Они может быть не всегда дают точные рекомендации или могут давать не настолько точные рекомендации, но при этом их можно легко изменить или, по крайней мере, проанализировать. Немного я сгустил краски, но как бы, чтобы смягчить, все-таки у моделей глубинного обучения есть потенциал в плане каких-то новых сценариев неизведанных там, где сложно вообще сформулировать, сказать машине на каком-то логическом языке, что же хочется получить. Есть просто набор каких-то данных, хочется чтобы было хорошо. В этом плане алгоритмы глубинного обучения дают некую свободу. Но вот проблема в том, что у них таких сценариев пока что не так много, их сложно придумывать. И чтобы переложить это на какое-то заключение и перейти к России, можно выделить два тренда или веяния. На основе тех особенностей или сложностей, которые я озвучил, можно сказать, что проявляется некая консервативность именно со стороны бизнеса в пользу понятных, простых, интерпретируемых алгоритмов. С другой стороны есть некие пионеры в индустрии, такие как Амазон, Нетфликс и в том числе Майкрософт и ряд других высокотехнологичных компаний, которые, наоборот, выпускают всевозможные библиотеки, готовые решения в общий доступ. Это вот некая комодитизация технологий, то есть выход в массы. Что соответственно облегчает другим компаниям, менее развитым или начинающим вот этот путь в область машинного обучения, основанного на глубинном обучении. Собственно такие пионеры задают тон и сейчас тренд конечно в их пользу постепенно, но все-таки, если переходить к российскому рынку, у нас сами рекомендательные системы даже без относительно конкретных технологий стали набирать популярность лишь несколько лет назад, в то время как за рубежом, на западе и в частности в Америке они уже существуют больше 20 лет. Амазон в этом году двадцатилетие отпраздновал первого алгоритма рекомендательного. То есть, соответственно, если говорить про какие-то технологические стартапы, которые  предлагают облачные решения по рекомендательным системам, то им конечно сложно приходить в какую-то компанию, которая хочет у себя внедрить рекомендательные системы, но не знает до конца что это такое. Вот сложно продавать диплионинг. Легко продать какую-то простую модель, потому что вам не нужны будут дорогие специалисты, вам будет легко поддерживать, затраты будут минимальные. Может быть немного будет качество, но это вполне измеряемые, ощущаемые. Легко ощутить выгоду от таких вот предложений. А диплионинг остается такой вот прерогативой высокотехнологичных, модных компаний, которые ориентированы именно на такой мощный стек современных алгоритмов. Завершая, скажу, что это немного парадоксально, потому что вот как показывает практика именно у небольших и средних компаний выгода от внедрения рекомендательных движков может достигать, если в цифрах по конверсии смотреть до 50, до 60 %. В то время, как у крупных компаний это обычно в 2-3 раза меньше. То есть, казалось бы, наоборот, молодые компании должны смотреть вперед и внедрять всячески эти алгоритмы. Но такое сейчас только лишь начинает набирать обороты и в этом плане у России большой потенциал. Главное, чтобы было понимание у российского бизнеса о полезности вот этих технологий. Спасибо.

 

                  Кузнецов:

                  Спасибо большое, Евгений. Постараемся держаться мы регламента, но один вопрос я все-таки задам. Если мы пофантазируем немного и поиграем в страшилку про будущее. Какова вероятность, что вот такие вот интеллектуальные систему будут не помогать тебе выбрать, а диктовать тебе выбрать?

 

                  Фролов:

                  Это очень хороший вопрос. Действительно такая проблема существует. Есть понятие пузыря, когда алгоритм просто предобучается на какие-то наши, ярко выраженные предпочтения и рекомендует только то, что укладывается в эти предпочтения. Наверное, такой самый острый пример это политические взгляды. Есть ли опять же говорить про США, как некий простой пример. Если вы демократ, то вы будете постоянно получать рекомендации новостей, например, или чего-то еще с точки зрения демократа и никогда не будете видеть альтернативную точку зрения и в этом плане ваш информационный круг остается довольно узким. И в том числе вами легко манипулировать за счет  этого, потому что понятно, даже у Фейсбука есть такие эксперименты, когда они независимо и незаметно от пользователей специально как-то изменяют новостную ленту и смотрят за тем, как меняется поведение пользователей. Такая ситуация есть, но как бы здесь вопросы уже поднимаются этические. Они очень сложные.

 

                  Кузнецов:

                  Понятно. Спасибо еще раз, Евгений. Мы переходим к нашей второй части, к индустрии. Напомню, что, к сожалению, мы вынуждены держаться регламента чуть более строго. И продолжит видимо рассказ о том, как индустрия готова внедрять разные системы, сложные или простые Алексей Сачик - эксперт управления коммерциализации платформы мульти-ди АОИКОСЕ. Евгений вам слово. Алексей вам слово, прошу прощения.

                 

                  Сачик:

                  Максим, спасибо. Всем добрый день. Коротко, что такое мульти-де и что такое за компания АОИКОСЕ. Компания это инжиниринговая и дивизион корпорации Росатома. Мы немного не мало лидеры по сооружению атомных электростанций в России и за рубежом. И технология мульти-де - это платформа управления проектами сооружение сложных инженерных объектов не только АЭС, разработанная нами примерно лет 10 назад, которая в своем технологическом развитии опережает лет так на 7-10 бинтехнолгии, многим известные из вас, технологии цифрового моделирования в первую очередь зданий. И давайте поговорим про покупки и продажи, про коммерциализацию, как это Евгений очень так мягко пас в эту сторону сделал. Я продолжу с точки зрения промышленности. Готова ли промышленность. Сложно говорить за всю промышленности конечно же, но пару примеров приведу. Конечно готова. Более того, есть конкретные кейсы у зарубежных и российских компаний. О том, как это используется. Есть такие компании, как Дженерал Электрик-с, Рол-с Рой-с, производители сложного оборудования, двигателей. На самолетах стоят. Собственно, что применяется там. Значит, ситуация очень простая. За один час полета самолета двигатель передает в центр обработки данных примерно 25 мегабайт текста, то есть это текстовый файл с различной параметрикой. Это существенный объем данных, который нужно на лету обрабатывать. Вот, пожалуйста, кейс, когда нужно принимать решение о состоянии двигателя. Может он летать дальше, не может. Какое состояние лопаток и так далее. Собственно на базе таких кейсов были созданы программные продукты по ремонту, по состоянию. Вот конкретный заказ рынка. Что нужно. Что можно сделать дальше еще. В российской практике компания КАМАЗ, например, ставит такие системы на свои двигатели. То есть контрактные обязательства, гарантийные обязательства производителя двигателей перед потребителем. И зачастую эти гарантии просто нельзя проконтролировать, нельзя проверить, нарушались ли гарантийные условия обслуживания двигателя и компания несла огромные убытки. Там миллиардные убытки в год за счет того, что не могла проверить, а как эксплуатировался двигатель. Начали разрабатывать системы как раз оснащения датчиками двигателей, после внедрения которых стало возможным проверить всю историю эксплуатации двигателя, и собственно как только приходили по аля гарантийному случаю в лабораторию, вся история на лицо. Дружище, что ты сделал тут, что ты залил там. Почему тут не долил, тут не дообслужил и так далее. Все. Вот пример использования из промышленности. Что касается атомной энергетики. Но вот моя любимая тема - это порождающее проектирование. Это то, что в системе разделения труда, близкое ко мне, может совершить революцию в ближайшем будущем. Это новые технологии, когда машина будет  предлагать что-то человеку, проектировщику, который эксперт в той или иной дисциплине. И все, что останется сделать человеку , это выбрать одно из предлагаемых решений. Понятно, что это из области фантастики, но, тем не менее, такие наработки уже ведутся как и в Сколково, так и конечно в МАТИ. Что еще. С точки зрения опять же, как можно поработать с покупателем, как можно предлагать что-то, связанное с глубинным изучением, с искусственным интеллектом. Я считаю, что предлагать ничего не надо. Надо разрабатывать решения, разрабатывать продукты и покупатель сам придет. То есть, как бы мы смотрим на искусственный интеллект как на систему разделения труда и если продукты этой системы решают определенную задачу в сокращении времени выполнения проектных работ или каких-то там аналитических задач. Все. Соответственно как бы повышается производительность новой системы разделения труда, на этот продукт приходит покупатель сам. Вот тот, кто первый придет, у того будет существенная доля рынка. Вторые и третьи будут немного догонять. А все остальные будут пользоваться продуктами первых. В нашем случае покупателями таких решений являются крупные промышленные компании, производители оборудования, инжиниринговые компании. Вот конкретно для нашего дивизиона можно много технологических проектов уже брать сейчас и тестировать, создавать пилотные проекты и так далее. Еще хотел бы поговорить про трудности, с которыми могут сталкиваться такие проекты. Как любая система разделения труда состоит из трех частей. Это нормативная база, сама технология и люди, те самые визионеры, которые берут и это все двигают. Так вот, ан мой взгляд, с визионерами проблем у нас нет, технологии вроде есть, а вот нормативная база может хромать. Собственно там как только это все будет собрано в цепочку, тогда мы увидим яркие какие-то звездочки от стартапов и так далее, которые будут успешно. Я очень как бы коротко. Лучше давайте потратим время на вопросы. Если они есть, я буду рад ответить.

 

                  Кузнецов:

                  Как раз про вопросы. Вы говорите, что интересуетесь очень какими-то моделями, которые позволяли бы создавать что-то новое. Вот есть такое направление генеративные модели, в частности там есть сейчас призма, генерация стульев Икея. По трем образцам стульев Икея генерируешь целый модельный ряд на основе нейросеток последние там несколько публикаций можно посмотреть, очень популярно. В картинках работает нормально. А если ты строишь небоскреб, как такой генерации можно доверять? Или ее можно использовать просто как старт уже для расчетов?

 

                  Сачик:

                  Надо смотреть на модель. Надо смотреть, как она будет масштабироваться в рамках предметной области конкретной. Если модель подходит как бизнес модель, если она масштабируема, то это успех. Также и здесь. С точки зрения техники, если модель данных адаптивно масштабируется, если она параметрическая, что очень важно, то надо просто брать и применять.

 

                  Кузнецов:

                  Хорошо. Спасибо большое. Надо брать и делать. Переходим к следующему докладчику. Следующей я попрошу выступить Полину Лукьянову - директора бизнес инкубатора Ингрия. Мы тут как раз чуть-чуть про стартапы начали. Вот вы может быть расскажите?

 

                  Лукьянова:

                  Здравствуйте, коллеги. Вы знаете, примеров сегодня было приведено очень много. Вот таких отраслевых решений, скажем так. Поэтому, наверное, на них я не буду останавливаться. Но как директор бизнес инкубатора может быть так немного внесу остроту немного поспорив с предыдущим докладчиком. Потому что, безусловно, я считаю, и я вращаюсь в этой сфере и я считаю, что решения российских разработчиков являются одними из лучших в общем-то на мировой арене. Но вот коммерческих продуктов опять же, если мы сравниваем себя с другими странами, как, например, Америка, которая является одним из крупнейших потребителей решений в области. Давайте будем называть эти решения в сфере искусственного интеллекта. Хотя, как, безусловно, все тут согласились, что искусственного интеллекта у нас нет. Так вот бизнеса у нас в России на базе таких решений мало. К сожалению. То есть это там связано со многими факторами. Мы не будем  это сейчас рассматривать. Хотя можно проанализировать ситуацию и я ее уже анализировала естественно. Что касается решений, которые существуют у нас в России. Смотрите, я буду со стороны бизнеса исключительно. И надо понимать, что по причинам, которые уже предыдущие докладчики рассказывали, эти решения, наверное, не являются высокотехнологичными. Потому что технологии как таковой там не так много. И представители научных институтов конечно здесь, наверное, меня поддержат. Но как бизнес решения могут привести, например, из своих резидентов. В сфере персонал системс такие вот персональные помощники у нас, например, есть такой резидент - Стафари, который в общем-то сделал робота Вру, робот рекрутер, который сейчас успешно применяется в больших корпорациях, крупных компаниях, который сам подбирает резюме по всем сайтам, делает выборку в соответствии с критериями заказчика, проводит интервью и уже собственно заказчику из всего большого набора предоставляет уже несколько человек, которые уже могут дальше проводить собеседование с человеком. То есть кейс очень интересный. Более того, у нас уже есть ряд пилотных внедрений и в Ленте, и в М-Видео, и в Сбербанке и во многих корпорациях. Здесь что интересно, что я сейчас посмотрела, что большинство решений, которые у нас есть в Санкт-Петербурге у стартапов, они экономически эффективны именно в больших корпорациях. Та же самая робот Вера дает экономию заказчику, если только ты наберешь какое-то большое количество народу, минимум от пятидесяти человек на какую-то такую вакансию. Если там много регионов есть. То есть для малого и среднего бизнеса это решение не очень подходит, потому что оно действительно будет дорого ввиду технологической составляющей. Но считая эффективность, по крайней мере, в отношении робота рекрутера, мы вывели такую зависимость, что больше 50 человек да эффективно. Если меньше, наверное, лучше вам девочку посадить, пусть она проводит собеседования сама.  У нас есть проект Дройс, например, который в сфере медицины предлагает свои решения. То есть на основе имеющейся данных о пациенте эта система ставит диагнозы, скажем так, и делает назначения. То есть это уже как раз помощник врачу. И более того эти назначения, которая делает система, более, наверное, реалистичны, потому что путем интеграции с ресурсной базы, которая имеется в больнице конечно уже из препаратов аналогов предлагается то, что уже есть здесь сейчас в наличие. То есть у нас тоже есть уже пилотные внедрения, более того есть в Великобритании, в нескольких клиниках уже работают на этой системе. И сейчас идет пилотное внедрение в Александровской больнице. То есть в частных клиниках уже есть в Санкт-Петербурге, в двух, вот сейчас мы выходим на федеральные медицинские учреждения. Здесь тоже очень сложные, безусловно, есть моменты, потому что никакие облачные вирусологи там близко не подходят, потому что, если мы берем аспект безопасности и мы все-таки работаем с личными данными пациентов. Не дай бог что-то куда-то утечет и попадет. Если смотреть, например, про технологии распознавания изображения, распознавания речи, текста, то здесь у нас есть достаточно известный стартап - проект Кузнеч, который предлагает, вот он как раз тоже очень бизнес ориентированные ребята. Они предлагают ряд отраслевых решений для разных заказчиков. То есть, например, для сферы ритейла на мерчендайзинг, то есть когда в общем-то ряд мерчендайзеров просто становятся ненужными, потому что даже сотрудник магазина может просто сфотографировать эту полку и сразу система распознает, какие логотипы, где какой товар стоит, каким образом там что нужно передвинуть и каким образом нужно оптимизировать выкладку на полках. Такие же подобные решения есть для подбора одежды. Соответственно вы можете сфотографировать какой-то луг, запустить его в систему, она быстро распознает каждую часть вашего гардероба или гардероба той модели, которую вы запустили в эту систему и сразу предложит варианты где можно какую часть гардероба купить, в каких интернет магазинах. Начали они правда с решения выявления запрещенного контента для одной из известных соцсетей. В общем-то речь идет про порно, безусловно. И там тоже был ряд решений, начиная с распознавания логотипов. В общем-то они пошли там дальше до распознавания поз. Но это тоже решение, которое было внедрено нашей соцсетью. Сейчас у них идет для дорожной службы внедрение по распознаванию лиц. Распознавание лиц вообще очень интересная штука, потому что сейчас есть технологии, которые позволяют узнать, как выглядит человек на основе детских фотографиях через 10, 15, 20, 30 лет. Но это уже такая информация из публикаций. Я сейчас говорю немного о другой все-таки технологии. Потому что проекты, дошедшие до такого массового внедрения. Такое они с одной стороны фановые, с другой стороны они технологичные. Но по сути технологии там действительно не очень много. Просто здесь тот же самый основатель призмы, где он жил последние пять лет. В общем-то так все и внедрено было. Поэтому это безусловный тренд сейчас. Наверное, понятно почему. Потому что мы сегодня уже говорили о том, что и нейросеткам уже больше 40 лет и исследования в области искусственного интеллекта  ведутся достаточно давно, но именно сейчас происходит такой хайп в этой индустрии. И это хорошо. Потому что я думаю, что наши решения, которые действительно считают одними из лучших на мировой арене при соблюдении определенных условий могут действительно стать прорывными в каких-то по крайней мере областях.

 

                  Кузнецов:

                  Полина, а вот такой острый вопрос ответ. Сколько людей и ребят, которые уже к вам пришли и приходят. Сколько из них, оцените часть, которая взлетела реально. Есть такие уже, которые вышли из инкубатора и занялись бизнесом, который приносит им серьезную прибыль, которые вышли на нормальные обороты. Или пока еще рано об этом говорить? Вот именно в этой области?

 

                  Лукьянова:

                  Я сейчас привела примеры стартапов, которые собственно являются нашими, я бы не сказала выпускниками, потому что внедрения еще идут, но обороты у ребят растут и коммерческое применение я собственно немного про это рассказала. Но стартап индустрия немного, вопрос сложный. То есть компания растет. Растет она не всегда, потому что оборот растет, потому что они привлекают инвестиции, растет капитализация компании, как например с роботом Стафари, который уже второй транш инвестиций от Фри получили. И я думаю, что эта история игра в долгую. И сейчас и индустрия смотрит на такие решения, хотя их более всего интересуют такие прикладные моменты. И венчур очень внимательно смотрит на эти решения. Я думаю, что здесь главное поддержка для разработчиков, для стартапов это все-таки открытость. Потому что если мы смотрим на опыт Америки, даже не Европы, а все-таки Америки, который может быть более релевантен к реалиям нашей страны. Все-таки сейчас большинство инновационных столиц мира открывают свои двери и делают такие условия, что бизнес все-таки давайте делать в России. Или из России. Это хорошая тенденция. Потому что сейчас в нашем бизнес инкубаторе есть ряд проектов, которые работают на международных рынках и изначально были нацелены на международный рынок, что и понятно. Мы работаем с высокотехнологичными проектами, с инновациями. И у них есть ряд компаний, продающих решения по всему миру. Но именно центр разработок в виду разных причин, в том числе и доступа к компетенциям, находится в Санкт-Петербурге.

 

                  Кузнецов:

                  Понятно. Спасибо большое Полина. У нас осталось еще два докладчика, поэтому я попрошу Евгения Ричина буквально 5 минут. Довольно быстро, коротко, если возможно рассказать о компании. Евгений Ричин это директор ООО "Неокортак". Пожалуйста. Коротко как можно тезисно.

 

                  Ричин:

                  Из Москвы очень плохо видно, что делается в Новосибирске. Тем более в Красноярске, откуда я родом. Мы привезли сюда совсем не тот доклад, на который вы рассчитывали. Мне начинать?

 

                  Кузнецов:

                  Давайте попробуем. 5 минут у вас есть.

 

                  Ричин:

                  А почему пять, а не десять? Как полагается? Можно? Мы занимаемся направлением искусственный интеллект с 1972 года. То есть стаж очень большой. Разработки соответственно мы сейчас продемонстрируем. К сожалению, нас в России мало кто знает, потому что публикуемся мы в основном за рубежом. Там удобнее публиковаться, поскольку публикация уходит не в черную дыру, а возвращаются в виде отклика соответствующего редактора, где он пишет, 2000 откликов есть. Пришли, пожалуйста, еще на встречу. Что-то она не шевелится. Какую нажимать? Верхнюю? Большую? И куда стрелять? Вот так вот. Поскольку материала действительно много. По искусственному интеллекту говорить абстрактно ничего не понятно. Вот я сейчас уважаемых экспертов послушал. Тоску нагнали сумасшедшую. Я немного вас развеселю. Так вот я написал, что мы начали работать еще в 1972 году и в настоящее время разработали не имеющее мировых аналогов или информационных технологий искусственного интеллекта для стараемых мозгоподобных систем зрения. В основе искусственного интеллекта лежит интеллектуальное ядро в виде искусственного картекса. Продукт предназначен для понимания пространство временного содержания окружающего мира с качеством, которое сопоставимо с системой зрения человека. Мы это делаем лучше, чем конкуренты, поскольку глубоко исследовали ситуацию. В силу проверенного глубокого исследования процесса формирования оценки в виде информации. Это обеспечило нам определенный мировой приоритет в разработке мозгоподобной технологии оценки информации на основе современной парадигмы информации и на открытие структурного нефизического галаграфичексого принципа, в основе которого силою формального характера лежит дальнодействие, скорость которого бесконечно велика, мгновенна. Наша цель - создание встраиваемого мозгоподобного ядра для интеллектуальных систем широкого круга приложения, но, прежде всего, для систем зрения. В настоящее время мы находимся на этапе патентной защиты мозгоподобной информационной технологии и ищем инвестора. Предлагаем создание совместного предприятия 50 на 50 для продвижения наших разработок на мировой рынок. Для создания теории, образно говоря, теории сильного интеллекта нам пришлось вообще говоря ни много ни мало перелопатить понятие информации. Мы создали новую посшеноновскую теорию информации и вот новая парадигма информации вообще говоря имеет такой вид. Понятие информации оказалось чрезвычайно сложным понятием. В двух словах буквально. Значит здесь показано в режиме бинарной оппозиции, что все двойство информацию можно рассматривать как некую двойственную категорию пространство и время, в котором информация лежит. Она может быть плоская, искривленная. Материя сама представляет собой веществое поле. Взаимодействие форм материй, порождающих ее может быть близкодействие, дальнодействие. И вообще говоря само это взаимодействие оказывается сильным взаимодействием. И оно может быть физическим, а может быть структурным, то есть не силовым, геометрическим, логическим. В результате свойства материи определяют размер этих самых взаимодействий и  могут быть количественными, могут быть качественными. Но а свойства материи это и есть информация, которая при этом становится активной или пассивной. Но путем активирования она становится источников соответственно первичного или вторичного информационного поля. Вот строение информации. Как видите, это фроктал, которому вообще говоря можно сопоставит на каждом его уровне известный символический образ. Я не буду говорить, что это за образ. Все его знают. Но а вообще говоря, суть задачи, которая решается в интеллектуальной системе в широком смысле, а в системе деления в узком. Она заключается вот в чем. С одной стороны есть в физическом пространстве и времени информация четырехмерная, безусловно. Это величина четырехмерная, которая благодаря тому, что распространение поля идет в узком временном пространственном фильтре, узкополосном уменьшается, ослабляется. И в результате на вход приемной системы попадает слабое информационное поле. Но вот так условно показана эта система прямоугольниками, включая это вообще говоря искусственный неокартес. И благодаря физическому и структурному галаграфическому принципу происходит регистрация информации, которая далее иерархически восстанавливается и превращается в абстрактный образ объектов формирую оценку информации в ментальном пространстве системы зрения.

 

                  Кузнецов:

                 Евгений, я бы попросил вас подходить к заключению. Вашего доклада, довольно спорного. Пожалуйста.

 

                  Ричин:

                  Решение проблемы как осуществляется? Информационная мозгоподобная технология зрения - это потенциально мгновенная иерархическая оценка в виде информации на основе дальнодействия измерения. Интеллектуальное ядро мозгоподобной системы зрения с необходимостью приобретает строение, подобное неокартексу, то есть подобное коре головного мозга человека. Шесть уровней иерархии восходящей, нисходящей широкой, но не глубокой обработки информации. И наконец информационная технология построена на основе сформулированной современной парадигме информации нового пост шенноновского информационного подхода, который автором разработан для выяснения основных законов и механизмов формирования, ослабления и понимания в виде информации. Там еще куча всего есть, но к сожалению время меня ограничивает. Я могу интересующимся...

 

                  Кузнецов:

                  Я думаю, что если кого-то это заинтересует, они могут к вам подойти. Спасибо большое, Евгений. Я опять же очень быстро попрошу выступить Евгения Павловского. Директора по развитию компании "Экспософт". Пожалуйста, если можно коротко.

 

                  Павловский:

                  Я остановлюсь на нескольких тезисах. В программе указано. Готова ли индустрия активно использовать интеллектуальный анализ данных? Наш опыт работы в сфере машинного обучения, искусственного интеллекта примерно 7 лет. И в 2010 году мы организовали компанию, тогда нашли инвестора. Соответственно во главу угла я бы поставил проблему развития вот такого бизнеса - это недостаток инвестиций в этой отрасли. Недостаток инвестиций связан в первую очередь с тем, что бизнес в России развивается всего 26 лет и еще не появились те пенсионеры, которые могут спокойно тратить деньги свои накопленные на какие-то безумные совершенно идеи. Их немного, но есть. Вторая проблема связана с тем, что мы вообще в России все слишком умные и компании, которые по идее могли бы заказывать разработки в сфере искусственного интеллекта почему то считают, что они могут их сами разработать. Сами взять студента дипломника, современную методологию быстренько там запилить и получить ровно тот же результат. То есть не сложилась такая культура аутсорсинга каких-то высококвалифицированных услуг. Третья проблема то, что наша технологическая база существенно отстает. Можно быть на переднем крае искусственного интеллекта, придумывать современные алгоритмы, но не иметь возможности заземлить их в технологию. Что конкретно. Первое - это поддержка ГОСТами нормативной базы. Мы сейчас столкнулись с доведением разработки до производства ГОСТ РПП, ГОСТ ЕСПД. Они конечно крутые соответственно были лет сорок назад. Некоторые 20 лет назад. Это уровень поддержки государства в технологии. Потом собственно сам искусственный интеллект машинное обучение это 5 % всей технологии. Все остальное - это выпуск документации, это куча элементов. Тут уже подчеркивали. Еще с большой проблемой столкнулись мы. Мы с 2010 года фактически думали, что вот сейчас мы эти наши институтские разработки донесем до бизнеса. В 2011 году вышел доклад Маккензи о том, что бикдата - это круто. Так вот в России нам не хватает таких аналитических компаний, визионеров, которые могут сформировать повестку. Мы обсуждаем искусственный интеллект в 2017 году, когда революция искусственного интеллекта произошла в 2012. Друпау, вот все эти вещи. У нас существенное запаздывание просто даже по повестке дня. Хотя надо отметить, что позитивный сдвиг в стратегии информационного развития, в стратегии научно-технического развития, обозначен приоритет искусственного интеллекта, больших данных. И последняя проблема - данные. Каждый раз мы обращаясь с заказчиком приходим вот они такие нагруженные, вот здорово, давайте. Где данные? И уходят на погода, а то и на год собирать качественные данные, потому что машинное обучение без данных не работает. И может быть наиболее такое препятствие в развитии технологий машинного обучения то, что это обещание чуда. Воспринимается как обещание чуда. И на самом деле с научной точки зрения это тоже некоторое чудо, потому что алгоритм машинного обучения запрограммирован на то, чтобы работать с теми данными, которые они не видели. То есть обучаемся мы в режиме обучения на одних данных, а применяем этот алгоритм на других. И ученый должен гарантировать уровень точности, уровень полноты. А индустрия говорит да нет, что вы говорите? Мы говорим недостаточная выборка. Но я вот на трех экземплярах проверил, у меня не работает. И приходится объяснять, что так не проверяется. Методика испытания должна проводиться. Вот эта культура, ее нужно превносить и это проблема, а значит и возможность для нас и для нашего дальнейшего развития. Спасибо.

 

                  Кузнецов:

                  Спасибо большое. Евгений Павловский - директор по развитию компании "Экспософт". И мы заканчиваем нашу сессию. Спасибо большое всем участникам. Спасибо большое докладчикам за проявленный интерес. Спасибо большое зрителям. Всего хорошего.