Светлана Соколова, гендиректор PROMT: Если растет экономика, растет и потребность в машинном переводе
Машинный перевод давно стал незаменимой технологией, однако для большинства пользователей он часто ассоциируется только с популярными онлайн-сервисами. Ректор бизнес-школы ИМИСП – одного из российских лидеров в области бизнес-образования для руководителей и топ-менеджмента компаний, Ярослав Павлов взял интервью у генерального директора PROMT Светланы Соколовой и представил профессиональный взгляд на машинный перевод. Кому и зачем нужен машинный перевод в 21 веке, существует ли безопасная альтернатива онлайн-сервисам и нужно ли изучать иностранные языки сегодня – ответы на эти и другие актуальные вопросы дает основатель и руководитель первой в России компании по разработке систем машинного перевода.
Вы основали компанию PROMT еще в начале 1990-х, на заре компьютерной эры в России. Расскажите в двух словах, как вы пришли к такому решению?
Светлана Соколова: В 1980-х годах я работала в Лаборатории инженерной лингвистики при РГПУ им. Герцена, где управляла разработкой программного обеспечения для систем обработки текстов. К концу 80-х В России не только появились первые персональные компьютеры, но и открылись новые возможности – можно было открывать компании, принимая решения, зарабатывать какие-то деньги. Всё это вместе как-то так сложилось, что мы с коллегами решили открыть какое-нибудь предприятие. На самом деле, все это было очень сложно тогда. Но всеми правдами и неправдами мы создали компанию. Часть людей из Лаборатории не захотела идти в новую структуру, потому что было страшно, никаких гарантий не было – а вдруг вы ничего не продадите и что мы тогда будем делать? Другое дело – остаться в государственной структуре.
А как вам не было страшно?
Светлана Соколова: Я понимала, что появившиеся тогда персональные компьютеры «говорили по-английски», то есть, вся сопровождавшая их документация была представлена на английском языке – значит, есть потребность в переводе этой документации. Мне не было страшно, ведь к тому моменту я уже защитила диссертацию, которая была посвящена моделированию процессов перевода, и у меня было четкое представление о том, какую можно создать систему. После открытия компании мы создали первую систему, которая, может быть, не очень хорошо, но все же переводила разнообразную документацию, которая сопровождала компьютеры. Мы увидели, что на эту систему есть спрос и что мы можем выйти на новый уровень.
Кем были ваши первые клиенты?
Светлана Соколова: Среди покупателей были научно-исследовательские институты, которые занимались своими разработками. Не могу сказать, что это была какая-то роскошная жизнь, у нас были довольно скромные доходы, но они позволяли покупать новые компьютеры, нанимать новых людей. Так мы постепенно и двигались. Потом мы поняли, что кроме компьютерной тематики можно сделать переводчик, который будет переводить бизнес-письма и способствовать деловой активности. Это была уже вторая система, которую мы выпустили.
Сейчас очень популярен продуктовый подход. А как вы создавали этот продукт, приходили к тому, что именно таким он должен быть, для какой целевой аудитории?
Светлана Соколова: Конечно, тогда о таком направлении в маркетинге речь не шла. Мы разговаривали с людьми, ведь в 1990-х и в начале 2000-х годах в России была такая правильная история как компьютерные выставки. Они очень много давали в плане понимания – а что вообще людям нужно. Мы разговаривали с потенциальными потребителями, пытались нащупать, а что надо-то вообще, как это выглядит, кому это интересно. И уже тогда мы поняли простую закономерность: если растет в целом экономика, растет потребность в общении с мировым пространством, то и потребность в автоматизации перевода увеличивается.
Еще очень много мы ездили на международные выставки – тоже в попытке понять, что там мы можем предложить. Участие в выставках нам помогло получить первых партнеров на Западе. Важный момент был уже во второй половине 90-х, когда мы нашли мощного партнера во Франции и с ним начали делать совместные системы без русского языка. У нас действительно была очень хорошая технология, и в то время все производители систем машинного перевода на нас ориентировались.
В связи с этим вопрос – несмотря на то, что у вас не только на русский язык завязаны системы, некоторая маргинализация России в мировом сообществе повлияла на ваш бизнес?
Светлана Соколова: Я думаю, что да. Хотя на нашем бизнесе еще очень много факторов сказывается. Сейчас важным аспектом для наших продуктов является то, что они работают офлайн. Это для многих компаний важно – проблемы безопасности актуальны не только для специальных структур, но и вообще для всех. Кто наши клиенты? Северсталь, Лукойл, Газпром. На самом деле, у нас огромное количество клиентов, они используют разные продукты. И если они заботятся о конфиденциальности переводимой информации, то они, конечно, пытаются у себя в компании организовать корпоративный сервис автоматического перевода.Витрина данных НОТА ВИЗОР для налогового мониторинга
Маргинализация России, конечно, мешает развитию мелкого бизнеса. Но у мелкого бизнеса и не будет возможности покупать наши дорогие системы, они скорее пойдут или на наш сервис перевода PROMT.One, или обратятся к другим онлайн-переводчикам. Поэтому тут очень много разных моментов.
Почему нужен машинный перевод вообще? Потому что невозможно быстро переводить большие объемы информации без привлечения технологий. Или, например, когда специалист не знает иностранных языков. Мы когда-то давно взяли в компанию юриста, который изначально не очень владел английским языком. А мы часто подписываем контракты на английском языке, и здесь, в Петербурге, стараемся отслеживать все контракты наших зарубежных дочерних компаний. И сначала была проблема – а что делать-то вообще? И фантастика, насколько быстро он научился работать с нашей системой автоматического перевода! Тем более, сейчас качество перевода выросло в сотни раз за счет использования нейронных технологий. Насколько это удобно и быстро! И даже если ты не знаешь английского языка, ты все равно в состоянии понять большие сложные документы, быстро и оперативно изучить их, дать комментарий.
Вы сказали про зарубежные офисы. А как вы вышли на международный рынок, ведь это было достаточно давно, и вы были одной их первых российских компаний. Как это пришло в голову, как вы это реализовали?
Светлана Соколова: Пришло в голову достаточно просто, потому что понятно – а как иначе развиваться-то? Здесь и так рынок есть, а есть еще и другие, значит, надо постараться быть там, где это возможно. Прежде всего, мы участвовали в международных выставках. Раньше была такая большая международная компьютерная выставка – CeBIT, которая сейчас тоже закрылась. На самом деле, это общая тенденция – не только в России закрылись компьютерные выставки, но и в мире они превратились в шоу. А тогда это были такие хабы, где можно было собираться и обсуждать именно деловую часть.
Сейчас если обывателю сказать про машинный перевод, он вспомнит Google Translate. У вас есть известный многим сервис, который сейчас называется PROMT.One. Но, все-таки, в чем сейчас основной бизнес ваш и какие вы разрабатываете продукты?
Светлана Соколова: Давайте я немного назад вернусь – про PROMT я сейчас расскажу. С одной стороны, Google Translate – это большая проблема для нас, конкурент, с другой стороны – де-факто автоматический перевод стал обыденной вещью. То есть, если раньше он вызывал недоверие, то сейчас нам гораздо легче объяснять, что такое машинный перевод и какая в нем ценность.
Конечно, мы по-прежнему поддерживаем наш онлайн-сервис PROMT.One и активно работаем над этим проектом. Мы стараемся приблизиться к людям, которые не просто пришли нажать на кнопку и получить перевод, но и еще что-то дополнительно получить – словарную информацию, контексты, в которых слово встречается. Что касается качества перевода, перевод PROMT.One и Google Translate сравнимы, потому что оба сервиса работают на нейросетевых технологиях, а нейронные сети дают совершенно замечательные результаты.
Наши основные продукты – серверные, конечно, ориентированы на использование в больших компаниях, в которых актуальна проблема конфиденциальности перевода, перевода сложных документов. Практически нет сервисов, на которых можно перевести сложно отформатированные документы, а наши серверные решения, которые интегрируются в корпоративную сеть компаний, позволяют это сделать. На самом деле, перевод PDF-документов – это очень востребованная вещь, кроме того, при большом объеме документации скорость обработки очень важна.
Кроме серверных решений, у нас есть решение, продолжающее традиции десктопных - совершенно новый продукт с нейронным переводом внутри. Это уникальное решение, которого не было ни на российском, ни на мировом рынке. То есть, вот эти 2 направления – серверные и десктопные продукты на основе нейронного перевода, работающие офлайн – наши основные направления.
Конечно, у нас есть мобильное приложение, но оно скорее есть с целью маркетинга. Но мы поддерживаем эту линию, потому что есть заказчики, у которых есть специальная потребность в офлайн-приложении на мобильном устройстве, специализированном под определенные задачи.
Здорово! Такой немножко технический вопрос – офлайн-работающая нейронная сеть – это как? Она же должна обучаться, развиваться?
Светлана Соколова: Нейронный перевод не подразумевает, что модель постоянно самообучается, потому что, для того, чтобы система обучалась, ей нужно огромное количество качественных данных. Что такое данные и вообще нейронные сети в нашем случае? Это так называемые параллельные тексты, когда есть перевод предложения с одного языка на другой. Для того, чтобы обучить одну модель, чтобы она более-менее переводила, нужно не менее 100 млн таких сегментов, поэтому самообучение – это в каком-то роде «миф о загробной жизни». Мы представляем такую ситуацию: мы продаем в какую-то компанию нашу систему, она там что-то переводит – это ж сколько нужно отредактировать потом, чтобы ее можно было обучать на этих данных? Обучение нейронной сети - это отдельный процесс.
Сейчас, достигнув очень серьезных, значительных результатов в компании, вы продолжаете учиться? Именно в управлении. Конечно, а куда деваться? В 91-м году я вообще не понимала, что такое бухгалтер, зачем он нужен, но потом поняла. Потом я не понимала – а зачем финансовый директор? Потом поняла, зачем финансовый директор. Обожаю конкуренцию и считаю, что именно конкуренция заставляет нас двигаться вперед. Каждый день приходится что-то новое узнавать.
В России в 2018 году проходил ЧМ по футболу, и у вас достаточно интересный кейс, вы победили в номинации «Лучший ИТ-продукт». Расскажите, пожалуйста, в 2 словах о проекте.
Светлана Соколова: Это – тот самый случай, когда наша технология офлайн-перевода для мобильных устройств применялась для создания такого продукта специфического назначения. Я и не подозревала, что устройство, с помощью которого проводники проверяют билеты пассажиров – это самый натуральный компьютер, на который можно установить тот же самый переводчик. В этом проекте были разные решения: и серверные, которые работали в вагонах по локальной сети, и встроенный офлайн-переводчик, чтобы проводники, которые очень часто мало владеют разнообразными языками, могли как-то пообщаться с иностранными пассажирами.
С учетом достаточно активного развития интернета, покрытия мобильных сетей, снижения стоимости – это, наверно, как-то влияет на запросы на офлайн-перевод, есть какие-то кейсы, компании, которым нужен офлайн? Главный кейс – это забота компании о сохранности своей информации, потому что о том, что онлайн-переводчики всю информацию накапливают, много писали, и руководители онлайн-сервисов открыто заявляли: «Да, мы собираем информацию». Многие не задумываются, как информация сохраняется в интернете, но есть и те, кто задумывается. Конечно, сейчас мы в основном ориентируемся на корпоративных клиентов, которые либо работают в защищенном облаке – у нас есть и такие решения тоже, либо используют серверные решения, устанавливают сервер у себя в компании и организуют весь процесс перевода через этот сервер. Мне кажется, что это такая, может быть, неочевидная вещь, но, с другой стороны, мы видим большие очень компании – и американские, и английские, и французские – для которых это достаточно актуально.
Это очень интересно. Давайте вернемся к вопросу о развитии компании, потому что компания с достаточно богатой историей, и то, что интересует многих предпринимателей и собственников бизнеса, особенно в сфере ИТ, каким образом вы шли? Это полностью было «разработали и вложили в развитие» или были инвестиции какие-то внешние?
Светлана Соколова:Первые 17 лет компании мы развивались по простому пути «заработали – вложили». Но поскольку росла потребность общаться на иностранном языке, а знание иностранных языков у специалистов – программистов, юристов – было очень низкое, наша компания очень быстро росла, и мы тратили почти все деньги на инвестирование. Мы покупали компьютеры, нанимали новых людей, тратили на разработку новых продуктов. Мы очень серьезно продвинулись, особенно, после 2000-го года, когда был очень сильный рост экономики.
В 2006 году к нам начали обращаться разные люди – «давайте мы у вас купим часть компании». К 2008 году мы договорились с венчурным фондом, часть акционеров продала свои доли, и фонд вступил в нашу компанию. Но это для нас был очень негативный опыт, потому что мне кажется, что вот эта эйфория, когда деньги практически на деревьях росли… и казалось, что так будет всегда.
Поскольку венчурный фонд купил значительный пакет, то они сказали «вы так хорошо все умеете разрабатывать, давайте мы будем заниматься коммерцией, вы что-то не очень умеете продавать», хотя все у нас было нормально. В конце концов, через год стало понятно, что ничего у них не получается совсем, что без понимания продукта, рынка, особенностей продвижения, эффективно продавать невозможно. Потом часть инвесторов ушла, часть осталась. А у нас остался опыт.
Скажите, пожалуйста, а в истории компании были кризисные моменты, когда казалось «вот еще чуть-чуть, и все будет потеряно»?
Светлана Соколова: Был кризис в 1998 году, и тогда нам очень повезло. Во-первых, у нас был резервный фонд, неприкосновенный запас, во-вторых – появились иностранные партнеры, которые снабжали нас деньгами, потому что продавали наши продукты. Еще у нас был очень смешной кейс с фирмой Epson. Мы тогда использовали торговое имя Stylus и лет 6 – 7 продавали под этим названием нашу программу. У нас в России с компанией Epson было соглашение: они к своим принтерам прикладывали наш программный продукт, который назывался Stylus, а у них принтер назывался Epson Stylus, и никаких проблем это не вызывало. Когда мы начали продавать программный продукт в Германии, немецкий Epson сказал: «Все, мы подаем на вас в суд, в Германии у нас зарегистрированная марка». А ведь у нас в России она тоже была зарегистрирована, и мы вообще не понимали, что делать дальше. Очень мне помогла американская юрист, которая здесь работала. В 91 году я ездила на выставку в Америку, и мы там уже продавали продукт под названием Stylus. И эта американская юрист сказала: «Знаешь что? Мы сейчас объясним этим ребятам, что, если вы будете на нас нападать, то на основании американского понятия коммерческий оборот (что мы первые с этим названием вступили в коммерческий оборот), мы вас потопчем полностью на американском рынке». Немецкий Epson испугался, и в итоге мы договорились, что поменяем марку на PROMT вместо Stylus, но они оплатят нам этот переход. И нам действительно дали много денег, поэтому кризис 98 года мы нормально прожили. Кризис бывает не только с деньгами, но и в результате таких ситуаций. Очень важно правильно регистрировать торговую марку. Но, опять же, в 90-х годах еще не было четкого понимания этого.
А скажите, PROMT – откуда название и почему именно такое, что оно значит?
Светлана Соколова: Это аббревиатура, которая связана, может быть, с неким юношеским представлением. Дело в том, что машинный перевод – это очень-очень старый термин, который появился одновременно с появлением компьютеров. Этот термин всегда рассматривался, скорее, как область лингвистики, а я считала, что машинный перевод – это, прежде всего, область программирования, правильно настроенная кибернетическая система. Об этом была моя диссертация. Поэтому компанию мы назвали PROgrammer’s Machine Translation, машинный перевод от программистов – вот так можно перевести. Посыл был в том, что сейчас мы сделаем правильный машинный перевод. И на самом деле, мы действительно его сделали, эта наша технология машинного перевода очень долго жила и активно развивалась, на ее основе было создано много продуктов, было много продаж. Конечно, сейчас это уже история, и сейчас уже применяем нейросетевую технологию, которая позволяет получать перевод принципиально другого уровня.
А сейчас вы используете только нейронные сети или обращаетесь к старому подходу?
Светлана Соколова: Старый подход мы используем в некоторых случаях. Технология нейронного перевода все равно работает медленно. Когда у клиента супер-критичной является скорость перевода, и не так важно качество, то мы можем предложить ему решение на основе других, не нейронных технологий.
Здорово, значит первая технология еще живет?
Светлана Соколова: На самом деле, на всякий случай она тоже существует в продукте, потому, например при переводе очень длинных предложений – а некоторые пользователи PROMT.One переводят предложения длиной 3 тысячи слов – нейронный перевод как-то «смущается». В таком случае применяется старая технология, которая позволяет сохранить устойчивую работу системы.
Вы снова вспомнили об онлайн-сервисе PROMT.One. В 2019 году в интервью «Собаке.ру» вы говорили о том, что учить языки надо, но зачем обычным людям учить язык, когда все можно сделать с помощью онлайн-сервисов перевода?
Светлана Соколова: Я с этим вообще совершенно не согласна. Я могу нормально разговаривать и читать по-английски. Но, если мне нужно быстро посмотреть большой документ, ни за что не буду его сначала читать по-английски. Я обязательно посмотрю его машинный перевод. И, если я увижу там какие-то тонкие места, вот их я буду читать. Кроме того, есть еще у нас в продуктах такая штука – называется Агент. Это такая маленькая программка: ты читаешь английский документ и видишь какой-то очень сложный фрагмент. Ты выделяешь только этот кусочек и переводишь его, и понимаешь быстрее. То есть для того, чтобы быстрее понимать или вообще быстрее переработать всю информацию, машинный перевод подойдет. Это инструмент для эффективной работы.
А языки зачем учить?
Светлана Соколова: Для того, чтобы иметь возможность общаться с людьми, это потребление огромного культурного пространства, потому что машинный перевод – отличный инструмент именно для делового общения, а для того, чтобы разговаривать, взаимодействовать, общаться, конечно, нужен язык.
Полная версия доступна по ссылке.