Видеотелефон будущего разрабатывается в Нижнем Новгороде

NB: В октябре лаборатория Intel Nizhny Novgorod Lab (INNL) представит в головном офисе корпорации свою разработку - мультимедийный сотовый видеотелефон. Принцип его действия чем-то напоминает "пророчества" из романа Виктора Пелевина "Generation П" - моделирование на экранах телевизоров "президентов" и "березовских".

На вопрос газеты "Время новостей" о возможности создания виртуальных двойников исполнительный директор INNL Олег Сютин ответил: "Я понимаю, к каким, к примеру, избирательным технологиям это может привести, но остановить прогресс не может никто, а люди, желающие его использовать в низких целях, были всегда".

Разработка лаборатории основана на принципе создания изображения по трехмерной модели. На экране видеотелефона изображение будет повторять движения реального абонента. Но при этом виртуальный собеседник может быть представлен, например, в галстуке, в то время как на самом деле в момент разговора он сидит с полотенцем на голове.

Как пояснил руководитель лаборатории обработки мультимедиа INNL Валерий Курякин, "моделирование вместо передачи изображений натуральных объектов обычным видео позволяет уменьшить объем передаваемой информации в 500 раз, и во столько же раз, соответственно, уменьшается нагрузка на линии передачи (что важно для мобильной связи, обладающей небольшой пропускной способностью. - Ред.)".

Нижегородские программисты первыми создали "конвейер" обработки синтетического видео - от распознавания черт реального лица до анимации его трехмерной модели. Модель может быть как уже заложенной в "трубку", так и "отправленной" с камеры телефона собеседника. При этом воспроизведение может осуществляться по-разному: синхронизацией визем (артикуляции) и фонем (звуков) или анимацией распознанной мимики лица. В первом случае достаточно будет просто передавать звук речи, и виртуальная модель будет воссоздавать артикуляцию вне зависимости от движений живого собеседника. Во втором - происходит отслеживание и анализ действий собеседника, а затем передача информации.

В лаборатории подчеркивают, что их разработки - только наметки для будущих технологий. "Мы не ведем речь о продукте, - говорит Олег Сютин. - Наши исследования опережают нынешние технические возможности на три-пять лет". По его словам, главная задача ученых - указать компьютерной отрасли возможные пути развития и вероятные перспективы построения архитектуры компьютеров.

Сейчас нижегородская лаборатория почти завершила два из трех технологических этапов на пути к виртуальному моделированию - распознавание и анимацию. На третьем (исследователи называют его "калибрацией") нужно добиться максимального сходства модели и реального объекта.

Параллельно с нижегородской лабораторией такими разработками занимаются компании MATROX, Digimask, Lipsinc. Они уже добились высокой степени калибрации трехмерной модели, но в передаче реальной мимики не подвинулись дальше "шевеления губ".

"Создать динозавров юрского периода или говорящих с человеческой мимикой животных проще, - говорит Валерий Курякин. - Не существует реального прототипа, ведь никто не знает, как могли бы говорить по-человечески животные и моргать динозавры". С человеком, объясняет он, особенно со знакомым, сложнее, потому что мы улавливаем малейшее отклонение. По его словам, лаборатория планирует достичь полного соответствия модели реальному объекту через несколько месяцев.

INNL создана выходцами из Всероссийского института экспериментальной физики (Саров). Это одна из 17 лабораторий Intel и единственная на территории России. Исследования осуществляются совместно с ННГУ и МГУ.