Аудио для Kinect: то, что практически невозможно.
3 июня 2011 (пт), 16:00 17:30

Место проведения
Политехнический музей, Новая площадь ¾, подъезд 9, Малая аудитория.

3 июня 2011 (Пятница), 16:00

Аудио для Kinect: то, что практически невозможно.

Главный архитектор в группе технологий речи Microsoft Research Иван Ташев рассказывает об аспектах акустического дизайна и конвейера обработки звука в устройстве Kinect – наиболее успешно продаваемом электронном устройстве за всю историю, вошедшем в Книгу рекордов Гиннеса.

ОтУС представляет Открытую лекцию Ивана Ташева на тему «Аудио для Kinect: то, что практически невозможно».

3 июня, 16.00-17.30, Политехнический музей, Новая площадь ¾, подъезд 9, Малая аудитория.

Лекция на английском языке. 

Доктор Иван Ташев работает главным архитектором в группе технологий речи Microsoft Research. Он внес свой вклад в создание алгоритмов и разработок многих продуктов корпорации Майкрософт; его последняя работа связана с конвейером обработки звука в Kinect. Иван Ташев является автором и соавтором сорока заявок на патенты США, четырех книг и семидесяти научных работ. Его последняя книга «Sound Capture and Processing» (Захват и обработка звука) была опубликована в издательстве Wiley в 2009 году.

На лекции обсуждаются аспекты акустического дизайна и конвейера обработки звука в устройстве Kinect – наиболее успешно продаваемом электронном устройстве за всю историю, вошедшем в Книгу рекордов Гиннеса. Основные трудности, связанные с аудио на устройстве Kinect, – это звук из динамиков, эхо и шумы в помещении, а также большой динамический диапазон звучания. Благодаря технологиям, разработанным в Microsoft Research, конвейер обработки звука может устранять ненужные шумы и выдавать выходной сигнал, качества которого будет достаточно для распознавания голоса и голосового общения при разговоре на расстоянии до четырех метров и воспроизведении звуков в динамике на полной громкости. Кроме того, здесь обсуждаются новые сценарии использования этого устройства и возможности, которые открываются вне сферы компьютерных игр при создании более совершенного интерфейса для взаимодействия человека и компьютера. Благодаря Kinect разработчики пользовательских интерфейсов могут воспользоваться преимуществами двух дополнительных средств взаимодействия: жестов и речи. Речь полезна при выборе нужного пункта в большом списке элементов («Воспроизвести песню о подводной лодке группы "Битлз"»), тогда как жесты хорошо подходят для выбора в более коротких списках – например, для выбора нужной песни из четырех-пяти композиций, возвращенных после приведенного выше примера «нечеткого» голосового запроса. Объединение этих аспектов в мультимодальный пользовательский интерфейс позволяет разрабатывать более органичные и интуитивно понятные способы взаимодействия с компьютером. Кроме того, будут предоставлены некоторые демонстрационные материалы, посвященные описываемым технологиям.

Подробнее о лекторе.

Иван Ташев стал дипломированным инженером в области электроники и доктором компьютерных наук в Софийском техническом университете (Болгария), соответственно в 1984 и 1990 году. В 1998 году после работы помощником профессора в том же университете он стал сотрудником корпорации Майкрософт. В настоящее время Иван работает главным архитектором в группе технологий речи Microsoft Research.

Он внес свой вклад в создание алгоритмов и разработок, относящихся к поддержке массива микрофонов в Windows, устройству RoundTable, конвейеру обработки звуков на платформе Microsoft Auto platform и конвейеру обработки звука для Kinect. Изобретатель и соавтор 40 заявок на патенты США, 13 из которых были ему выданы.

Доктор Ташев является старшим членом IEEE и участником технического комитета обработки аудио и акустических сигналов в этой организации. Кроме того, он член Общества инженеров по звуковой технике и его Тихоокеанского Северо-Западного Комитета, а также член Акустического общества Америки. Иван Ташев является обозревателем в большинстве научных журналов, связанных с тематикой его исследований, членом организационных и технических комитетов ICASSP, IWAENC, WASPAA, HSCMA и других научных конференций в этой области. Иван стал автором или соавтором четырех книг и более чем семидесяти научных трудов. Его последняя книга «Sound Capture and Processing» (Захват и обработка звука) была опубликована в издательстве Wiley в 2009 году.

http://research.microsoft.com/en-us…

ОтУС: http://openu.posterous.com/

Есть вопросы? Спросите у организатора события.