Добро пожаловать на аудиокурс Hugging Face!

Уважаемый слушатель,

Добро пожаловать на курс по использованию трансформеров в аудио. Трансформеры снова и снова доказывают, что они являются одной из наиболее мощных и универсальных архитектур глубокого обучения, способных достигать передовых результатов в широком спектре задач, включая обработку естественного языка, компьютерное зрение, а с недавних пор и аудио.

В этом курсе мы рассмотрим, как трансформеры могут быть применены к аудиоданным. Вы узнаете, как использовать их для решения ряда задач, связанных с аудио. Если вас интересует распознавание речи, классификация аудиоданных или генерация речи из текста, трансформеры и данный курс помогут вам в этом.

Чтобы вы могли оценить возможности этих моделей, произнесите несколько слов в демонстрации ниже и посмотрите, как модель транскрибирует их в режиме реального времени!

В ходе курса вы получите представление о специфике работы с аудиоданными, узнаете о различных архитектурах трансформеров, а также обучите свои собственные аудио трансформеры, используя мощные предварительно обученные модели.

Этот курс рассчитан на слушателей, имеющих опыт глубокого обучения и общее представление о трансформерах. Знаний в области обработки аудиоданных не требуется. Если вам нужно подтянуть свое понимание трансформеров, ознакомьтесь с нашим курсом по NLP, в котором очень подробно рассматриваются основы трансформеров.

Знакомство с командой курса

Санчит Ганди, инженер-исследователь в области машинного обучения в Hugging Face

Привет! Меня зовут Санчит, и я работаю инженером-исследователем в области машинного обучения звука в Open Source команде компании Hugging Face 🤗. Основным направлением моей работы является автоматическое распознавание речи и перевод, а текущей целью - сделать речевые модели более быстрыми, более легкими и простыми в использовании.

Маттиджс Холлеманс, инженер по машинному обучению в Hugging Face

Меня зовут Маттиджс, я работаю инженером по машинному обучению аудио в команде Hugging Face с открытым исходным кодом. Я также являюсь автором книги о том, как писать звуковые синтезаторы, а в свободное время создаю аудиоплагины.

Мария Халусова, отдел документации и курсов в Hugging Face

Меня зовут Мария, и я создаю образовательный контент и документацию, чтобы сделать библиотеку Transformers и другие инструменты с открытым исходным кодом еще более доступными. Я раскрываю сложные технические концепции и помогаю людям начать работу с передовыми технологиями.

Вайбхав Шривастав, ML-разработчик, инженер по продвижению интересов разработчиков в компании Hugging Face

Меня зовут Вайбхав и я являюсь инженером по продвижению интересов разработчиков в области аудио в Open Source команде компании Hugging Face. Я занимаюсь исследованиями в области аудио с низким потреблением ресурсов и помогаю продвигать передовые исследования в области обработки речи в массы.

Структура курса

Курс состоит из нескольких разделов, в которых подробно рассматриваются различные темы:

Раздел 1: охватывает специфику работы с аудиоданными, включая методы обработки аудиоданных и их подготовку.
Раздел 2: познакомит с аудиоприложениями и научит использовать конвейеры 🤗 Transformers для решения различных задач, таких как классификация аудио и распознавание речи.
Раздел 3: познакомит с архитектурами аудио трансформеров, расскажет, чем они отличаются и для каких задач лучше всего подходят.
Раздел 4: научит создавать собственный классификатор музыкальных жанров.
Раздел 5: углубится в распознавание речи и построение модель для расшифровки записей совещаний.
Раздел 6: научит генерировать речь из текста.
Раздел 7: научит создавать реальные аудиоприложения с использованием трансформеров.

Каждый раздел включает в себя теоретическую часть, где вы получите глубокое понимание основных концепций и методов. На протяжении всего курса мы предлагаем тестовые задания, которые помогут вам проверить свои знания и закрепить полученные навыки. Некоторые главы также включают практические упражнения, где вы сможете применить полученные знания.

К концу курса вы получите прочную базу в области использования трансформеров для аудиоданных и будете хорошо подготовлены к применению этих методов для решения широкого круга задач, связанных с аудио.

Разделы курса будут выходить несколькими последовательными блоками со следующим графиком публикации:

Раздел	Дата публикации
Раздел 0, Раздел 1, и Раздел 2	14 июня 2023
Раздел 3, Раздел 4	21 июня 2023
Раздел 5	28 июня 2023
Раздел 6	5 июля 2023
Раздел 7, Раздел 8	12 июля 2023

Траектории обучения и сертификация

Не существует правильного или неправильного способа изучения этого курса. Все материалы данного курса являются 100% бесплатными, общедоступными и открытыми. Вы можете изучать курс в удобном для вас темпе, однако мы рекомендуем проходить его по порядку.

Если вы хотите получить сертификат по окончании курса, мы предлагаем два варианта:

Тип сертификата	Требования
Сертификат о прохождении обучения	Выполнить 80% практических заданий в соответствии с инструкциями.
Cертификат c отличием	Выполнить 100% практических заданий в соответствии с инструкциями.

В каждом практическом упражнении указаны критерии его выполнения. Если вы выполнили достаточное количество практических упражнений, чтобы претендовать на получение сертификата, обратитесь к последнему разделу курса, чтобы узнать, как его получить. Удачи!

Зарегистрироваться на курс

Разделы этого курса будут выходить постепенно в течение нескольких недель. Мы рекомендуем вам подписаться на обновления курса, чтобы не пропустить появление новых разделов. Учащиеся, подписавшиеся на обновления курса, также первыми узнают о специальных социальных мероприятиях, которые мы планируем проводить.

Зарегистрироваться

Наслаждайтесь курсом!

< > Update on GitHub

Audio Course

Добро пожаловать на аудиокурс Hugging Face!

Знакомство с командой курса

Структура курса

Траектории обучения и сертификация

Зарегистрироваться на курс