Планируется ли дополнительная интеграция английского языка?

#2
by SeraDreams - opened

Планируется ли обучение совмещённой модели английского с русским?

Да, будет в ближайшем будущем

У меня есть в доступе мною собранный датасет с русской речью на две тысячи часов, около полутора миллиона образцов. Хватит ли у вас мощности, чтобы вместе с ним обучиться?

Ресурсы есть, а у вас датасет на чем основан? Для этой модели нужно большое разнообразие спикеров

На парочке аудио книгах и различные голоса в одиночном или нескольких экземплярах, в основном добавлял те данные, которые считал по качеству лучше, сам думал обучить, но не хватает вычислительной мощности

Вот сам датасет, если подойдёт, то буду рад помочь

У меня есть отличный датасет, на нем можете обучить? Тут большое разнообразие спикеров на русском, но транскрибировать надо будет на модели large 3 для хорошего качества. Буду ждать обратной связи ))) https://drive.google.com/file/d/1mYjYJra3DKswY--PCchMRzP2YLczOQhn/view?usp=sharing

Спасибо, возьму в работу

Хотел бы узнать, как проходит обучение модели на обновлённом наборе данных?

Пока что нахожусь в поисках и подготовке датасетов

Sign up or log in to comment