Планируется ли дополнительная интеграция английского языка?
Планируется ли обучение совмещённой модели английского с русским?
Да, будет в ближайшем будущем
У меня есть в доступе мною собранный датасет с русской речью на две тысячи часов, около полутора миллиона образцов. Хватит ли у вас мощности, чтобы вместе с ним обучиться?
Ресурсы есть, а у вас датасет на чем основан? Для этой модели нужно большое разнообразие спикеров
На парочке аудио книгах и различные голоса в одиночном или нескольких экземплярах, в основном добавлял те данные, которые считал по качеству лучше, сам думал обучить, но не хватает вычислительной мощности
Вот сам датасет, если подойдёт, то буду рад помочь
У меня есть отличный датасет, на нем можете обучить? Тут большое разнообразие спикеров на русском, но транскрибировать надо будет на модели large 3 для хорошего качества. Буду ждать обратной связи ))) https://drive.google.com/file/d/1mYjYJra3DKswY--PCchMRzP2YLczOQhn/view?usp=sharing
Спасибо, возьму в работу
Хотел бы узнать, как проходит обучение модели на обновлённом наборе данных?
Пока что нахожусь в поисках и подготовке датасетов