Nvidia і Mozilla оновили набір голосових даних Common Voice

1 хв. читання

03 серпня 2021

· 4 · 0

Mozilla і Nvidia випустили нову версію Common Voice Dataset. Це універсальний набір голосових даних, яким можуть користуватись усі охочі — наприклад, для створення голосових помічників, розробки ПЗ для розпізнавання голосу й синтезу мовлення тощо.

З липня 2020 року у бібліотеці є дані й українською мовою, зараз у цьому наборі 615 голосів і 66 годин запису (які роблять і перевіряють волонтери, тож можете долучитися). Загалом у Common Voice Dataset 13 905 годин зі звуковими даними — це на 4622 годин більше, ніж у попередній версії.

Кожен запис складається з MP3-файлу і текстового супроводу, щоб їх було зручно використовувати для машинного навчання і розпізнавання голосу. Також до файлів зазвичай прикріплені дані про вік, стать чи акцент, що допомагає зробити алгоритм точнішим.

Спільнота проєкту за останні пів року зросла на 25%, а у новій версії додались 16 мов: словацька, північнокурдська, болгарська, мова баса, казахська, башкирська, галісійська, уйгурська, вірменська, білоруська, урду, гуарані, сербська, узбецька, азербайджанська та мова гауса. Тож загалом у датасеті тепер 76 мов і понад 182 000 унікальних голосів.

Помітили помилку? Повідомте автору, для цього достатньо виділити текст з помилкою та натиснути Ctrl+Enter