OpenAI демонстрира изкуствен интелект за преобразуване на текст в говор, който може да имитира глас след 15 секунди аудио – IT Pro – Новини

OpenAI създаде инструмент, който може да имитира аудио въз основа на сегмент от петнадесет секунди. Компанията пусна образци на Voice Engine, но не иска да пусне целия модел веднага.

OpenAI, компанията за изкуствен интелект, която също прави ChatGPT, Той описва инструмента в публикация в блог. Моделът се нарича Voice Engine и може да чете текстове, които потребителят предоставя като текстово въвеждане. Въз основа на гласова проба, OpenAI твърди, че AI може перфектно да имитира гласа, включително тон и емоция. Компанията казва, че такъв сегмент трябва да продължи само петнадесет секунди.

Компанията не разкрива никакви данни за инструмента и няма бяла книга или друго техническо описание. Така че не е ясно, например, на какви аудио клипове е обучен Voice Engine. казва OpenAI Към TechCrunch Те се отнасят до комбинация от лицензирани и публично достъпни данни. Според компанията Voice Engine не е обучен на потребителски данни. Извадките, които потребителите създават след това, също се изтриват.

Според TechCrunch инструментът трябва да струва пари в бъдеще, въпреки че OpenAI не казва нищо за това публично. Компанията ще таксува 15 долара за милион знака, или около 160 000 произносими думи, според документите.

Voice Engine все още не е достъпен за потребителите, както често се случва с подобни услуги в наши дни. Миналата година Meta показа, че Voicebox може също да генерира изговорен текст въз основа на кратки аудио файлове, но компанията също не предлага този инструмент. OpenAI казва, че сега е предпазлив относно това поради последствията. С инструмента може бързо да се злоупотребява. OpenAI се отнася конкретно до Съединените щати, където президентските избори ще се проведат в края на тази година и изборната битка вече е започнала.

READ  Intel спира производството на настолни компютри Alder Lakes с до 16 ядра в лаптопи - Компютър - Новини

Компанията е публикувала редица примери в блог, показващи какво може да направи инструментът. Освен това OpenAI тества Voice Engine с ограничен брой тестери. Те трябваше предварително да подпишат декларация, че няма да създават текстове без разрешението на съответното лице. Инструментът също ще има воден знак, показващ, че аудиото е създадено и OpenAI казва, че „проактивно наблюдава“ как се използва системата. Когато инструментът бъде пуснат в бъдеще, OpenAI също иска да създаде списък със звуци, които не трябва да бъдат клонирани.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *