OpenAI iepazīstināja ar AI balss dzinēju

OpenAI piedāvā ierobežotu piekļuvi teksta pārvēršanas runā platformai, ko tā izstrādājusi ar nosaukumu Voice Engine, kas var izveidot sintētisku balsi, pamatojoties uz 15 sekunžu balss klipu. AI ģenerēta balss var lasīt teksta uzvednes pēc komandas tajā pašā valodā, kurā ir diktors, vai vairākās citās valodās. "Šie mazie izvietojumi palīdz veidot mūsu pieeju, garantijas un domāt par to, kā Voice Engine var izmantot dažādās nozarēs," teikts OpenAI paziņojumā. emuārā.

Piekļuvi ieguvušie uzņēmumi ir izglītības tehnoloģiju uzņēmums Age of Learning, vizuālo stāstu platforma HeyGen, veselības aprūpes programmatūras izstrādātājs Dimagi, AI komunikācijas lietotņu veidotājs Livox un veselības aprūpes sistēma Lifespan.

OpenAI teica, ka tas sāka izstrādāt Voice Engine 2022. gada beigās un ka šī tehnoloģija jau nodrošina iepriekš instalētas balsis teksta pārvēršanas runā API un ChatGPT lasīšanas skaļi funkcionalitātei. Intervijā TechCrunch OpenAI Voice Engine izstrādes komandas loceklis Džefs Heriss sacīja, ka modelis ir apmācīts "licencētu un publiski pieejamu datu kombinācijā". OpenAI izdevumam norādīja, ka modelis būs pieejams tikai aptuveni 10 izstrādātājiem.

Teksta pārveides AI ir ģeneratīvā AI joma, kas turpina attīstīties. Lai gan lielākā daļa koncentrējas uz instrumentālām vai dabiskām skaņām, mazāka daļa koncentrējas uz balss ģenerēšanu, daļēji OpenAI pieminēto problēmu dēļ. Tajos ietilpst tādi uzņēmumi kā Podcastle un ElevenLabs, kas nodrošina tehnoloģiju un rīkus AI balss klonēšanai, ko Vergecast izpētīja pagājušajā gadā.

Tajā pašā laikā ASV valdība cenšas ierobežot AI balss tehnoloģiju neētisku izmantošanu. Pagājušajā mēnesī Federālā sakaru komisija aizliedza robotzvanus, izmantojot AI balsis, pēc tam, kad cilvēki saņēma surogātpasta zvanus no klonētas prezidenta Džo Baidena AI balss.

Saskaņā ar OpenAI teikto, tā partneri ir piekrituši lietošanas politikai, kas nosaka, ka viņi neizmantos Voice Generation, lai uzdotos par cilvēkiem vai organizācijām bez viņu piekrišanas. Tas arī prasa, lai partneri saņemtu "izteiktu un informētu piekrišanu" no sākotnējā runātāja, neradītu veidus, kā atsevišķiem lietotājiem izveidot savas balsis, un informēt klausītājus, ka balsis ģenerē mākslīgais intelekts. OpenAI arī pievienoja ūdenszīmes audio klipiem, lai izsekotu to izcelsmi un proaktīvi kontrolētu audio lietojumu.

OpenAI ir ierosinājis vairākus pasākumus, kas, pēc tās domām, varētu ierobežot ar šādiem rīkiem saistītos riskus, tostarp pakāpenisku balss autentifikācijas atcelšanu, lai piekļūtu bankas kontiem, politiku cilvēku balsu izmantošanas aizsardzībai mākslīgajā intelektā, informētības palielināšanu par mākslīgā intelekta viltojumiem un AI radīta satura izsekošanas izstrādi. sistēmas.

Lasi arī:

Jerelotheverge

Pierakstīties

1 komentēt

Jaunākās

Vecākie Vispopulārākais

Iegultās atsauksmes

Skatīt visus komentārus

pavlo

pirms 1 mēneša

- Kā sauc tavu suni?

1

0

Atbildēt

Citi raksti

OpenAI jaunajam balss klonēšanas AI darbam ir nepieciešams tikai 15 sekunžu paraugs

Jaunākie komentāri