(SeaPRwire) – PROVIDENCE, R.I. — Suara Alexis “Lexi” Bogan sebelum musim panas tahun lalu adalah penuh semangat.
Dia suka bernyanyi keras-keras lagu Taylor Swift dan Zach Bryan di dalam kereta. Dia tertawa terus-menerus — bahkan ketika mengawasi kanak-kanak pra-sekolah yang nakal atau berdebat tentang politik dengan kawan-kawan di tepi api unggun di halaman belakang. Di sekolah menengah, dia adalah sopran di koor.
Kemudian suara itu hilang.
Doktor pada bulan Ogos mengeluarkan tumor yang membahayakan nyawa yang terletak berhampiran belakang otaknya. Ketika tiub pernafasan dikeluarkan sebulan kemudian, Bogan mengalami kesukaran menelan dan berusaha mengatakan “hai” kepada ibu bapanya. Bulan-bulan pemulihan membantu pemulihan, tetapi ucapannya masih terjejas.
Pada bulan April, gadis berusia 21 tahun itu mendapat suaranya kembali. Bukan yang sebenar, tetapi klon suara yang dihasilkan oleh OpenAI yang boleh dia panggil dari aplikasi telefon bimbitnya. Dilatih pada sampel suara remajanya yang berusia 15 saat — sumber dari video demonstrasi masakan yang dirakam untuk projek sekolah tinggi — suara AI tiruannya yang nyata tetapi boleh mengatakan hampir apa saja yang dia mahu.
Dia mengetik beberapa perkataan atau ayat ke dalam telefonnya dan aplikasi itu segera membacanya dengan lantang.
“Hi, boleh saya dapatkan grande iced brown sugar oat milk shaken espresso,” kata suara AI Bogan ketika dia memegang telefonnya di tingkap kereta di laluan drive-thru Starbucks.
teknologi klon suara AI yang semakin meningkat boleh memperhebat penipuan telefon, mengganggu dan melanggar martabat orang — sama ada yang masih hidup atau yang telah meninggal — yang tidak pernah memberi kebenaran untuk menghasilkan semula suara mereka untuk mengatakan sesuatu yang mereka tidak pernah ucapkan.
Ia telah digunakan untuk menghasilkan panggilan kepada pengundi New Hampshire yang meniru Presiden Joe Biden. Di Maryland, seorang pegawai sukan sekolah tinggi dituduh menggunakan AI untuk menghasilkan klip audio palsu pengetua sekolah membuat kenyataan perkauman.
Tetapi Bogan dan pasukan doktor di kumpulan hospital Lifespan Rhode Island percaya mereka telah mencari satu penggunaan yang membenarkan risiko. Bogan adalah salah seorang yang pertama — satu-satunya dengan keadaannya — yang berjaya menghasilkan semula suara yang hilang dengan Enjin Suara Baru OpenAI. Beberapa pembekal AI lain, seperti syarikat permulaan ElevenLabs, telah menguji teknologi serupa untuk orang dengan halangan ucapan dan kehilangan — termasuk peguam yang kini menggunakan klon suaranya di mahkamah.
“Kami berharap Lexi menjadi pelopor ketika teknologi ini terus berkembang,” kata Dr. Rohaid Ali, peserta kedoktoran neurosaintis di sekolah perubatan Brown University dan Hospital Rhode Island. Berjuta-juta orang dengan strok yang memusnahkan, kanser tekak atau penyakit neurodegeneratif boleh mendapat manfaat, katanya.
“Kami perlu sedar akan risiko, tetapi kita tidak boleh lupa tentang pesakit dan kebaikan sosial,” kata Dr. Fatima Mirza, peserta lain yang bekerja pada ujian perintis itu. “Kami dapat membantu memberi Lexi semula suara sebenarnya dan dia dapat berucap dalam istilah yang paling benar untuk dirinya sendiri.”
Mirza dan Ali, yang berkahwin, menarik perhatian OpenAI yang membuat ChatGPT kerana penyelidikan projek terdahulu mereka di Lifespan menggunakan bot cerdas untuk mempermudah borang persetujuan perubatan untuk pesakit. Syarikat San Francisco itu menghubungi mereka ketika sedang mencari aplikasi perubatan yang menjanjikan untuk penjana suara AI baru mereka awal tahun ini.
Bogan masih pulih perlahan dari pembedahan. Penyakit itu bermula pada musim panas tahun lalu dengan sakit kepala, penglihatan kabur dan wajah yang lesu, membimbangkan doktor di Hospital Kanak-Kanak Hasbro di Providence. Mereka mendapati tumor vaskular berukuran bola golf yang menekan batang otak dan terlibat dalam pembuluh darah dan saraf kranial.
“Ia adalah pertempuran untuk mengawal pendarahan dan mengeluarkan tumor itu,” kata pakar neurosaintis kanak-kanak Dr. Konstantina Svokos.
Panjang 10 jam pembedahan itu bersama-sama dengan lokasi dan keparahan tumor itu merosakkan otot lidah dan kord vokal Bogan, menghalang keupayaannya untuk makan dan bercakap, Svokos berkata.
“Ia seolah-olah sebahagian daripada identitiku diambil apabila saya kehilangan suara saya,” kata Bogan.
Tiub makanan dikeluarkan tahun ini. Rawatan ucapan masih berterusan, membolehkannya berucap dengan jelas dalam bilik yang senyap tetapi tiada tanda bahawa dia akan pulih kembali ketelusan suara semula jadinya.
“Pada satu masa, saya mula melupakan bagaimana saya kedengaran,” kata Bogan. “Saya telah terbiasa dengan bagaimana saya kedengaran sekarang.”
Apabila telefon berbunyi di rumah keluarga di pinggir bandar North Smithfield di Providence, dia akan menolaknya kepada ibunya untuk mengangkat panggilan. Dia merasakan dia menyusahkan kawan-kawannya apabila mereka pergi ke restoran yang berisik. Bapanya, yang mempunyai masalah pendengaran, sukar memahaminya.
Di hospital, doktor sedang mencari pesakit perintis untuk menguji teknologi OpenAI.
“Orang pertama yang terlintas di fikiran Dr. Svokos adalah Lexi,” kata Ali. “Kami menghubungi Lexi untuk melihat jika dia berminat mencubanya, tanpa mengetahui apa jawapannya akan menjadi. Dia bersedia mencuba dan melihat bagaimana ia akan berfungsi.”
Bogan perlu kembali beberapa tahun untuk mencari rakaman suaranya yang sesuai untuk “melatih” sistem AI itu tentang bagaimana dia bercakap. Ia adalah video di mana dia menerangkan cara membuat salad pasta.
Doktornya sengaja memberikan sistem AI hanya 15 saat klip itu. Bunyi masakan membuat bahagian video lain kurang sempurna. Ia juga cukup bagi OpenAI — satu peningkatan berbanding teknologi terdahulu yang memerlukan sampel suara yang jauh lebih panjang.
Mereka juga tahu bahawa mendapatkan sesuatu yang berguna daripada 15 saat mungkin penting bagi mana-mana pesakit masa depan yang tiada jejak suara mereka di internet. Mesej suara ringkas yang ditinggalkan untuk ahli keluarga mungkin perlu cukup.
Ketika menguji untuk kali pertama, semua orang terkejut dengan kualiti klon suara itu. Kelemahan sesekali — perkataan yang salah sebut, intonasi yang hilang — kebanyakannya tidak dapat dikesan.
“Saya menjadi terlalu emosional setiap kali mendengar suaranya,” kata ibunya, Pamela Bogan, air mata di matanya.
“Saya fikir ia hebat bahawa saya boleh mendapat bunyi itu semula,” tambah Lexi Bogan, mengatakan ia membantu “meningkatkan keyakinan saya ke tahap di mana ia berada sebelum semua ini berlaku.”
Dia kini menggunakan aplikasi itu kira-kira 40 kali sehari dan memberi maklum balas yang diharapkan dapat membantu pesakit masa depan. Salah satu eksperimen pertamanya adalah berucap kepada kanak-kanak di pra-sekolah di mana dia bekerja sebagai pembantu pengajar. Dia mengetik “ha ha ha ha” sambil mengharapkan respon robotik. Kejutannya, ia kedengaran seperti tawa lamanya.
Dia telah menggunakannya di Target dan Marshall’s untuk meminta di mana untuk mencari barang. Ia telah membantunya menghubungi semula bapanya. Dan ia telah memudahkan pesanannya makanan segera.
Doktor Bogan telah memulakan penghasilan semula suara pesakit Rhode Island yang lain yang bersedia dan berharap membawa teknologi itu ke hospital di seluruh dunia. OpenAI mengatakan ia berjalan dengan berhati-hati dalam memperluas penggunaan Enjin Suara Voice, yang belum tersedia untuk umum.
Bogan telah memberikan kesan kepada doktornya dengan fokusnya memikirkan bagaimana teknologi itu boleh membantu orang lain dengan halangan ucapan yang sama atau lebih teruk.
“Sebahagian daripada apa yang dia lakukan sepanjang proses ini adalah memikirkan cara untuk menyesuaikan dan menukar ini,” kata Mirza. “Dia telah menjadi inspirasi yang hebat bagi kami.”
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.
Walaupun sekarang dia perlu bermain-main dengan telefonnya untuk mendapatkan suar