Eksklusif: Penyelidik lama Google DeepMind David Silver meninggalkan untuk berdiri startup AI miliknya
(SeaPRwire) - David Silver, penyelidik terkenal yang memainkan peranan kritikal dalam banyak pencapaian terkenal syarikat itu, telah meninggalkan syarikat itu untuk membentuk startup miliknya sendiri.Menurut seseorang yang mempunyai pengetahuan langsung tentang rancangan Silver, Silver sedang melancarkan startup baru bernama Ineffable Intelligence yang berasal di London. Orang itu berkata, syarikat itu sedang aktif merekrut penyelidik AI dan mencari dana modal berkempen.Menurut orang itu, Google DeepMind memberitahu staff tentang perpisahan Silver awal bulan ini. Silver telah berada di cuti sabbatik dalam bulan-bulan sebelum perpisahannya dan tidak pernah kembali secara rasmi ke peranan DeepMind beliau.Spokesperson Google DeepMind mengesahkan perpisahan Silver dalam pernyataan e-mel kepada . “Sumbangan Dave adalah tidak ternilai dan kami berterima kasih atas kesan yang dia buat pada kerja kami di Google DeepMind,” kata spokesperson itu.Silver tidak dapat langsung ditemui untuk komen.Menurut dokumen yang diajukan ke Registrar Perniagaan UK Companies House, Ineffable Intelligence dibentuk pada November 2025 dan Silver dilantik sebagai pengarah syarikat pada 16 Januari. Selain itu, laman web peribadi Silver kini menyenaraikan hubungannya dengan Ineffable Intelligence dan menyediakan alamat emel ineffable intelligence, walaupun ia terus menyatakan bahawa beliau “memimpin pasukan pembelajaran penguatkuasa” di Google DeepMind.Selain bekerja di Google DeepMind, Silver juga adalah profesor di University College London. Beliau terus mengekalkan afiliasi itu.Wartawan utama di balik banyak pencapaian DeepMindSilver adalah salah satu pekerja pertama DeepMind apabila syarikat itu dibentuk pada 2010. Beliau mengenal pendiri DeepMind Demis Hassabis dari universiti. Silver memainkan peranan penting dalam banyak pencapaian awal syarikat itu, termasuk pencapaian landmarknya pada 2016 dengan , yang menunjukkan bahawa program AI boleh mengalahkan pemain manusia terbaik di dunia dalam permainan strategi kuno Go.Beliau juga merupakan ahli kunci pasukan yang membangunkan , program AI yang boleh mengalahkan pemain manusia terbaik di dunia dalam permainan video kompleks Starcraft 2, AlphaZero, yang boleh bermain catur dan shogi serta Go pada tahap supermanusia, dan , yang boleh menguasai banyak jenis permainan yang berbeza lebih baik daripada manusia walaupun ia bermula tanpa sebarang pengetahuan tentang permainan, termasuk tidak mengetahui peraturan permainan.Baru-baru ini, beliau bekerja dengan pasukan DeepMind yang mencipta , sistem AI yang boleh berjaya menjawab soalan daripada Olimpiad Matematik Antarabangsa. Beliau juga merupakan salah satu penulis dalam kertas penyelidikan 2023 yang melancarkan keluarga AI asli Google Gemini. Gemini kini merupakan produk dan jenama AI komersial utama Google.Mencari laluan ke ‘superintelligence’ AISiliver telah memberitahu rakan-rakan beliau ingin kembali ke “keajaiban dan keheranan menyelesaikan masalah paling sukar dalam AI” dan melihat superintelligence—atau AI yang akan lebih bijak daripada mana-mana manusia dan mungkin lebih bijak daripada keseluruhan manusia—sebagai cabaran paling besar yang belum diselesaikan dalam bidang itu, menurut seseorang yang familiar dengan pemikiran beliau.Beberapa penyelidik AI terkenal lain juga telah meninggalkan laboratorium AI yang berpusat dalam beberapa tahun terakhir untuk membentuk startup yang berdedikasi untuk mengejar superintelligence. Ilya Sutskever, mantan ketua saintis di OpenAI, membentuk syarikat bernama Safe Superintelligence (SSI) pada 2024. Syarikat itu dalam dana modal berkempen sehingga kini dan dilaporkan bernilai sehingga $30 bilion. Beberapa rakan Silver yang bekerja pada AlphaGo, AlphaZero, dan MuZero juga baru-baru ini meninggalkan untuk membentuk Reflection AI, startup AI yang juga mengatakan sedang mengejar superintelligence. Sementara itu, tahun lepas sekitar “Superintelligence Labs” baru yang dipimpin oleh mantan CEO dan pendiri Scale AI Alexandr Wang.Melebihi model bahasaSilver terkenal dengan kerjanya dalam pembelajaran penguatkuasa, satu cara melatih model AI daripada pengalaman bukannya data sejarah. Dalam pembelajaran penguatkuasa, model mengambil tindakan, biasanya dalam permainan atau simulator, dan kemudian menerima maklumat umpan tentang sama ada tindakan itu berkesan dalam membantu ia mencapai matlamat. Melalui percubaan dan kesilapan melalui pelbagaian tindakan, AI belajar cara terbaik untuk mencapai matlamat.Penyelidik ini sering dianggap sebagai salah satu penyokong yang paling dogmatik dalam pembelajaran penguatkuasa, berpendapat bahawa ia adalah satu-satunya cara untuk mencipta kecerdasan buatan yang suatu hari nanti boleh melampaui pengetahuan manusia.Pada podcast yang dihasilkan oleh Google DeepMind yang dilancarkan pada April, beliau berkata bahawa model bahasa besar (LLMs), jenis AI yang bertanggungjawab untuk kebanyakan kegembiraan terbaru tentang AI, adalah berkuasa, tetapi mereka juga terhad oleh pengetahuan manusia. “Kami ingin melebihi apa yang known manusia dan untuk itu kita akan memerlukan jenis kaedah yang berbeza dan kaedah itu akan memerlukan AI kita untuk benar-benar menyelesaikan perkara itu sendiri dan untuk menemui perkara baru yang tidak known manusia,” katanya. Beliau telah memanggil untuk “era pengalaman” baru dalam AI yang akan berasaskan pada pembelajaran penguatkuasa.Sekarang ini, LLMs mempunyai fasa pembangunan “pretraining” yang menggunakan apa yang dipanggil pembelajaran tidak dipandu. Mereka menelan jumlah besar teks dan belajar untuk meramalkan kata yang paling berkemungkinan secara statistik mengikuti kata lain dalam konteks tertentu. Mereka kemudian mempunyai fasa pembangunan “post-training” yang menggunakan beberapa pembelajaran penguatkuasa, sering dengan penilai manusia melihat output model dan memberikan umpan kepada AI, kadangkala hanya dalam bentuk jempol atas atau jempol bawah. Melalui umpan ini, kecenderungan model untuk menghasilkan output yang membantu ditingkatkan.Tetapi jenis latihan ini akhirnya bergantung pada apa yang known manusia—terlepas kerana ia bergantung pada apa yang manusia telah belajar dan ditulis dalam fasa pretraining lepas dan kerana cara LLM post-training melakukan pembelajaran penguatkuasa akhirnya berdasarkan keutamaan manusia. Walau bagaimanapun, dalam sesetengah kes, intuisi manusia boleh salah atau berkeliru.Contohnya, terkenalnya, dalam langkah 37 perlawanan kedua AlphaGo melawan juara dunia Go Lee Sedol pada 2016, AlphaGo membuat langkah yang begitu tidak konvensional sehingga semua pakar manusia yang komen tentang perlawanan itu yakin ia adalah kesilapan. Tetapi kemudiannya terbukti bahawa langkah itu menjadi kunci kepada kemenangan AlphaGo dalam perlawanan itu. Demikian juga, pemain catur manusia sering menggambarkan cara AlphaZero bermain catur sebagai “asing”—tetapi langkah-langkah lawan intuisi ia sering terbukti hebat.Jika penilai manusia sedang membuat penilaian tentang langkah-langkah seperti itu dalam jenis proses pembelajaran penguatkuasa yang digunakan dalam post-training LLM, mereka mungkin memberikan “jempol bawah” kepada langkah-langkah itu kerana ia kelihatan seperti kesilapan kepada pakar manusia. Inilah sebabnya puris pembelajaran penguatkuasa seperti Silver mengatakan bahawa untuk mencapai superintelligence, AI tidak hanya perlu melebihi pengetahuan manusia, ia perlu menafikan ia dan belajar untuk mencapai matlamat dari segmen kosong, bekerja dari prinsip-prinsip asas.Silver telah berkata Ineffable Intelligence akan bertujuan membina “superintelligence yang terus belajar yang secara sendiri-menemui asas semua pengetahuan,” menurut seseorang yang familiar dengan pemikiran beliau.Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya. Sektor: Top Story, Berita Harian SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.
More