
(SeaPRwire) – mengumumkan sesuatu pada Malam Krismas: perjanjian bernilai $20 bilion untuk memajukan teknologi startup cip AI Groq dan membawa kebanyakan pasukannya, termasuk pengasas bersama dan CEO Jonathan Ross. Ini adalah langkah yang menunjukkan Nvidia tidak lagi menganggap GPUnya akan menjadi satu-satunya cip yang berguna untuk fasa besar seterusnya dalam penggunaan AI: menjalankan model AI yang sudah dilatih untuk melakukan segala-galanya dari menjawab soalan, menjana kod hingga menganalisis gambar—proses yang dikenali sebagai inferens—dan melakukan semua itu pada skala yang besar.
Perjanjian Groq mengukuhkan kedudukan startup lain yang membina cip AI mereka sendiri, termasuk Cerebras, D-Matrix, dan SambaNova—yang dilaporkan telah menandatangani helaian terma untuk diperoleh—serta pemain baru seperti startup cip berasaskan UK, Fractile. Ia juga meningkatkan startup platform perisian inferens AI seperti Etched, Fireworks, dan Baseten, memperkukuhkan penilaian mereka dan menjadikan mereka sasaran pemerolehan yang lebih menarik pada tahun 2026, menurut analis, pengasas, dan pelabur.
Karl Freund, pengasas dan analis utama di Cambrian-AI Research, menunjuk kepada D-Matrix yang didukung Microsoft, yang telah mengumpulkan $275 juta bulan lepas dengan penilaian $2 bilion. Seperti Groq, D-Matrix tertumpu pada menukar sebahagian fleksibiliti GPU Nvidia untuk kelajuan dan kecekapan yang lebih tinggi ketika menjalankan model AI. “Saya pasti D-Matrix adalah startup yang cukup gembira sekarang,” kata Freund. “Saya mengesyaki pusingan seterusnya mereka akan mempunyai penilaian yang jauh lebih tinggi.”
Cerebras, syarikat cip lain yang tertumpu pada inferens, juga kelihatan berada pada kedudukan yang baik. Dikenali kerana cip “wafer-scale” bersaiz pinggan makan yang direka untuk menjalankan model yang sangat besar pada sekeping silikon tunggal, Cerebras telah memohon untuk IPO selepas kelewatan sebelumnya. Freund berkata syarikat itu semakin dilihat sebagai sasaran pemerolehan yang berpotensi juga. “Anda tidak mahu menunggu sehingga selepas IPO, apabila ia menjadi lebih mahal,” katanya. “Dari perspektif itu, Cerebras berada pada kedudukan yang baik sekarang.”
Perjanjian Nvidia-Groq telah menjelaskan arah pasaran
Eksekutif di syarikat-syarikat ini berkata langkah Nvidia telah membantu menjelaskan arah pasaran. “Apabila [perjanjian Nvidia-Groq] berlaku, kami berkata, ‘Akhirnya, pasaran mengiktirafnya,’” kata Sid Sheth, CEO D-Matrix, kepada . “Saya fikir apa yang Nvidia benar-benar lakukan adalah mereka berkata, Okey, pendekatan ini adalah pendekatan yang menang.”
Dan CEO Cerebras Andrew Feldman [sesuatu hilang] bahawa, pada masa lalu, persepsi bahawa GPU Nvidia adalah semua yang anda perlukan untuk AI bertindak sebagai parit, menghalang startup cip AI daripada meragut bahagian pasaran Nvidia. Tetapi parit itu kini hilang dengan perjanjian Groq, tulis Feldman. “Ia mencerminkan realiti industri yang semakin berkembang—pasaran inferens sedang berpecah, dan kategori baru telah muncul di mana kelajuan bukanlah ciri—ia adalah seluruh nilai proposisi. Nilai proposisi yang hanya boleh dicapai dengan seni bina cip yang berbeza daripada GPU.”
Namun, tidak semua orang yakin bahawa setiap startup cip inferens akan mendapat manfaat secara sama rata. Matt Murphy, rakan kongsi di Menlo Ventures, berkata sektor cip masih sukar untuk pelabur ventura, memandangkan keperluan modal yang tinggi dan garis masa yang panjang. “Banyak VC berhenti melabur dalam cip 10 atau 15 tahun yang lalu,” kata Murphy. “Ia memerlukan banyak modal; ia mengambil tahun-tahun untuk mengeluarkan produk; dan hasilnya sukar diramalkan.”
Walau bagaimanapun, dia menunjuk kepada Fireworks, platform inferens AI yang mengumpulkan $250 juta dengan penilaian $4 bilion pada Oktober, sebagai startup dengan kelebihan teknikal, terima kasih kepada pasukan pengasas yang penuh dengan jurutera yang membina PyTorch. Tetapi dia menambah bahawa masih tidak jelas berapa banyak dari semangat semasa yang mencerminkan pembezaan teknikal yang sebenar. “Sukar untuk mengetahui siapa yang benar-benar mempunyai sesuatu yang signifikan berbanding gelombang yang [meningkatkan] semua bot, yang kelihatan berlaku sekarang,” katanya, menambah bahawa penyatuan merentasi sektor kini kelihatan semakin mungkin.
Peserta baru mencari gangguan sebenar
Tetapi sekurang-kurangnya seorang veteran dalam dunia perkakasan AI berhujah bahawa bahkan startup yang tertumpu pada inferens hari ini tidak benar-benar mengganggu.
Naveen Rao, bekas SVP AI di Databricks dan pengasas MosaicML, baru-baru ini meninggalkan Databricks untuk memulakan Unconventional AI, yang bulan lepas mengesahkan pusingan benih besar bernilai $475 juta yang diketuai oleh Andreessen Horowitz dan Lightspeed Ventures. Kritikan beliau: Syarikat seperti Groq, D-Matrix, dan Cerebras mungkin berada pada kedudukan yang baik dalam pasaran hari ini, tetapi mereka masih mengoptimumkan dalam paradigma pengkomputeran digital yang sama.
Selepas perjanjian Groq-Nvidia mengesahkan permintaan untuk inferens yang lebih cepat dan cekap, startup yang sesuai dengan stack AI hari ini tiba-tiba kelihatan jauh lebih berharga—bukan kerana mereka mencipta semula pengkomputeran, kata Rao, tetapi kerana mereka berfungsi di dalamnya. Unconventional AI sedang mengejar laluan yang lebih radikal: membina perkakasan baru yang mengeksploitasi tingkah laku fizikal silikon itu sendiri, dan mereka bentuk semula rangkaian saraf untuk sepadan dengan itu.
“Kami telah membina mesin asas yang sama selama 80 tahun, mesin digital berangka,” katanya. “Tetapi tidak pernah ada beban kerja yang mendominasi lebih daripada 2% daripada semua kitaran pengkomputeran.” Itu sedang berubah, jelas beliau: Dalam beberapa tahun lagi, 95% daripada semua pengkomputeran akan digunakan untuk AI.
Dari perspektif itu, adalah penting untuk membina mesin yang sama sekali berbeza daripada yang dibina hari ini, katanya. Walau bagaimanapun, Rao berkata usaha itu mungkin mengambil lima tahun atau lebih untuk menghasilkan hasil—dan tidak bertujuan untuk memanfaatkan ledakan inferens semasa.
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.