(SeaPRwire) –   Pada , , dan tempat lain, pos-pos muncul dari pengguna yang mendakwa mereka dapat menghasilkan $20 sejam—atau lebih—menyelesaikan tugas-tugas kecil pada masa lapang mereka di laman seperti DataAnnotation.tech, Taskup.ai, Remotasks, dan Amazon Mechanical Turk.

Ketika syarikat-syarikat telah bergegas untuk membina model-model AI, permintaan untuk kerja “penandaan data” dan “pelabelan data” telah meningkat. Pekerja-pekerja menyelesaikan tugas-tugas seperti menulis dan pengkodan, yang kemudiannya digunakan oleh syarikat-syarikat teknologi untuk membangunkan sistem kecerdasan buatan, yang dilatih menggunakan bilangan contoh data yang besar. Sesetengah model memerlukan semua input data mereka dilabel oleh manusia, satu teknik yang dirujuk sebagai “pembelajaran terarah”. Dan walaupun “pembelajaran tidak terarah”, di mana model-model AI diberi makanan data tanpa label, kini menjadi semakin popular, sistem-sistem AI yang dilatih menggunakan pembelajaran tidak terarah masih sering memerlukan langkah akhir yang melibatkan data dilabel oleh manusia.

Tiada anggaran tepat berapa ramai orang yang terlibat dalam kerja penandaan data. Satu kajian Google Research 2022 menganggarkan bilangannya berada dalam jutaan, dan pada masa hadapan ia boleh berkembang menjadi berbilion. Satu kajian 2021 menganggarkan bahawa 163 juta orang telah membuat profil di platform buruh dalam talian, 14 juta daripada mereka telah mendapat kerja melalui platform sekurang-kurangnya sekali, dan 3.3 juta daripada mereka telah menyelesaikan sekurang-kurangnya 10 projek atau menghasilkan sekurang-kurangnya $1,000. (Walaupun angka ini kemungkinan berlebihan untuk kerja penandaan data, kerana bukan semua kerja yang dilakukan di platform buruh dalam talian adalah kerja penandaan data.)

Laman-laman penandaan data, seringkali anak syarikat syarikat yang lebih besar, boleh menawarkan laluan yang sah untuk menghasilkan wang. Ketika industri AI terus berkembang, permintaan untuk pekerja pelabel manusia juga berkembang bersamanya. Tetapi pengguna potensi perlu sedar bahawa industri pelabelan data dikawal selia dengan lemah, dan kerana industri ini kabur, ia boleh menjadi sukar untuk menavigasinya. Berikut adalah apa yang perlu diketahui.

Bagaimana seseorang boleh memulakan kerja penandaan data?

Untuk layak bagi program-program tersebut, pekerja-pekerja perlu memulakan dengan menyempurnakan penilaian. Tempoh penilaian awal boleh berbeza, tetapi pengguna biasanya melaporkan masa sesingkat satu jam dan selama tiga jam. Jika pengguna lulus penilaian, mereka seharusnya mula menerima jemputan untuk kerja berbayar melalui laman tersebut. Jika pengguna tidak diterima ke dalam program, mereka biasanya tidak mendengar apa-apa selepas menyempurnakan penilaian.

Tugas-tugas dalam penilaian boleh berbeza sifatnya. Terdapat trend ke arah kerja penandaan data yang lebih mahir, kata Sonam Jindal, yang memimpin program AI, Buruh dan Ekonomi di Persatuan AI, sebuah pertubuhan bukan untung. “Kita akan mula melihat ini apabila anda memerlukan kualiti data yang lebih tinggi untuk mempunyai model-model AI yang lebih maju,” katanya. “Kita boleh menentukan sama ada sesuatu ialah kucing atau anjing, itu hebat. Bergerak ke tugas-tugas lebih maju—untuk mempunyai AI lebih maju yang berguna dalam scenario dunia nyata yang lebih khusus—anda akan memerlukan set kemahiran yang lebih khusus untuk itu.”

Berapakah upah kerja ini?

Di Amerika Syarikat, laman-laman sering menawarkan sekitar $20 sejam untuk tugas-tugas seperti pelabelan foto dan menyelesaikan latihan penulisan. Kerja penandaan data yang lebih khusus boleh menawarkan upah yang lebih tinggi. Sebagai contoh, DataAnnotation.tech menawarkan $40 untuk tugas pengkodan, dan Outlier.ai menawarkan $60 sejam untuk tugas kimia.

Di luar Amerika Syarikat, pekerja pelabel biasanya dibayar jauh lebih rendah, kata Jindal. Tetapi walaupun harga lebih tinggi, terdapat sebab-sebab mengapa syarikat-syarikat mungkin lebih suka pekerja berdasarkan Amerika Syarikat, seperti tugas-tugas yang memerlukan pengetahuan budaya khusus atau kemahiran yang lebih meluas di Amerika Syarikat.

Bagaimanakah pengalaman orang ramai?

Di , pengguna melaporkan pelbagai pengalaman dengan kerja penandaan data. Ramai menggambarkan pengalaman positif—proses penyertaan yang jelas, bekalan tugas yang mencukupi, dan upah yang baik.

“Saya telah bekerja di [DataAnnotation.Tech] hampir 2 tahun,” kata seorang pengguna . “Anda dapat wang dengan tugas atau sejam, bergantung kepada projek. Mereka membayar melalui PayPal. Saya hanya bekerja sangat separuh masa dalam beberapa tahun terakhir dan hampir mencapai tanda $3k. Dengan jujurnya, saya berhenti untuk masa yang lama semasa pekerjaan penuh masa saya, tetapi kembali kepadanya. Saya kini bekerja pada dua projek, satu $20 sejam dan satu $25 sejam. Saya menghasilkan kira-kira $400-$500 seminggu. Ini bukanlah sesuatu yang kekal, kerana tugas-tugas datang dan pergi, tetapi ia adalah pendapatan sampingan yang hebat untuk dikerjakan jika anda memerlukan kerja tambahan dari komputer riba atau laptop.”

Tetapi sesetengah melaporkan pengalaman kurang positif, seperti diberitahu mereka lulus penilaian, tetapi kemudian tidak ditawarkan tugas apa-apa. Lebih membimbangkan, sesetengah pengguna melaporkan akaun mereka dinonaktifkan dengan jumlah pendapatan besar yang belum dibayar. Seorang pengguna melaporkan bahawa akaun mereka dinonaktifkan dengan kerja tidak dibayar bernilai $2,869, dan bahawa mereka menghantar emel kepada pihak sokongan syarikat tetapi tidak mendapat balasan.

Laman-laman penandaan data sering menggunakan pengurusan algoritma untuk mengekalkan kos rendah, yang boleh mengakibatkan rawatan buruk yang banyak pekerja alami, kata Milagros Miceli, yang memimpin kumpulan penyelidikan Data, Sistem Algoritma, dan Etika di Weizenbaum-Institut di Berlin. Dan kerana industri pelabelan data dikawal selia dengan lemah, syarikat-syarikat jarang menghadapi akibat untuk rawatan buruk pekerja, katanya.

Apakah data digunakan untuk?

Beberapa syarikat, seperti Amazon Mechanical Turk dan Upwork, beroperasi dengan cara agak telus, dengan jenama yang sama untuk pembelian buruh pelabelan data dan untuk pekerja. Tetapi yang lain tidak. Remotasks ialah anak syarikat Scale AI yang berhadapan dengan pekerja, sebuah perniagaan San Francisco bernilai berbilion dolar dengan pelanggan termasuk OpenAI, Meta, dan tentera Amerika Syarikat. Begitu juga, Taskup.ai, DataAnnotation.tech, dan Gethybrid.io ialah anak syarikat Surge AI, pembekal pelabelan data lain yang melayani pelanggan termasuk Anthropic dan Microsoft.

Syarikat-syarikat menyatakan kerahsiaan diperlukan untuk melindungi maklumat komersial yang sensitif, seperti pelan pembangunan produk baharu, daripada bocor, kata Miceli. Tetapi mereka juga lebih suka kerahsiaan kerana ia mengurangkan peluang untuk disambung dengan keadaan yang mungkin dieksploitasi, seperti .

Wakil Scale AI mengarahkan TIME kepada yang menyatakan bahawa Remotasks ditubuhkan secara berasingan daripada Scale AI untuk melindungi kerahsiaan pelanggan dan menyenaraikan contoh langkah Scale AI telah ambil untuk memastikan pekerja dilayan dengan adil. Wakil itu juga berkata bahawa “Remotasks tidak terlibat dalam projek yang memerlukan pendedahan kepada imej / video sensitif, dan dalam kejadian sedemikian kandungan muncul dalam set data, ia boleh dilaporkan dan dikeluarkan dari aliran kerja.”

Surge AI, Taskup.ai, DataAnnotation.tech, dan Gethybrid.io tidak menjawab permintaan untuk komen pada masa penerbitan.

Kerja data secara asasnya tidak dihargai, menghujah Jindal, mencadangkan pekerja data boleh dibayar royalti atas produk yang mereka bantu cipta.

“Pengetahuan dan maklumat mereka ditangkap dalam data dan digunakan untuk melatih model-model AI ini yang dipanggil kecerdasan buatan,” katanya. “Ia sebenarnya kecerdasan manusia mereka—kecerdasan kolektif kami—yang dimasukkan ke dalam model-model ini.”

Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.

Sektor: Top Story, Berita Harian

SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.