Saintis data bertanggungjawab untuk mengatur dan menganalisis data untuk perniagaan. Dengan syarikat yang menjana lebih banyak data berbanding sebelum ini, para profesional ini mendapat permintaan yang tinggi, meletakkan tempat pertama dalam senarai Pekerjaan Terbaik Glassdoor di Amerika selama empat tahun berturut-turut.
LIHAT: Cara membina kerjaya saintis data yang berjaya (PDF percuma)
Mereka yang bekerja dalam sains data biasa dengan analisis data besar, pembelajaran mesin, bahasa pengekodan, algoritma dan penilaian masalah, lapor Alison DeNisco Rayome dari TechRepublic. Walau bagaimanapun, kemahiran teknikal sahaja tidak akan mengurangkannya.
Komunikasi, kerjasama dan pembelajaran berterusan juga merupakan komponen yang diperlukan untuk kejayaan dalam sains data. Tanpa kedua-dua kemahiran teknikal dan interpersonal, saintis data akan dilepaskan, dan mudah diganti apabila bilangan mereka meningkat.
“Menjadi saintis data yang berjaya memerlukan gabungan kemahiran teknikal, pemikiran yang lebih tinggi dan penyelesaian masalah yang buruk,” kata Roger Yarbrough, pengetua dan pengasas bersama firma perunding pemasaran Stratistry. “Memandangkan gabungan bakat ini tidak semestinya sebahagian daripada kurikulum kolej standard, anda akan menemui ramai saintis data tanpa pengalaman dunia sebenar yang diperlukan untuk memahami sepenuhnya potensi perangkap yang boleh anda hadapi apabila bekerja dengan data.”
Saintis data boleh tunduk kepada banyak perangkap, seperti mana-mana profesion. Berikut ialah kesilapan terbesar yang dilakukan oleh saintis data yang akhirnya menyebabkan mereka gagal:
1. Fokus hanya pada penyelesaian
Para saintis data dipanggil untuk menyelesaikan masalah perniagaan, serta melaksanakan analisis, kata Ganes Kesari, ketua analitik di Gramener. “Ini adalah cawan suci sains data,” kata Kesari. “Seseorang perlu merangka soalan perniagaan yang betul, dan mengembangkan urutan langkah untuk menyelesaikannya. Tetapi, di sinilah kebanyakan saintis data goyah.”
Memberi tumpuan semata-mata pada penyelesaian boleh menimbulkan masalah di sepanjang jalan; saintis data mesti mengingati konteks masalah itu disiarkan, kata Keith Williams, saintis data di Red Ventures.
“Anda perlu memahami bagaimana sistem tersebut biasanya berfungsi dan bagaimana ia berinteraksi dengan penyelesaian, ” katanya. “Kegagalan untuk melakukan kerja keras ini sering menjelma sebagai pepijat hiliran, menyebabkan anda memegang beg dengan hanya tanggapan yang samar-samar tentang apa yang salah dan di mana ia berlaku.”
2. Melupakan perkara asas
Walaupun memahami bagaimana kecerdasan buatan (AI) dan sistem pembelajaran mesin berfungsi adalah penting untuk kerjaya dalam sains data, profesional ini sering mengabaikan asas, kata Kesari.
“Calon menunjukkan tahap ketepatan 90% model AI dalam projek. Tetapi ia adalah satu tragedi apabila mereka bergelut untuk menerangkan apa itu nilai-p, atau cara menggunakan excel untuk mengekstrak corak mudah daripada data,” kata Kesari. “Saintis data yang mempunyai kemahiran membina model tanpa asas adalah seperti juruterbang yang boleh menerbangkan kapal terbang tanpa mengetahui maksud dail kokpit.”
“Alat mudah seperti regresi linear sebenarnya boleh menjadi agak berkuasa apabila dipasangkan dengan data yang disusun dengan baik dan disepadukan ke dalam sistem di mana output boleh diambil tindakan,” tambah Williams. “Seorang saintis data tekno-optmimis akan berusaha untuk mendapatkan rangkaian neural dalam terkini yang digunakan untuk masalah mereka hanya untuk mendapati bahawa beberapa proses huluan perlu ditangani sebelum perkara lain boleh berlaku. Dengan menggunakan penyelesaian mudah dahulu, isu sebegitu akan dikenal pasti dengan cepat tanpa membakar kredibiliti.”
3. Tidak berkesan berkomunikasi
Mencari keputusan analisis adalah penting, tetapi saintis data yang berjaya tahu cara menyampaikan hasil tersebut secara produktif, kata Kesari.
“Utiliti keputusan analisis adalah berkadar terus dengan keputusan yang boleh diambil menggunakannya. Saintis data menganggap bahawa pengguna memahami analisis,” kata Kesari. “Mereka tidak meluangkan masa untuk menterjemahkan hasil ke dalam format yang pengguna boleh bertindak. Tafsiran perniagaan dan visualisasi data ialah kemahiran yang tidak ternilai yang sering diketepikan.”
Saintis data terbaik menyedari kesilapan ini dan mengambil langkah untuk mengehadkannya, kata Yarbrough, dan mereka dapat melakukan ini kerana mereka mempunyai kemahiran teknikal dan interpersonal.
“Adalah satu perkara untuk memahami dan menggunakan konsep dalam persekitaran akademik, tetapi perkara lain sepenuhnya untuk melakukannya di dunia nyata dengan semua tekanannya,” kata Yarbrough. “Mereka yang bekerja keras untuk melindungi integriti data mereka dan mengambil langkah yang betul untuk memastikan ketepatannya akan mendapati kerja mereka bernilai untuk diri mereka sendiri dan mereka yang bergantung padanya juga.”
Untuk maklumat lanjut, lihat Bagaimana untuk memastikan kemahiran saintis data anda dikemas kini: 3 petua tentang TechRepublic.
Macy Bayern ialah bekas Penulis Staf Bersekutu untuk TechRepublic. Beliau adalah graduan dari Universiti Texas di Program Kepujian Seni Liberal Austin.