เจาะลึกเบื้องหลัง Data Scientist  

บุคคลที่ไม่ได้จดจ่ออยู่แค่เพียงตัวเลข ข้อมูลและการพัฒนาโมเดลเท่านั้น

 ในยุคปัจจุบันที่เทคโนโลยีดิจิทัลรุดหน้าอย่างรวดเร็ว พฤติกรรมของผู้บริโภคที่เปลี่ยนไปแบบนาทีต่อนาที ส่งผลให้ทุกภาคธุรกิจต่างเล็งเห็นถึงความสำคัญของการจัดเก็บข้อมูลและการนำข้อมูลเหล่านั้นมาวิเคราะห์และคาดการณ์พฤติกรรมที่เปลี่ยนแปลงไป ดังนั้นอาชีพ Data Scientist จึงกลายเป็นหนุ่มสาวเนื้อหอม ที่กำลังเป็นที่ต้องการของตลาดแรงงาน หลาย ๆ คนใฝ่ฝันที่จะผันตัวเองมาอยู่ในสายงานด้านนี้ และอยากทราบว่าในแต่ละวันทำงานของพวกเขาเหล่านี้ทำอะไรบ้าง ซึ่งในหนึ่งวันงานด้าน Data Scientist นั้นจะต้องทำงานที่มีความยากและซับซ้อนมากน้อยแค่ไหน และพวกเขามีวันชิลๆ เหมือนพนักงานออฟฟิศทั่วไปบ้างหรือไม่ วันนี้เราจะมาทำความรู้จักกับอาชีพนี้ผ่านตัวแทนของคนที่ทำงานด้านData Analytics ตัวจริงกันเลยดีกว่า

สวัสดีครับ ชื่อ ดร.ภูวิชญ์ ผลาดิกานนท์ หรือ ดร.เดีย นะครับ ศิษย์เก่าเซ็นต์คาเบรียล สำเร็จการศึกษาระดับปริญญาตรีที่ SIIT และระดับ Ph.D. in Industrial Engineering, University of Texas at Arlington ประเทศสหรัฐอเมริกา เคยทำงานด้าน  บริหารความเสี่ยงให้กับสถาบันการเงิน และปัจจุบันเป็น Head of Analytics ที่ JIB Digital Consult ซึ่งเป็นบริษัทที่ปรึกษาด้าน Data Analytics และ Digital Transformation ครับ

 

Q: ไม่ได้จบด้าน Data มาโดยตรง ทำไมถึงมาทำงานในสายนี้ได้?
สำหรับผม เริ่มจากตอนที่ผมเรียนปริญญาเอกได้มีโอกาสเรียนรู้เกี่ยวกับการทำ Data mining และMachine learning เพราะต้องนำมาใช้ในการทำ Dissertation เลยทำให้ได้เข้าไปสัมผัสและเรียนรู้เกี่ยวกับการจัดการข้อมูล และด้วยงานวิจัยตอนนั้นเองก็จำเป็นที่จะต้องใช้ Data มาทำการวิเคราะห์ จึงทำให้มีพื้นฐานทางด้าน Data อยู่บ้าง พอเรียนจบมาก็รู้สึกอยากต่อยอดความรู้พื้นฐานที่มี เพราะช่วงที่ผมเรียนจบปริญญาเอกมาใหม่ๆนั้น สายงาน Data กำลังเข้ามาและเป็นที่ต้องการของตลาดพอดี จึงตัดสินใจศึกษาเพิ่มเติมจากคอร์สต่าง ๆ ที่เปิดสอนด้าน Data และ ศึกษาด้านนี้อย่างจริงจัง จนได้เข้าสู่สายอาชีพนี้ครับ

 

Q: แล้วคนที่อยากทำงานด้านนี้ต้องเรียนอะไร หรือมีทักษะใดบ้างที่จำเป็น?
ก่อนอื่นก็ต้องมีพื้นฐานทางคณิตศาสตร์ก่อน เพราะคณิตศาสตร์เป็นสิ่งที่หลีกเลี่ยงไม่ได้ถ้าจะต้องทำงานด้าน Data โดยพื้นฐานที่ต้องเรียนรู้ก็จะเกี่ยวข้องกับ Statistics และ Linear Algebra ซึ่งจะทำให้สามารถเข้าใจหลักการของ Data mining และ Machine learning นอกจากคณิตศาสตร์แล้ว “ความเข้าใจในด้านการทำธุรกิจ” ก็เป็นอีกปัจจัยสำคัญที่จะช่วยให้เราเข้าใจในข้อมูลมากขึ้น อีกทั้งยังต้องเรียนรู้การใช้เครื่องมือต่าง ๆ เช่น Python, R, Excel, SQL เพื่อช่วยให้การทำงานกับ Data ง่ายมากขึ้น ไม่ว่าจะการเตรียมข้อมูล จนไปถึงการทำ modeling ซึ่งสิ่งเหล่านี้สามารถฝึกฝนกันได้ครับ

Q: Data Engineer, Data Analyst และ Data Scientist ทำงานต่างกันอย่างไร?

Data Engineer คือคนที่วางโครงสร้างวิธีการจัดเก็บข้อมูล ซึ่งถ้าจะให้เห็นภาพอย่างชัดเจนก็คือ คนนี้คือคนที่เขียน Flowchart ของข้อมูลในองค์กร และทำให้ทุกระบบสามารถเชื่อมต่อกันนั่นเองครับ

Data Analyst แปลตรงตัวก็คือนักวิเคราะห์ข้อมูล คนนี้จะนำข้อมูลมาใช้ในการวิเคราะห์แนวโน้มต่าง ๆ เพื่อนำไปใช้ในการตัดสินใจด้านธุรกิจและการให้บริการลูกค้า ซึ่งวิธีการที่ใช้อาจจะไม่ได้มีความซับซ้อนเท่า Data Scientist

Data Scientist คือคนที่นำข้อมูลต่าง ๆ ทั้งในและนอกองค์กร มาใช้ในการตัดสินใจ โดยใช้ Model ต่างๆ เช่น Data Mining, Optimization และการทำ Machine Learning เป็นต้นครับ

 

Q: อยากให้เล่าถึงขั้นตอนการทำงานของ Data Scientist ว่ามีรูปแบบหรือวิธีการทำงานอย่างไรบ้าง?
การทำงานของ data scientist โดยทั่วไปแล้ว ก็จะดำเนินการไปตาม framework ที่วางไว้เพื่อให้ง่ายต่อการทำงาน โดยส่วนตัวผมแล้วจะมี 5 step หลักๆ คือ

  1. Business Understanding

ในช่วงเริ่มของโปรเจคนั้น การประชุมระหว่างเราและลูกค้าเป็นสิ่งแรกที่ต้องเริ่มทำเลยครับ เพื่อสร้างความเข้าใจที่ตรงกัน ซึ่งขั้นตอนนี้มีความสำคัญเป็นอย่างมาก เพราะ data scientist เองจำเป็นที่จะต้องเข้าใจว่ากำลังจะทำอะไรบ้าง โปรเจคเกี่ยวข้องกับอะไร จะต้องปรับปรุงหรือเข้าไปแก้ปัญหาส่วนไหนขององค์กร เพราะหากเรารู้จักแต่ข้อมูลแต่ไม่มีความรู้ด้านธุรกิจเลยก็อาจจะแก้ปัญหา หรือ add value ให้กับลูกค้าไม่ได้

  1. Data Collection & Understanding

เมื่อเราเข้าใจในส่วนของ Objective และรูปแบบการดำเนินธุรกิจแล้ว จะมาเริ่มดูในส่วนของการเก็บและทำความเข้าใจในชุดข้อมูลกันต่อครับ โดยเริ่มจากการขอข้อมูลจากลูกค้า ทางเราเองอาจจะเป็นคนกำหนดรูปแบบข้อมูลที่อยาก หรือในบางกรณีทางลูกค้าเองอาจจะมีการแนะนำเพิ่มเติมว่าควรจะดูข้อมูลอะไรประกอบ และช่วงเวลาไหนที่อยากให้นำมาใช้ เนื่องจากในมุมของ consultant อาจจะมี knowledge แต่ทางลูกค้าเองที่คลุกคลีกับธุรกิจมาหลายสิบปีย่อมมีความเชี่ยวชาญบางอย่างในเชิงธุรกิจที่มากกว่า data scientist มี ซึ่งสิ่งเหล่านี้เองก็ต้องอาศัยความร่วมมือจากลูกค้าด้วยเช่นกันครับ

  1. Data Preparation

ส่วนใหญ่แล้วการได้มาซึ่งข้อมูล อาจจะไม่ได้อยู่ในรูปแบบที่เราคิดไว้ คือข้อมูลที่ได้รับมาอยู่ในสภาพพร้อมนำไปใช้งานต่อได้เลย เมื่อข้อมูลมีจำนวนที่มากบวกกับลักษณะการเตรียมความพร้อมในการจัดเก็บไม่ได้อยู่ในระดับมาตรฐานเดียวกัน ย่อมทำให้เกิดความซับซ้อนที่เราไม่คาดคิดตามมา ซึ่งข้อมูลเหล่านี้เราเรียกมันว่า Unstructured data หรือข้อมูลที่ยังไม่มี หรือไม่ได้อยู่ในโครงสร้างที่เหมาะสมต่อการใช้งานนั่นเองครับ เช่น ข้อมูลที่จัดเก็บในลักษณะ video, audio, text หรือข้อมูลจาก social media (Facebook, Twitter, และอื่น ๆ) ซึ่งข้อมูลเหล่านี้จำเป็นที่จะต้องใช้เครื่องมือทางด้าน data  แปลงให้อยู่ในรูปแบบที่พร้อมใช้งาน หรือที่เราเรียกว่า structured นั่นเอง

  1. Data Modeling

หลังจากที่เราเตรียมข้อมูลเสร็จแล้ว เราก็จะมาดูว่า objective ของงานที่เรากำลังจะทำคืออะไร ควรจะใช้model ลักษณะไหนเข้ามาช่วย ซึ่ง model ก็มีให้เลือกใช้อยู่มากมาย บางตัวอาจจะให้ผลลัพธ์ที่ดีกว่าอีกตัวหนึ่งก็เป็นไปได้ โดยพื้นฐานแล้วเราจะแบ่งเป็น supervised learning และ unsupervised learningนอกจากนี้การทำ model ต้องมีการทำ evaluation เพื่อทดสอบว่า model ที่เราสร้างมาจะมีประสิทธิภาพในการทำงานได้ดีหรือไม่

  1. Implementation

คือการนำ model ที่เราสร้างมาไปใช้งานจริง ซึ่งในส่วนนี้ต้องมีการให้ requirements ที่เราจำเป็นต้องใช้ เช่น ตัวแปรที่เราต้องการจะใช้มีอะไรบ้าง ต้องไปเอาข้อมูลมาจากหน่วยงานไหนบ้าง จะต้องเตรียมข้อมูลอะไรบ้าง เพื่อที่ว่าทีมที่ทำการ implement ซึ่งส่วนมากจะเป็นคนจากทางฝั่ง IT จะได้ทำตามได้ถูกต้อง

 

Q: ทั้งหมดนี้คือทำจบครบในวันเดียว?

ไม่ครบครับ ขึ้นอยู่กับ Data รวมไปถึงความยากง่าย บางทียังไม่ได้ทันจะเริ่มวิเคราะห์ก็เลิกงานแล้วครับ ดังนั้นใน 1 วันของการทำงานด้าน Data Analytics นั้น จะเป็นไปตามแผนงานที่วางไว้อย่างชัดเจน บางขั้นตอนอาจจะต้องใช้เวลานาน ขึ้นอยู่กับแต่ละประเภทธุรกิจด้วยเช่นกัน

Q : นอกจากความคร่ำเคร่งอยู่กับข้อมูลแล้ว Data Scientist ทำกิจกรรมอื่นๆอะไรบ้าง?

จริงๆแล้วคนที่ทำงานวงการนี้ อาจจะไม่ใช่คร่ำเคร่งอยู่กับแค่ข้อมูล คุยกับใครไม่รู้เรื่องนะครับ ชีวิตปกติของพวกเราก็มีทั้งการวิเคราะห์ข้อมูล และการพัฒนาตนเอง อย่างเช่นผมก็จะมีดู Online Course หรือเข้าไปหาข้อมูลใน Community ที่เกี่ยวกับ Data อยู่บ้าง บางทีก็อ่านบทความต่าง ๆ ที่เกี่ยวข้องกับการทำธุรกิจ หรือศึกษาเรื่องการลงทุน เพราะข้อมูลเหล่านี้จะช่วยในการทำงานในด้าน Business Understanding สำหรับลูกค้าในแต่ละ Industry ได้อย่างรวดเร็วนั่นเอง นอกจากนี้ยังมีมุม Relax กับเค้าบ้างเหมือนกัน กิจกรรมอื่น ๆ ที่ทำก็ เล่นเกม ดูบอล เล่นกีฬา เข้า gym ใช้ชีวิตเหมือนมนุษย์ทำงานทั่ว ๆ ไปเหมือนกันครับ

Q: อยากเริ่มศึกษาเกี่ยวกับ Data มีแหล่งเรียนรู้ดี ๆ แนะนำไหม?
แนะนำเป็น Udemy กับ Datacamp หรือ Coursera ผมว่าเป็น E-learning ที่ดีเลยครับ นอกจากนี้ Stackoverflow เองก็เป็น community ที่ใหญ่แล้วช่วยให้เวลาเราค้นคว้าหาข้อมูลต่าง ๆ ที่เกี่ยวกับการ coding หรือใช้งานเครื่องมือ รวมถึงการทำ data visualization ก็น่าสนใจเช่นกันครับเพราะทำให้เราสามารถนำเสนอข้อมูลได้มีประสิทธิภาพและง่ายต่อการทำความเข้าใจครับ

Q : อยากให้ฝากทิ้งท้ายหน่อย สำหรับผู้ที่สนใจอาชีพนี้

ได้ครับ อย่างที่ผมได้กล่าวไปถ้าใครสนใจเริ่มจากคอร์สออนไลน์ดูก่อนนะครับ แล้วถ้าหากใครสนใจเกี่ยวกับเรื่อง Data Science สามารถติดตามข่าวสารผ่านช่องทาง Website หรือ Social media ของ JIB Digital Consult ได้นะครับ ซึ่งในครั้งถัดไปจะมาเจาะลึกในส่วนของ Framework การทำงานด้านการวิเคราะห์ข้อมูลและเทคนิคการทำงานต่างๆ และหากเรามีเปิด Academy อีกครั้ง เราจะแจ้งให้ทราบทางช่องทางสื่อของเราครับ