ในยุคที่ใคร ๆ ต่างพูดถึงแต่ บิ๊กดาต้า บิ๊กดาต้า เต็มไปหมด โดยที่หลาย ๆ คนยังสงสัยว่า แล้วบิ๊กดาต้านี่มันคืออะไร มีความสำคัญอย่างไรต่อเรา วันนี้ JDC จะมาสรุปเรื่องใหญ่ๆของบิ๊กดาต้าให้เป็นเรื่องง่าย ๆ
ข้อมูลแบบไหนที่เรียกว่าบิ๊กดาต้า
ข้อมูลที่เข้าข่ายว่าเป็นบิ๊กดาต้า (Big Data) จะต้องมีลักษณะใดลักษณะหนึ่งต่อไปนี้
- Volume คือ ข้อมูลที่ปริมาณมากและขนาดของข้อมูลใหญ่ เป็นได้ทั้งข้อมูลจาก Offline & Online
- Velocity คือ ข้อมูลที่การเปลี่ยนแปลงหรือเกิดขึ้นอย่างรวดเร็ว
- Variety คือ ข้อมูลที่มีความหลากหลาย
บิ๊กดาต้า (Big Data) มาจากไหน
แหล่งที่มาของบิ๊กดาต้านั้น มาจาก 3 แหล่ง ดังต่อไปนี้
1) โซเชียลมีเดีย (Social Media)
ซึ่งได้แก่ ข้อมูลส่วนตัวของผู้ใช้งาน พฤติกรรมการใช้งาน ต่างๆ
2) Geo-location
ได้แก่ข้อมูลที่ระบุพิกัดตำแหน่ง สถานที่ตั้ง latitude, longitude ผ่านการใช้งานสมาร์ทโฟน GPS เป็นต้น
3) อินเทอร์เน็ตในทุกสรรพสิ่ง หรือ Internet of Things (IoT)
เป็นการใช้เทคโนโลยีเชื่อมโยงข้อมูลเป็นเครือข่าย เพื่อให้ผู้ใช้งานสามารถสั่งการหรือควบคุมอุปกรณ์ระบบ เครื่องจักร ต่างๆได้ เช่น Smart Home, Smart Device, และ Smart City เป็นต้น
ทั้งนี้ ข้อมูลบิ๊กดาต้า สามารถจำแนกออกเป็น 2 ประเภท ได้แก่
- ข้อมูลเชิงโครงสร้าง (Structured Data) เช่น ข้อมูลตัวเลข วันที่ จำนวน ยอดขาย จำนวนเงิน เป็นต้น หรือจำง่ายๆว่าคือข้อมูลที่สามารถเก็บในตารางได้นั่นเอง
- ข้อมูลที่ไม่มีโครงสร้างแน่นอน (Unstructured Data ) เช่น รูปภาพ, ไฟล์เสียง, และวิดีโอ เป็นต้น
ซึ่งพบว่าข้อมูลเหล่านี้ส่วนใหญ่ประมาณ 80%-90% จะเป็น Unstructured Data หรือข้อมูลที่ไม่มีโครงสร้างที่แน่นอน นั่นเอง
ด้วยลักษณะของข้อมูลที่มีปริมาณมาก มีความหลากหลาย และมีการเปลี่ยนแปลงหรือเกิดขึ้นอย่างรวดเร็ว จึงทำให้บิ๊กดาต้า ถือเป็นความท้าทายในการจัดการ แต่ในขณะเดียวกันก็เป็นโอกาสดี ที่จะช่วงชิงความได้เปรียบด้านการแข่งขันธุรกิจ ดังนั้นองค์กรควรตระหนักถึงการนำข้อมูลมาวิเคราะห์ เพื่อสนับสนุนรูปแบบธุรกิจ และช่วยออกแบบประสบการณ์ที่ดีให้แก่ลูกค้า ทั้งนี้ผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ทุกองค์กรควรจะต้องมีก็คือ Data Scientist หรือนักวิทยาศาสตร์ข้อมูลนั่นเอง