Big Data

บิ๊กดาต้า (Big Data)

  1. คือ ปริมาณข้อมูลจำนวนมหาศาลและมีความซับซ้อนซึ่งยากต่อการประมวลผล โดยมีลักษณะหลากหลายรูปแบบและแหล่งที่มาจากหลายแหล่งที่ต่างกัน

  2. บิ๊กดาต้าจะถูกนำไปใช้สำหรับงาน Data Science เช่น Data Mining การสกัดข้อมูลเชิงลึกออกมาหรือ Machine Learning การพัฒนาโมเดลให้มีความสามารถเฉพาะ

  3. บิ๊กดาต้ามีองค์ประกอบที่เรียกว่า 4V ดังนี้

    1. ข้อมูลมีจำนวนปริมาณมหาศาล (high volume) เกินกว่าจะรองรับด้วยสถาปัตยกรรมคอมพิวเตอร์แบบพื้นฐานได้อย่างมีประสิทธิภาพ

    2. ข้อมูลมีความหลากหลายประเภท (variety) เนื่องจากแหล่งข้อมูลมาจากหลายแหล่ง ซึ่งแต่ละแหล่งต่างมีรูปแบบการจัดเก็บข้อมูลเป็นของตนเองเพื่อใช้กับระบบงานของตนโดยเฉพาะ ทำให้ข้อมูลบิ๊กดาต้ามีข้อมูลทั้งที่เป็นโครงสร้างและไม่เป็นโครงสร้าง ตัวอย่างข้อมูลที่เป็นโครงสร้าง เช่น ตารางตัวเลข ข้อมูลสถิติ ข้อมูลรายงานการวิเคราะห์ ส่วนข้อมูลที่ไม่เป็นโครงสร้าง เช่น ข้อความจากเครือข่ายสังคมออนไลน์ รายงานข่าวจากสำนักข่าว บทความวิเคราะห์สถานการณ์

    3. ข้อมูลที่มีลักษณะได้รับมาอย่างต่อเนื่องและรวดเร็ว (high velocity) เนื่องจากความก้าวหน้าด้านเทคโนโลยีด้านการสื่อสาร (communication) และอินเทอร์เน็ตของสรรพสิ่ง (Internet of Things) และเซ็นเซอร์ (sensors)

    4. ข้อมูลที่มีลักษณะยังไม่ได้รับการตรวจสอบ (veracity) หรือข้อมูลที่มักมีความผิดพลาดสูง โดยเฉพาะข้อมูลที่มาจากแหล่งออนไลน์ ซึ่งข้อมูลต้องได้รับการตรวจสอบและประมวลผลก่อนการนำไปใช้งานต่อไป

    5. นอกเหนือจากองค์ประกอบของข้อมูลข้างต้นแล้ว ข้อมูลที่เข้ากับนิยามบิ๊กดาต้านั้น ต้องเป็นข้อมูลที่มีคุณค่า (value) สามารถนำไปใช้ประโยชน์ได้ด้วย

Visitors: 335