วันนี้ได้เรียนเรื่อง Data mining ซึ่งกาดก็ไม่ค่อยได้รู้จักมันมากสักเท่าไหร่ เคยได้ยินผ่านๆ รู้แค่คือเหมืองข้อมูลแถมยังมีความเข้าใจคิดว่า data mining กับ data center คืออันเดียวกัน (โป๊ะมากๆ) ซึ่งจากการสอบถามได้รู้ว่า มันเป็น process กัน คือ data center เป็นตัว input ของการทำ data mining นอกจาก data center แล้วยังมี Database, Data Warehouse , Big data ที่เป็นส่วน input ของการทำ data mining ด้วยนะ (ส่วนรายละเอียดคงจะได้รู้เพิ่มจากวันพรุ่งนี้)
Data mining คืออะไร?
เมื่อได้ยิน Data mining คงนึกถึงเหมืองข้อมูลแน่ๆ Data mining คือ การเก็บขอ้มูลมาวิเคราะห์ ซึ่งเรารู้จักกันในชื่อ CRISP — DM Conceptual Model (CRoss Industry Standard Process for Data Mining)
CRISP DM Conceptual Model
- เข้าใจธุรกิจ เช่น ทุน ทำเล ข้อมูล ปัญหา
- เข้าใจข้อมูล เช่น เพศ อายุ สถานที่อยู่
- การเตรียมข้อมูล เช่น ข้อมูลที่สอดคล้อง , การแบ่งกลุ่มข้อมูล
ทำไมต้องใช้ Data mining
เนื่องจากปัจจุบันเรามีข้อมูลมหาศาลมากจากหลายๆที่ เช่น Database นักวิเคราะห์ข้อมูลเลยสนใจรูปแบบของ Data pattern ซึ่งสามารถนำข้อมูลพวกนี้ไปใช้ต่อได้ เช่น น้ำดื่มยอดขายจะดีช่วงหน้าร้อน ช่วงหน้าฝนจะยอดขายจะตก ซึ่งข้อมูลพวกนี้ก็มาจาก Data mining
กิจกรรมวันนี้ ได้เริ่มทดลองจาก step เล็กๆ โดยโจทย์แรก คือ ถ้าเราจะเก็บข้อมูลจากลูกค้าที่มาซื้อสินค้า จะต้องมีอะไรบ้าง จากนั้นนำข้อมูลนั้นมาทำเป็น ER โดยกลุ่มกาดได้ทำ Smart Purse เมื่อทำERเสร็จแล้ว เอามาเทียบกับกลุ่มอื่นๆ แล้วมาตกลงกันว่า จะเอาข้อมูล table ไหน ชื่อ filed อะไร จากนั้นมาสร้างเป็น ER ส่วนกลางที่นำ ER ทั้ง 3 กลุ่มมาเทียบกัน
อยากรู้รายละเอียดเพิ่มเติม คลิกๆ
สิ่งที่กาดได้รับวันนี้ ได้แยกออกระหว่าง Data mining กับ Data center ออกและเหตุการณ์แสนเจ็บปวดจากการทำ Data base ตอนทำโปรเจ็คตอนปี4นั้น ถ้าได้เรียนรู้เร็วกว่านี้คงจะไม่เจ็บปวดมากเท่าไหร่กับ Data base โปรเจ็คตัวเอง ฮ่าๆ T_T