เวบ/อินเตอร์เน็ตเทคโนโลยี ระบบปฏฺบัติการและซอฟท์แวร์ ซอร์สโค๊ด/โอเพนซอร์ส เทคโนโลยีฐานข้อมูล ระบบเครือข่ายและความมั่นคง เอ็มไอเอส/อีบิสสิเนส อื่น ๆ เกี่ยวกับไอ.ที. อื่น ๆ ไม่เกี่ยวกับไอ.ที.

เอ็มไอเอส/อีบิสสิเนส

Data Mining เมื่อต้องขุดหาอะไรบางอย่างจากเหมืองข้อมูล?

ศาสตร์แขนงหนึ่งทาง AI (Artificial Intelligence)
อัปเดท ( 15 มิถุนายน 2546 ) , แสดง (130,605) , ความคิดเห็น (16) , พิมพ์  
 
เอ็มไอเอส/อีบิสสิเนส
Outsource คือะไร ? กระบวนการที่องค์กรใดองค์กรหนึ่งที่จะมอบหมายการบริหาร
การวิเคราะห์ปรับกลยุทธ์และวาง Concept ของ Web การทำการค้าบนเว็บ ก็ไม่ได้แตกต่างจากการทำการค้าปกติทั่วไป
เคล็ดลับการเกาะติดและวิเคราะห์จุดอ่อนคู่แข่งบนเว็บ เมื่อการแข่งขันบนเว็บเปลี่ยนแปลงไปอย่างรวดเร็วมาก
กลยุทธ์การค้าแบบ B2C, B2B และ E-X-Commerce ะเลือกค้าแบบ Business-to-Consumer (B-to-C) หรือ Business-to-Business (B-to-B) ดี?
Data Mining เมื่อต้องขุดหาอะไรบางอย่างจากเหมืองข้อมูล? ศาสตร์แขนงหนึ่งทาง AI (Artificial Intelligence)
วัฒนธรรมองค์การ กับ ลิง วัฒนธรรมองค์การ กับ ลิง
Paypal.com ธุรกิจบริการโอนและชำระเงินระหว่างบุคคลกับบุคคล Paypal Inc. (www.paypal.com) เป็น (C-to-C Payment) หรือระหว่างบุคคลกับบุคคล (P-to-P Payment) ที่ใหญ่ที่สุดใน
Amazon.com, Inc ร้านขายหนังสือออนไลน์ที่ใหญ่ที่สุดในโลก Amazon.com, Inc (www.amazon.com) เป็นร้านขายหนังสือออนไลน์ที่ใหญ่ที่สุดในโลก บริษัทเริ่มดำเนินการ ตั้งแต่ปี 1995
เผยโฉม 10 กลโกงทางอินเทอร์เน็ต (Internet Fraud) เผยโฉม 10 กลโกงทางอินเทอร์เน็ต (Internet Fraud) ลักษณะและวิธีการป้องกัน

เดต้าไมนิ่ง(Data Mining) ถ้าแปลตรงๆ คือเหมืองข้อมูล คล้ายกับเหมืองแร่ ที่ขุดดินมาเยอะแต่ใด้แร่นิดเดียว เดต้าไมนิ่งเป็นศาสตร์แขนงหนึ่งทาง AI (Artificial Intelligence) ดังนั้นข้อมูลที่จะพูดถึงต่อไป ท่านที่เคยศึกษา ด้าน AI (Artificial Intelligence) มาบ้างอาจคุ้นเคยเพราะหลายเทคนิคใน AI (Artificial Intelligence) ได้นำมาใช้กับเดต้าไมนิ่ง เดต้าไมนิ่งเป็นการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล ซึ่งสัมพันธ์และรูปแบบเหล่านั้นได้ถูกซ่อนไว้ภายในข้อมูลจํานวนมากที่มีอยู่ เดต้าไมนิ่งจะทําการสํารวจและวิเคราะห์ข้อมูลให้อยู่ในรูปแบบที่เต็มไปด้วยความหมายและอยู่ในรูปของกฎ โดยความสัมพันธ์หน่วยนี้แสดงให้เห็นถึงความรู้ต่าง ๆ (Knowledge) ที่มีประโยชน์ในฐานข้อมูลในปัจจุบันองค์กรธุรกิจส่วนใหญ่เผชิญกับปัญหาของ ข้อมูลดิบจํานวนมากแต่ข้อมูลที่ประยุกต์ใช้ได้นั้นมีน้อย เดต้าไมนิ่งจึงเป็นสาขาที่คาดว่าจะเป็นที่รู้จักและนํามาใช้ประยุกต์ใช้อย่างแพร่หลายเนื่องจากเดต้าไมนิ่งสามารถดึงคามรู้ออกมาจากข้อมูลจํานวนมากที่ถูกเก็บสะสมและซ่อนไว้

ในโลกปัจจุบันธุรกิจต่างๆจะพยายามหาเทคนิคที่สามารถนําความสําเร็จมาสู่บริษัท เช่น ในโลกธุรกิจขนาดย่อมจะสร้างความสัมพันธ์กับลูกค้า โดยสังเกตจากความต้องการ ความชอบและความสนใจของลูกค้า และอาจมีการเรียนรู้ได้จากผลสะท้อนในอดีต ว่าจะทําอย่างไรให้การบริการลูกค่ามีประสิทธิภาพดีขึ้นในอนาคต เช่น บริษัทที่เป็นผู้ออกบัตรเครดิตและธนาคารต่างๆ จะมีขบวนการที่ใช้เดต้าไมนิ่งให้เป็นประโยชน์ ในการตัดสินใจว่าลูกค่ากลุ่มใดเป็นกลุ่มที่ดี ทําความเข้าใจลูกค่า ช่วยในการแยกประเภทของลูกค้าและจะทํานายกลุ่มของประชากรที่คาดว่าจะมาเป็นลูกค้าในอนาคต เป็นต้น อย่างไรก็ตามการเรียนรู้นั้นต้องมากกว่าการเก็บสะสมข้อมูลอย่างตรงไปตรงมา ซึ่งจะทําให้การทํางานเป็นไป
อย่างมีประสิทธิภาพ
  
 

วัฎจักรขั้นตอนการทํางานของเดต้าไมนิ่ง วัฎจักรขั้นตอนการทํางานของเดต้าไมนิ่งประกอบไปด้วย 4 ขั้นตอนหลักๆ ดังนี้
1. การระบุโอกาสทางธุรกิจหรือการระบุปัญหาที่เกิดขึ้นกับธุรกิจ
เป็นการระบุขอบเขตของข้อมูลที่จะนํามาทําการวิเคราะห์เพื่อหาความได้เปรียบทางการตลาดหรือเพื่อนํามาทําการแก้ไขปัญหา

2. ส่วนของเดต้าไมนิ่ง
เป็นการนําเทคนิคของเดต้าไมนิ่ง ไปใช้ถ้ายทอดหรือทําการเปลี่ยนแปลงข้อมูลดิบให้อยู่ในรูปของข้อมูลที่จะนําไปใช้ได้จริงในทางธุรกิจ

3. การปฏิบัติตามข้อมูล
คือการนําเอาข้อมูลที่เป็นผลลัพธ์ของส่วนเดต้าไมนิ่งมาลองปฏิบัติจริงกับธุรกิจ

4. การวัดประสิทธิภาพจากผลลัพธ์
การวัดประสิทธิภาพของเทคนิคของเดต้าไมนิ่งที่จะนํามาใช้จากผลลัพธ์ ซึ่งสามารถตรวจสอบได้หลายทาง เช่น วัดจากส่วนแบ่งของตลาด วัดจากปริมาณลูกค่า หรือ วัดจากกําไรสุทธิ เป็นต้น จากทั้ง 4 ขั้นตอนที่กล่าวมาข้างต้นคือการนําเอาเดต้าไมนิ่งไปใช้กับระบบทางธุรกิจ โดยแต่ละขั้นตอนจะพึ่งพาอาศัยกันผลลัพธ์จากขั้นตอนหนึ่งจะกลายมาเป็นอินพุทจากอีกขั้นตอนต่อไป ซึ่งเดต้าไมนิ่งจะเปลี่ยนข้อมูลดิบให้เป็นข้อมูลประยุกต์ ดังนั้นการระบุแหล่งข้อมูลที่ถูกต้องจึงเป็นสิ่งที่สําคัญอย่างยิ่งต่อผลลัพธ์ที่ได้จากการวิเคราะห์

งานของเดต้าไมนิ่ง (Task of data mining)

ในทางปฏิบัติจริงเดต้าไมนิ่งจะประสบความสําเร็จกับงานบางกลุ่มเท่านั้น และต้องอยู่ภายใต้ภาวะที่จํากัดปัญหาเหมาะสมกับการใช้เทคนิคเดต้าไมนิ่งจะเป็นปัญหาที่ต้องใช้เหตุผลในการแก้ เป็นปัญหาที่เกี่ยวข้องกับเศรษฐศาสตร์และการเงิน ซึ่งจะสามารถจัดรูปแบบของธุรกิจให้อยู่ในรูปแบบของงานทั้ง 6 งานได้ ดังนี้

1. การจัดหมวดหมู่ (Classification)
2. การประเมินค่า (Estimation)
3. การทํานายล่วงหน้า (Prediction)
4. การจัดกลุ่มโดยอาศัยความใกล้ชิด (Affinity Group)
5. การรวมตัว (Clustering)
6. การบรรยาย (Description)
ไม่มีเทคนิคหรือเครื่องมือเพียงชนิดเดียวของเดต้าไมนิ่งที่เหมาะสมกับงานทุกชนิด งานในแต่ละชนิดก็จะมีเทคนิคของเดต้าไมนิ่งที่แตกต่างกันไปขึ้นอยู่กับชนิดของงาน

1. การจัดหมวดหมู่
การจัดหมวดหมู่ถือว่าเป็นงานธรรมดาทั่วไปของเดต้าไมนิ่ง เพราะการทําความเข้าใจและการติดต่อสื่อสารต่างๆ ก็เกี่ยวข้องกับการแบ่งเป็นหมวดหมู่การจัดแยกประเภทและการแบ่งแยกชนิดโดยการจัดหมวดหมู่ประกอบด้วยการสํารวจจุดเด่นของวัตถุที่ปรากฏออกมา และทําการกําหนด จุดเด่นนั้นๆ เป็นตัวที่ใช้แบ่งหมวดหมู่ งานในการแบ่งหมวดหมู่คือการบ?งบอกลักษณะ โดยการอธิบายจุดเด่นที่เป็นที่รู้จักดีในหมวดหมู่นั้น และเทรนนิ่งเซต (TrAI (Artificial Intelligence) ning Set) ของตัวอย่างในแต่ละหมวดหมู่ ซึ่งมีภาระหน้าที่ในการสร้างโมเดลของบางชนิดที่ไม่สามารถจะจัดหมวดหมู่ของข้อมูลได้ ให้สามารถจัดเป็น หมวดหมู่ได้ ตัวอย่างของการจัดหมวดหมู่ เช่น การจัดหมวดหมู่ของผู้ยื่นขอเครดิต (Credits) เป็นระดับต่ำระดับกลาง และระดับสูง ของความเสี่ยงที่จะได้รับ เป็นต้น

2. การประเมินค่า
การประเมินค่าทางธุรกิจอย่างต่อเนื่องจะก่อให้เกิดผลลัพธ์ที่มีประโยชน์กับธุรกิจ การป้อนข้อมูล
ที่เรามีอยู่เข้าไป เพื่อใช้ในการประเมินสิ่งต่างๆ ที่จะก่อให้เกิดประโยชน์ หรือสําหรับตัวแปรที่เราไม่รู้ค่า แน่นอนเช่น รายได้จากการค่า จุดสูงสุดทางธุรกิจ หรือดุลยภาพของบัตรเครดิต ในทางปฏิบัติการประเมิน ค่าจะถูกใช้ในการทํางานการจัดหมวดหมู่ ตัวอย่างของการประเมินค่าเช่น การประเมินรายได้รวมของ ครอบครัว หรือการประเมินจํานวนบุตรในครอบครัว 

3. การทํานายล่วงหน้า
การทํานายล่วงหน้าก็เป็นงานที่มีลักษณะคล้ายกับการจัดหมวดหมู่หรือการประเมินค่า ยกเว้น เพียงแต่จะใช้สถิติการบันทึกของการจัดหมวดหมู่ในการทํานายอนาคตของพฤติกรรมหรือการประเมิน ค่าที่จะเกิดขึ้นในอนาคต ตัวอย่างของงานการทํานายล่วงหน้า เช่น การทํานายการเปลี่ยนแปลงพฤติกรรม ของตลาด หรือการทํานายจํานวนลูกค่าที่จะออกจากธุรกิจของเราใน 6 เดือนข้างหน้า เป็นต้น

4. การจัดกลุ่มโดยอาศัยความใกล้ชิดกัน หรือการวิเคราะห์ของตลาด
งานในการจัดกลุ่มหรือการวิเคราะห์ตลาด คือการตัดสินใจรวมสิ่งที่สามารถไปด้วยกันเข้าไว้ในกลุ่มเดียวกันตัวอย่างของการจัดกลุ่มโดยอาศัยความใกล้ชิดกันหรือการวิเคราะห์ตลาด เช่น การตัดสินใจว่าสิ่งใดบ้างที่จะไปอยู่ด้วยกันอย่างสม่ำเสมอในรถเข็นในซุปเปอร์มาร์เกต

5. การรวมตัว
การรวมตัวคืองานที่ทําการรวมส่วนต่างๆ ในแต่ละส่วนที่ต่างชนิดกันให้อยู่ในรวมกันเป็นกลุ่มย่อย หรือคลัสเตอร์ (Clusters) โดยในแต่ละคลัสเตอร์อาจจะประกอบด้วยส่วนต่างๆที่ต่างชนิดกัน ซึ่งความแตกต่างของการรวมตัวจากการจัดหมวดหมู่คือ การรวมตัวจะไม่พึ่งพาอาศัยการกําหนดหมวดหมู่ล่วงหน้า และไม่ใช้ตัวอย่าง ข้อมูลจะรวมตัวกันบนพื้นฐานของความคล้ายในตัวเอง

6. การบรรยาย
ในบางครั้งวัตถุประสงค์ของเดต้าไมนิ่ง คือต้องการอธิบายความสับสนของฐานข้อมูลในทางที่จะเพิ่มความเข้าใจในส่วนของประชากร ผลิตภัณฑ์ หรือขบวนการให้มากขึ้น เทคนิคเดต้าไมนิ่งส่วนใหญ่ต้องการเทรนนิ่งข้อมูลจํานวนมากที่ประกอบด้วยหลายๆ ตัวอย่างเพื่อจะสร้างกฎที่ใช้ในการจัดหมวดหมู่ กฎของความสัมพันธ์ คลัสเตอร์ การทํานายล่วงหน้า ดังนั้นชุดของข้อมูลขนาดเล็กจะนําไปสู่ความไม่น่าไว้วางใจของผลสรุปทีได้ ไม่มีเทคนิคใดเลยที่จะสามารถแก้ปัญหาของเดต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคจึงเป็นสิ่งที่จําเป็นในการไปสู่วิธีการแก้ปัญหาของเดต้าไมนิ่งได้ดีที่สุด
  
 

เทคนิคของเดต้าไมนิ่ง

การแก้ปัญหาของงานชนิดต่างๆ โดยใช้วิธีเดต้าไมนิ่ง ในแต่ละงานก็จะมีเทคนิคของเดต้าไมนิ่งที่จะนํามาใช้ได้อย่างเหมาะสม โดยเทคนิคของเดต้าไมนิ่งนั้นมีมากมาย ส่วนใหญ่มาจากศาสตร์ทาง AI (Artificial Intelligence) หรือศาสตร์อื่นๆ ซึ่งจะขอยกตัวอย่างของเทคนิคที่ถูกใช้กันค่อนข้างแพร่หลาย

1. ดีซีชันทรี ( Decision Tree )
เป็นแบบจําลองที่มีลักษณะคล้ายกับต้นไม้ จะมีการสร้างกฎต่างๆ ขึ้นเพื่อใช้ในการตัดสินใจ ดีซีชันทรีเป็นวิธีที่ได้รับความนิยม เนื่องจากความไม่ซับซ่อนของอัลกอริทึม ทําให้เครื่องมือที่ใช้ในการทําที่วางขายกันอยู่ในท้องตลาด ต่างก็ใช้วิธีนี้ข้อดีของวิธีนี้คือ สามารถตีความและเข้าใจลักษณะของรูปแบบข้อมูล ( Pattern ) ได้ง่าย เพราะ มีการแยกออกเป็นกฎ หรือข้อกําหนดต่างๆ แต่ก็ยังคงมีปัญหาในเรื่องของการให้น้ำหนักความน่าเชื่อถือหรือการให้ค่าน้ำหนักในแต่ละโหนด (node) ซึ่งถ้าให้น้ำหนักผิดไป อาจจะทําให้การตีความผิดไปได้

2. คลัสเตอร์ลิ่ง ( Clustering )
วิธีคลัสเตอร์ลิ่งนี้เป็นวิธีที่อาจจะเรียกว่าเป็นการทําเดต้าไมนิ่งแบบอ้อมๆ ก็ว่าได้ เนื่องจากการหาผลลัพธ์ในแต่ละครั้งนั้น แม้กระทั่งผู้หายังไม่อาจจะทราบว่าสิ่งที่ต้องการจะหานั้นคืออะไร จําเป็นต้องรอจนกว่าการค้นหาจะทําเสร็จสมบูรณ์จึงจะทราบข้อมูลที่ซ่อนอยู่ เปรียบเสมือนกับการมีข้อมูลจํานวนมากมายอยู่ในตะกร้า แล้วจากนั้นก็มีเวทย์มนต์มาจัดเรียงข้อมูลหน่วยนั้นให้อยู่เป็นกลุ่มก?อนซึ่งทําให้สังเกตลักษณะเด่นที่ซ่อนเร้นอยู่ภายในข้อมูลจํานวนมากหน่วยนั้น

3. นิวรอนเน็ตเวิร์ก ( Neuron Network )
นิวรอนเน็ตเวิร์ก คือระบบทีมีการประมวลผลข้อมูลซึ่งรวมคุณสมบัติของไบโอลอจิกคอลนิวรอนเน็ตเวิร์ก ถูกพัฒนาขึ้นโดยโมเดลทางคณิตศาสตร์ของกระบวนการเรียนรู้ของมนุษย์ (เลียนแบบการทำงานของสมอง) และจะเรียนรู้
จากชุดข้อมูลของชุดความรู้เทรนนิ่งเซท นิวรอนเน็ตเวิร์ก ประกอบด้วยหน่วยความจําจํานวนมากเรียกว่า นิวรอน (Neurons) เซล (Cells) หรือโหนด (Nodes) แต่ละนิวรอนต่อกันโดยคอนเน็กชั้นลิงค์ (Connection Link) ที่มีค่าน้ำหนักของมันอยู่ ในแต่ละการเชื่อมต่อ โดยค่าน้ำหนักจะแสดงรายละเอียดที่เน็ตเวิร์กใช้ในการแก้ปัญหา โดยนิวรอนเนต เวิร์กถูกใช้ในการแก้ปัญหาอย่างกว่างขวาง เช่น การเก็บและการเรียกข้อมูล การแยกประเภทของข้อมูล การเปลี่ยนจากรูปแบบของอินพุท (Input) ให้อยู่ในรูปแบบของเอาท์พุท (Output) ความสามารถในการ ตรวจสอบรูปแบบของข้อมูลที่คล้ายคลึงกับความคิดของมนุษย์ เป็นต้น ถึงแม้ว่านิวรอนเน็ตเวิร์ก สามารถ นําไปประยุกต์ใช้กับงานหลายๆ ชนิดได้อย่างมีประสิทธิภาพ แต่นิวรอนเน็ตเวิร์ก ก็ยังมีข้อเสียอยู่บ้าง ดังนี้ 

3.1. นิวรอนเน็ตเวิร์กเป็นวิธีที่ยากต่อการทําความเข้าใจในโมเดลที่ถูกผลิตออกมา 

3.2. นิวรอนเน็ตเวิร์กมีคุณสมบัติที่ไวต่อรูปแบบของอินพุท ถ้าเราแทนข้อมูลด้วยรูปแบบที่ แตกต่างกันก็จะสามารถผลิตผลลัพธ์ที่แตกต่างกันออกมา ดังนั้นการกําหนดค่าเริ่มต้นให้กับ ข้อมูลจึงเป็นส่วนที่มีความสําคัญส่วนหนึ่ง

4. จีเนติก อัลกอริทึ่ม ( Genetic Algorithms : GA )
จีเนติก อัลกอริทึ่ม เป็นทฤษฎีที่จําลองกระบวนการวิวัฒนาการทางธรรมชาติ คือการคัดเลือกทาง ธรรมชาติ และอาศัยพื้นฐานความคิดทางพันธุกรรมในการถ่ายทอดลักษณะต่างๆ ไปยังรุ่นถัดไป ที่ สามารถนํามาพัฒนาใช้ในการหาคําตอบที่เหมาะสมที่สุดของแต่ละปัญหา จีเนติก อัลกอริทึ่มเป็นวิธีการหาคําตอบโดยการพิจารณา และดําเนินการจากกลุ่มของคําตอบของ ปัญหาที่ถูกสร้างขึ้นมาโดยการเข้ารหัส คือการแปลงค่าตัวแปรหรือพารามิเตอร์ (Parameters) ของปัญหา ให้อยู่ในรูปโครงสร้างของโครโมโซม (Cromosomes) ที่กําหนด เพื่อคัดเลือกโครโมโซมคําตอบที่ เหมาะสมสําหรับสร้างวิวัฒนาการของคําตอบให้ดีขึ้นตามกระบวนการทางพันธุศาสตร์ โดยการแลกเปลี่ยนค่าพารามิเตอร์ต่างๆ ระหว่างโครโมโซมที่ถูกคัดเลือกอันจะทําให้คําตอบของปัญหาถูก ปรับปรุงให้ดีขึ้น จีเนติก อัลกอริทึ่มใช้ขั้นตอนหลักๆ 3 กระบวนการในการหาคําตอบที่ใกล้เคียงหรือดีที่สุด ของปัญหาดังนี้

4.1. การคัดเลือก (Selection) : คัดเลือกอันที่ดีที่สุดซึ่งจริงๆแล้วถ้าผ่านขั้นตอนต่อไปอาจจะเป็นค่าที่ใช้ไม่ได้ก็ได้

4.2. การสับเปลี่ยนค่าโครโมโซม (Crossover) : ค่าจากขั้นตอนที่ 1. มาสับเปลี่ยน bit เพื่อประเมินแล้วเลือก

4.3. การกลายพันธุ์ (Mutation) : ค่าจากขั้นตอนที่ 3. นำมากลับ Bit จาก 0 เป็น 1 เพื่อประเมินแล้วกลับไปขั้นตอนที่ 1. อีกครั้ง *

* ศึกษารายละเอียดเพิ่มเติมหาอ่านได้จากหนังสือ Artificial Intelligence ซึ่งทุกเล่มจะพูดถึงจีเนติก อัลกอริทึ่ม (Genetic Algorithms)
ถึงแม้ว่าในปัจจุบันจีเนติก อัลกอริทึ่ม ยังเป็นวิธีการที่ไม่ได้แพร่หลายนัก แต่สาขาวิชาทางด้าน จีเนติก อัลกอริทึ่มก็นับว่าเป็นอีกสาขาวิชาหนึ่งที่สนใจและน่าจะเป็นวิธีที่ได้รับความนิยมในอีกไม่กี่ปี ข้างหน้า เนื่องมาจากสามารถนํามาประยุกต์ใช้ได้กับหลายๆ ปัญหารวมทั้งปัญหาทางเดต้าไมนิ่งอีกด้วย

สรุป

เดต้าไมนิ่งคือการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถูก ซ่อนไว้ภายในข้อมูลจํานวนมาก โดยเดต้าไมนิ่งจะเหมาะสมกับการ แก้ปัญหาบางชนิดเท่านั้น เช่น ปัญหาที่ต้องใช้เหตุผลในการแก้ หรือปัญหาที่เกี่ยวข้องกับเศรษฐศาสตร์ และการเงิน เป็นต้น เดต้าไมนิ่งมีเทคนิคต่าง ๆ ที่ใช้ในการแก้ปัญหาอยู่หลายเทคนิค ซึ่งจะไม่มีเทคนิคใดเลยที่ สามารถแก้ปัญหาของเดต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคเป็นสิ่งที่จําเป็นที่จะนําไปสู่วิธีการแก้ปัญหาที่ดีที่สุด ของเดต้าไมนิ่ง



เขียนโดย : จักรกฤษณ์ แร่ทอง

jakravut
08 Jan 2005 , 03:09 PM
อยากจ้างทำ data mining ซึ่ง อาจารย์กำลังสอน และให้ทำรายงานส่ง (โปรเจคของแต่ละคน)

ที
29 Jan 2005 , 12:26 PM
ผมต้องการเนื้อหาข้อมูลตรงนี้เรื่อง Data mining วิธีการทำงานของโปรแกรมเพื่อนทำรายงานครับช่วยกรุณาตอบข้อมูลดังกล่าวผมด้วยครับว

yaowaret jantakat
16 May 2005 , 10:34 AM
I am interesting about datamining because i would like to research it. So, I want to find Webbroad for datamining discussion.Can you suggest me about Web of datamining?

aiw
29 Jul 2005 , 05:11 PM
ไม่ทราบพอจะบอกเนื้อหาของ นิวรอนเน็ตเวิร์ก ( Neuron Network )ได้มั้ยค่ะ หรือบอกข้อมูลที่จะสามารถได้เนื้อหาของ นิวรอนเน็ตเวิร์ก ( Neuron Network ) กรุณาตอบด้วยนะค่ะ ขอร้อง

khonglai
11 Sep 2005 , 12:28 PM
มีตัวอย่างการใช้จีเนติกอัลกอรืทึมมาใช้ในการสืบค้นเอกสารไม๊คะ..อยากรู้วิธีการมากๆๆเลยค่ะ

ชุลีพร สีนอเพีย
24 ม.ค. 2549 , 01:03 PM
ดิฉันได้ทำสัมนาเกี่ยวกับ web web mining for web personalization ตอนนี้กำลังหาข้อมูล เเละงานวิจัยที่เกี่ยวข้อง จึงขอรบกวนให้ช่วยเเนะนำข้อมูลที่เกี่ยวข้องให้ด้วยนะคะ

R
24 ก.พ. 2549 , 08:39 PM
อยากทำโปรเจค(โปรเจค ปี4 ค่ะ)เกี่ยวกับ data mining ค่ะ ควรศึกษาเรื่องอะไรดีค่ะที่น่าสนใจ เป็นที่สนใจของคนส่วนใหญ่ ช่วยแนะนำหน่อยนะค่ะ

อัญ
06 ก.ค. 2549 , 02:01 PM
อยากทราบว่า Data mining คืออะไร มีลักษณะอย่างไร การทำงานภาพรวมมีลักษณะอย่างไรและแตกต่างจากData warehouse อย่างไร

suwatchai
07 ก.ย. 2549 , 06:12 PM
อยากทราบว่าจะใช้จีเนติก อัลกอริทึ่ม ( Genetic Algorithms : GA )จำแนกเสียงได้หรือไม่ ถ้าทำได้ช่วยให้ข้อมูลด้วย suwatchai1210@hotmail.com

a
21 พ.ค. 2550 , 08:16 AM
Data Warehouse กับ Data Mining ต่างกันอย่างไร? บางคนเก็บข้อมูลไว้เต็มเลย เช่น อาจจะมีข้อมูลลูกค้ากว่า 80 กิกะไบต์ แต่ใช้ไม่เป็นเลย เวลาจะหาลูกค้ารายหนึ่งต้องวิ่ง Search ไปเป็นชั่วโมงยังหาไม่เจอเลย อย่างนี้เท่ากับคุณมีโกดังเก็บข้อมูลเต็มไปหมด แต่คุณไม่รู้จักร่อนข้อมูลให้เป็น คุณจะต้องมีซอฟต์แวร์เพื่อที่จะร่อนข้อมูลที่ต้องการออกมา นั่นคือ Data Mining ยกตัวอย่าง การจะเก็บข้อมูลของประชากรที่เลี้ยงสุนัข เพื่อขายอาหารสุนัข ซึ่งแน่นอนว่า ประชากรทั้ง 60 ล้าน คงไม่เลี้ยงสุนัขกันทุกคน คุณรู้ว่ากลุ่มเป้าหมายมีอยู่กลุ่มเดียว ฐานข้อมูลพวกนี้คุณสามารถเก็บได้จากเจ้าของสุนัข ซึ่งอนาคตได้ข่าวว่า จะมีการขึ้นทะเบียน ถ้ามีทะเบียนขึ้นมาตรงนี้คุณพอจะรู้เลย และสามารถเอาฐานข้อมูลตรงนั้นมาทำตลาดได้ แล้วถ้าคุณสามารถเอาสินค้าที่ขายผ่านช่องทางการจัดจำหน่ายตัวนั้นออกไป ให้ลูกค้ากรอกข้อมูลกลับมา โดยมีสิ่งตอบแทนที่เขาอุตส่าห์เสียเวลาเขียนข้อมูลให้คุณ เช่น หมาพันธุ์อะไร อายุเท่าไร? กินอาหารอะไร? ซึ่งตรงนี้จะเป็นข้อมูลที่คุณสามารถใช้ประโยชน์ในการทำ Data Mining ในอนาคต การทำความรู้จักกับผู้บริโภคของคุณนั้น คุณจะต้องมียุทธศาสตร์ทางด้านการตลาดที่แข็งแกร่ง คุณจะต้องทราบว่า ผู้บริโภคอยู่ตรงไหน? แล้วก็จะต้องมีข้อมูลทางด้านจิตวิทยา และทางด้านสำมะโนประชากร (Demographic) ว่า เป็นอย่างไร? ในขณะที่ฝ่ายบริหารการตลาดทุกวันนี้ ส่วนมากจะทำการตลาดแบบง่ายๆ ก็คือ ลดราคา ลดต้นทุนการผลิต เพราะฉะนั้น คุณจะต้องทำอย่างไร? บางแห่งก็บอกว่า ต้นทุนของการหาลูกค้าใหม่อยู่ที่ประมาณ 6-10 เท่าตัวมากกว่าต้นทุนของการรักษาลูกค้าเก่า เพราะฉะนั้น ถ้าคุณกำลังรับผิดชอบงานทางด้านการตลาดอยู่ โดยที่คุณมีลูกค้าอยู่จำนวนหนึ่ง ถ้าคุณไปหาลูกค้าใหม่อีก 10,000 คน แล้วคุณเสียลูกค้าเก่าอีก 5,000 คน หรือเผลอๆ คุณได้ลูกค้าใหม่ 10,000 คน แต่คุณเสียลูกค้าเก่าไป 30,000 คน ถามว่า คุ้มกันไหม? เพราะฉะนั้น ที่กล่าวว่า ต้นทุนของการหาลูกค้าใหม่แพงกว่าต้นทุนของการรักษาลูกค้าเก่า ประมาณ 6-10 เท่าตัว วิธีการ คือ ทำอย่างไรจึงจะสามารถรักษาลูกค้าเก่ามากที่สุด แล้วเอาชนะใจเขา แล้วให้เขาซื้อสินค้าเรามากขึ้น นั่นคือวิธีที่เราต้องการ คุณจำเป็นที่จะต้องสร้างความจงรักภักดีให้เกิดกับลูกค้าของคุณ และความจงรักภักดีของลูกค้าต่อคุณนั้น คือ สิ่งที่คุณปฏิบัติต่อลูกค้าคุณ เกี่ยวกับเรื่องสินค้าคุณอย่างคงเส้นคงวาครับ! นอกจากนี้ เรายังต้องพัฒนาและให้ความรู้แก่ผู้บริโภคของเราด้วย เราต้องการผู้บริโภคที่ฉลาดตามเรา หรือไม่แน่อาจจะฉลาดกว่าเรา เราต้องบอกเขาว่า เราต้องการอยากจะรู้ว่าเขาเป็นอย่างไร? อยากจะให้เขาได้มีโอกาสสัมผัสสินค้าหรือบริการของเรา ฉะนั้น เราจะต้องมีข้อมูลเกี่ยวกับผู้บริโภคมากที่สุดเท่าที่จะมากได้ กับจะต้องสร้างลูกค้าที่มีคุณค่าตลอดชีวิตขึ้นมา (Customer Lifetime Value) เพราะเราต้องการให้ลูกค้าอยู่กับเราตลอดชีวิต มมตินะครับ ถ้าคุณทำให้คนที่ดื่มโค้กไม่พอใจคุณ ถ้าเขาอายุแค่ 15 ปี แล้วคาดว่าเขาจะตายตอนอายุ 75 ปี ตกลงเขามีโอกาสบริโภคโค้ก 60 ปี ถ้าคุณทำให้คนนี้ไม่พอใจโค้กขึ้นมา แล้วเขาดื่มวันละ 2 กระป๋อง ตกลงคุณสูญเสียค่าโอกาสไม่ใช่ 13 บาทหรือ 1 กระป๋อง แต่คุณจะเสียโอกาสทั้งหมดกว่า 5 แสนบาท คิดจากมูลค่า ณ ปัจจุบันนะครับ โดยการคำนวณจากการบริโภคโค้กกระป๋องละ 13 บาท วันละ 2 กระป๋อง คูณด้วยจำนวน 365 วัน คูณด้วย 60 ปี ตามสูตรดังนี้ 13x2x365x60 ปี ข้อสำคัญ คุณต้องตระหนักด้วยนะครับว่า ใครจะมาเป็นพนักงานขายให้กับสินค้าของคุณได้ดีที่สุดเท่ากับลูกค้าของคุณ นี่จึงเป็นที่มาของธุรกิจใหม่ในรอบ 10 ปี 15 ปีที่ผ่านมา จะเห็นได้จากธุรกิจขายตรงอย่างแอมเวย์ที่ใช้กลยุทธ์แบบนี้ คือ ถ้าผมขายสินค้าให้คุณใช้ แล้วคุณใช้ผลิตภัณฑ์ของผมแล้วคุณชอบ ทำไมคุณไม่แนะนำเพื่อนของคุณอีก 10 คนให้ใช้ล่ะ คุณก็จะได้รับส่วนลดด้วย คุณได้กำไรด้วย เผลอๆ เท่ากับได้ใช้ฟรี หรือเผลอๆ คุณจะได้กำไรอีกด้วย วิธีที่ดีที่สุดในการสร้างความสัมพันธ์ลูกค้า ก็คือ เมื่อคุณสร้างความสัมพันธ์กับลูกค้า สร้างพวกเขาจนทำให้เขากลายเป็นพนักงานขายของคุณแล้ว และเป็นคนแนะนำให้คนมาซื้อสินค้าคุณ นั่นเป็นวิธีที่ดีที่สุด คุณต้องสร้างฐานลูกค้า (Customer Base) โดยการพยายามที่จะเข้าถึงลูกค้าในทุกจุดที่สามารถติดต่อกับลูกค้าได้ ไม่ว่าจะเป็น Call Center, หรือการบริการหลังการขาย หรือแผนกบัญชี ถ้าคุณสามารถเก็บข้อมูลนั้นแล้วสร้างฐานข้อมูล ขึ้นมา คุณก็จะมีโอกาสเติบโต มีโอกาสที่จะเก็บลูกค้ากลุ่มนั้นๆ ให้อยู่กับคุณนานที่สุดและขณะเดียวกัน ก็มีลูกค้าเพิ่มขึ้น ลูกค้าที่จะนำผลกำไร (Profitable Customer) มาให้คุณในที่สุด

tee
31 พ.ค. 2550 , 05:31 PM
ต้องการทำเว็ปที่เอาไว้เก็บเอกสารโดยจะเก็บเอกสารเป็นหมวดหมู่ แต่ตอนsaveแต่ละเอกสาร ต้องให้มันรู้เองว่ามันจะต้องไปอยู่ในหมวดหมู่ไหน(ต้องใช้ AI) อยากทราบว่าจะมีวิธีการทำอย่างไรบ้างค่ะ หรือต้องเริ่มจากตรงไหนก่อนค่ะ ช่วยแนะนำหน่อยค่ะ ขอบคุณค่ะ tateekung@hotmail.com

เล็ก
02 มิ.ย. 2550 , 03:20 PM
หาก คุณมี ข้อสงสัย เรื่อง data mining แต่ก่อนอื่นคุณควรรู้พื้น ฐาน มาคราวๆ ก่อน นะ และเมื่อรู้แล้ว ยังไม่เข้าใจ เช่น ถ้า มีข้อมูลแบบ นี้ จะทำ data mining ได้หรือ ไม่ ? จะเลือกวิธีไหน ในการ ทำ data mining ? data mining เหมาะ กับ อะไร ? ถ้า อยากจะพัฒนา data mining Softwre ขึ้นใช้เอง หรือ ใน องค์ กร มี คำตอบให้คุณที่ software.en@gmail.com

luxifer
14 ก.ค. 2550 , 03:23 PM
ขอขอมูลของเกี่ยวกับอัลกอริทึ่มหน่อยสิครับการวิเคราะห์ขั้นจตอนการทำงานความหมายการทำงานเกี่ยวกับอัลกอริทึ่มสูตรต่างๆ

ถึงอิ๊บ
17 มิ.ย. 2551 , 01:58 AM
ถามมาอย่างงี้ใครเข้าจะส่งให้ครับ ไม่มีความรู้พื้นฐานเลย ถามอย่างเดียวคงมีคนตอบให้คุณหรอกครับ

ppp
29 ก.ค. 2551 , 09:14 AM
อยากจะทำโปรเจคจบเกี่ยวกับ data mining ซึ่งในขณะนี้มีข้อมูลของเกษตรกรในหนึ่งอำเภอ (เช่น รายชื่อเกษตรกร ชนิดพืชที่ปลูก ผลผลิต เป็นต้น) อยากจะขอแนะนำว่าควรจะทำ data mining ข้อมูลเหล่านี้ด้านใดและใช้ทฤษฎีใด

por
10 ธ.ค. 2554 , 04:09 PM
กำลังทำโปรเจคจบ คล้ายกับ คุณ ppp แต่หนูใช้นิวรอลเน็ต ตอนนี้ติดปัญหาที่สุ่มค่าน้ำหนักเริ่มต้น และค่าไบแอส ค่ะ และนำไปเขียนโปรแกรม รบกวนช่วยแนะนำด้วยนะคะ
1

ความคิดเห็น/แนะนำ/ติชม/อื่นๆ เกี่ยวกับบทความนี้
ชื่อของคุณ  : *     อีเมล : *    
ความคิดเห็น : *    
      อีเมลล์จะไม่ถูกเปิดเผย (นโยบายข้อมูลส่วนบุคคล)

Copyright © 2002 - 2017 by www.NEXTPROJECT.net All rights reserved. Policy